首頁>>廠商>>語音識別與合成>>科大訊飛

訊飛語音讓MP3開口說話

2009/04/30

  CTI論壇(ctiforum)04月30日消息: 通過語音技術徹底改變用戶和音樂播放器之間的互動方式,讓MP3“開口說話”,這既是使用者的應用需求熱點,也是各MP3 廠商焦點關注的產品發(fā)展趨勢。日前,蘋果公司發(fā)布了新一代便攜音樂播放產品iPod shuffle 3,其最大亮點就是搭載了VoiceOver語音交流功能,實現(xiàn)了“開口說話”。當然,這并非蘋果的“獨門絕技”。基于科大訊飛公司國際領先的智能語音技術,可以使MP3\MP4\PMP類產品輕松具有比iPod shuffle 3更為強大的語音功能,科大訊飛正在與眾多產品廠商開展此方面的合作。

  MP3能夠開口說話,對于消費者而言,可以用“聽”代替“看”獲取信息,例如你在聽一首歌,想知道歌曲的名稱和表演者的名字,只要輕輕按一下按鍵,VoiceOver 就會告訴你相關信息,并且不會打斷正在播放的音樂。此外,與語音技術的結合也使找到所要的音樂更加方便快捷,特別是在運動、走路等情況下,不需要轉移注意力就可以輕松找到想要聽的音樂。對于開發(fā)廠商而言,機器上可以省去顯示屏,節(jié)約了成本,同時機型可以更小、更輕便與精美,電池使用時間也會大大提升。

  對于會說話的MP3,國內MP3開發(fā)廠商無需艷羨,應用訊飛語音技術完全可以輕松實現(xiàn),并實現(xiàn)效果、功能的優(yōu)化與超越,為產品賦予吸引消費者眼球的亮點、賣點。語音合成技術,簡稱TTS(Text To Speech)技術,該技術解決了如何將文字信息轉化為聲音信息的問題,讓人們獲取信息的方式更加豐富與自然?拼笥嶏w智能語音技術代表了全球最高水平,中文語音合成技術在近年來歷屆國內、國際權威機構的評測中,主要關鍵技術指標均名列第一,2005年在業(yè)界首次超過普通人口語水平(普通人口語自然度得分4.0分,訊飛中文語音合成技術自然度達到4.3分)?拼笥嶏w在英文語音合成方面也取得了穩(wěn)固的國際領先優(yōu)勢,已連續(xù)3年獲得國際英文合成大賽第一名。

  應用了科大訊飛語音合成技術的MP3除了歌曲歌手名稱播報之外,還可以進行當前狀態(tài)播報,獲取當前電池電量、時間或錄音時間等信息。例如,當沉醉于音樂而不知道具體時間的時候,只要輕松按鍵,音樂播放器就會自如的告訴你,這些操作均不會打斷正在播放的音樂。此外,與訊飛語音技術的結合還大大拓展了MP3的應用功能,用戶可以下載各類書籍、新聞、信息存儲到MP3中,利用語音功能“變看為聽”,使MP3不僅是音樂播放器,更成為以“聽”的方式獲取更多娛樂和信息的綜合性產品。

  經(jīng)過10年的技術積累,科大訊飛已推出了從大型電信級應用到小型嵌入式應用,從電信、金融等行業(yè)到企業(yè)和家庭用戶,從PC到手機到MP3/MP4/PMP和玩具,能夠滿足不同應用環(huán)境的多種產品,為千百萬用戶帶來了無限驚喜,享受到了語音技術的獨特魅力與重大應用價值。

  借助科大訊飛智能語音技術,使讓國內廠商的MP3開口說話,以至實現(xiàn)完整的人機語音互動、全面超越iPod shuffle 3成為一種可能。強大的語音功能,將使得MP3的使用價值得到巨大提升,成為新一代MP3的最大亮點與賣點!皶f話”MP3 將徹底改變消費者瀏覽與欣賞音樂的方式,進一步加強消費者與音樂之間的互動,從而給消費者帶來更便捷、更時尚的新潮體驗。

CTI論壇報道