首頁>>廠商>>語音識別與合成>>科大訊飛

移動互聯(lián)網(wǎng)進(jìn)入語音時代:和機(jī)器說話

2010/11/22

  在美國的科幻大片里,一位帥氣的小伙子對著汽車講著即將要到達(dá)的目的地,汽車導(dǎo)航自動搜索定位,汽車的背影瞬間消失在空曠的視野盡頭。10月28日,一款通過“說話”來控制電子產(chǎn)品的“語音云”在京城正式上線。屆時,消費(fèi)者只要動動嘴,就可以輕松自如地控制自家的電腦、手機(jī)、電視等。 “所謂智能語音交互技術(shù),就是讓移動互聯(lián)網(wǎng)的各種設(shè)備和服務(wù)像人一樣,具備‘能說會聽’的功能。如果將它附著在手機(jī)的功能里,就可以通過說話來發(fā)送短信! 安徽科大訊飛信息科技有限公司副總裁江濤告訴記者,我們將人們輸出的語音轉(zhuǎn)換成對應(yīng)的文字和指令,或者將文字轉(zhuǎn)換成語音讀出來,配備在手機(jī)的支配客戶端,人們只要把想說的話說出來,在網(wǎng)速比較穩(wěn)定的情況下,手機(jī)就會乖乖地接收語音信息,近乎同步地將其轉(zhuǎn)化成文字呈現(xiàn)在手機(jī)屏幕上。如果將其配備到電視上,只要在遙控器上安置麥克風(fēng),人們利用聲音下派指令,比如在周末時間和家人想看電影,就對著遙控器的麥克風(fēng)讀出電影《唐山大地震》的名稱,語音云的服務(wù)器會迅速搜尋互聯(lián)網(wǎng)上的相關(guān)信息,找到相關(guān)數(shù)據(jù)源,傳送到電視上供人們觀看。隨后,記者在門戶網(wǎng)上找到了一位曾做過“語音云” 內(nèi)測的網(wǎng)友“靡島”,她所使用的手機(jī)是多普達(dá)智能手機(jī)。

  她介紹說,語音輸入整句話時比較占有優(yōu)勢,準(zhǔn)確率通常能達(dá)到80%~90%左右,連目前網(wǎng)絡(luò)比較流行的網(wǎng)絡(luò)語都可以識別出來。但是,她也指出一些問題。該測試者的普通話測試水平是二級乙,當(dāng)她用語音讀出“好了嗎”等詞語時,語音轉(zhuǎn)化成文字的過程中,就會出現(xiàn)“好了門”等錯誤的識別。對于同音字“哪里”和“那里”的識別也存在一些問題。但是她認(rèn)為輸入速度卻是任何鍵盤都無法超越的。 “目前,這款上線產(chǎn)品只能識別普通話,也會兼容一些不標(biāo)準(zhǔn),攜帶方言口音的普通話,還有待于改善。在使用時,大家只要保持在一個噪音相對較小的環(huán)境中,它的辨識度就會更加穩(wěn)定。”江濤告訴記者,這款新產(chǎn)品只作為移動互聯(lián)網(wǎng)的基礎(chǔ)服務(wù)設(shè)施,并不是以產(chǎn)品的形式銷售給大家,大家可以免費(fèi)下載到智能手機(jī)上,可以用語音來進(jìn)行QQ、微博等更多的信息交流。在江濤看來,語音應(yīng)用是移動互聯(lián)網(wǎng)時代的未來。“不難看出,語音輸出的信息要比手工輸入信息的速度更快,也規(guī)避了輸入法的繁瑣給人們帶來的困擾。同時,它也擴(kuò)大了人們可選擇的信息量。拿電視來說,現(xiàn)在我們只能觀看設(shè)定范圍內(nèi)的節(jié)目。一旦與互聯(lián)網(wǎng)連接,海量的信息將被納入,觀眾就可以選擇更多的視頻節(jié)目來娛樂自己。我覺得智能化語音交互技術(shù)就好像是信息社會修建的新窗戶,不但提高了人機(jī)的對話效率,也利用了更便捷的科技產(chǎn)品來簡化人們信息交流時的繁瑣行為,使其變得更簡單。

北京科技報



相關(guān)閱讀:
科大訊飛暢言網(wǎng)全程助上海世博雙語活動 2010-11-12
智能語音技術(shù)助力教育行業(yè) 高儀展掀起訊飛熱 2010-11-10
962010智能語音服務(wù),響亮世博的184個日子 2010-11-05
訊飛“語音云”開創(chuàng)嶄新市場藍(lán)海 2010-11-01
專訪科大訊飛吳曉如:語音與移動互聯(lián)網(wǎng)共舞 2010-10-29

熱點(diǎn)專題:  語音合成TTS 語音識別ASR    移動增值   移動互聯(lián)網(wǎng)
分類信息:  移動增值_與_移動互聯(lián)網(wǎng)  移動互聯(lián)網(wǎng)_與_移動
相關(guān)頻道:  增值電信文摘