首頁>>>技術(shù)>>>語音應(yīng)用>>>語音識別(ASR)  語音識別產(chǎn)品

芝麻開門——語音識別控制技術(shù)商機(jī)乍現(xiàn)

2006/05/08

  語音識別控制技術(shù)進(jìn)入實用階段,給終端設(shè)備制造商和方案商帶來無限商機(jī)。

  看過《哈里波特和火焰杯》電影的人,印象最深刻的往往是片中記者采訪時的那支智能的“筆”,其可以根據(jù)指令完成記錄、修改、刪除等操作。盡管這部科幻類的影片有很大的幻想成分,但是現(xiàn)實生活中的語音識別技術(shù)正在日益完善,目前已進(jìn)入實際應(yīng)用階段!熬觿涌诓粍邮帧睍r代的來臨,將改變?nèi)藗兊纳罘绞胶蜕钯|(zhì)量,并給終端設(shè)備制造商和方案商帶來無限商機(jī)。

市場應(yīng)用前景廣闊

  語音識別控制技術(shù)可以幫助終端設(shè)備制造商生產(chǎn)出具有新操控方式的產(chǎn)品。讓使用者不再局限于傳統(tǒng)的手工操作,只要說出命令就可以控制電腦、手機(jī)等的運(yùn)行。這就意味著,當(dāng)人們在手不方便操作時,可以通過說話完成自己想做的事。這種方式亦將幫助盲人、無手殘疾人操作電腦和掌上設(shè)備。終端設(shè)備廠商通過采用語音識別控制技術(shù),將能進(jìn)一步擴(kuò)大其用戶群體。

推動電腦用戶群體增加

  無論是國內(nèi)市場還是國際市場,目前都還有很多無法掌握電腦復(fù)雜操作步驟的客戶。

  盡管微軟的視窗系統(tǒng)已經(jīng)大大降低了電腦的操作難度(相對原來的命令式操作來講),但是對于沒有接觸過電腦的人來講,電腦操作依然存在很大難度。同時,市場上還存在不同的操作系統(tǒng),如Unix、Linux、Mac OS等,它們操作方式不同,更加大了客戶的應(yīng)用難度,阻礙了客戶群體和市場規(guī)模的擴(kuò)大。

  語音就不同了,這種操作控制模式具有應(yīng)用的便捷性和一致性,不受以上所提弊端的限制。使用語音識別控制技術(shù),將有效擴(kuò)大電腦的應(yīng)用范圍,并推動用戶客戶群體的增加。
簡化移動商務(wù)應(yīng)用的復(fù)雜度

  看過中國移動的周杰倫之食指廣告片的人一定對片中的場景印象深刻——很多人由于長時間輸入短信造成手指習(xí)慣性抖動、神經(jīng)無法控制。片中醫(yī)院里長長的兩排病人揭示了隨著現(xiàn)代人大量使用短信息交流,將產(chǎn)生短信輸入后遺癥。語音識別技術(shù)可以幫助人們從這種落后的輸入方式解脫出來,并簡化移動商務(wù)應(yīng)用的復(fù)雜程度。

  人們在需要聯(lián)系客戶、朋友的時候,需要在上百條通訊錄里查找號碼,即耗時又費(fèi)力。應(yīng)用語音識別控制技術(shù),說出聯(lián)系人的名字,手機(jī)就能自動調(diào)出該聯(lián)系人的號碼,并能根據(jù)指令進(jìn)行撥號。三星P207、E818等多款手機(jī)目前已經(jīng)采用了語音識別控制技術(shù),并開始了市場推廣。

  語音識別技術(shù)的應(yīng)用將推動IT、手機(jī)產(chǎn)業(yè)的發(fā)展,進(jìn)一步擴(kuò)大IT設(shè)備廠商和通信設(shè)備廠商的用戶群體,為通信產(chǎn)業(yè)的發(fā)展提供新的契機(jī)。

為VOIP推波助瀾

  由于語音識別技術(shù)的成熟,VOIP(Voice over Internet Protocol)網(wǎng)絡(luò)通話服務(wù)目前已經(jīng)成為熱點(diǎn)。費(fèi)用低廉的VOIP也是傳統(tǒng)通信方式的有力競爭對手。VOIP的應(yīng)用1996年就已經(jīng)有一些專業(yè)的計算機(jī)人員在國際通話中應(yīng)用,當(dāng)時還是單工的方式,網(wǎng)速也很慢,通話軟件界面是英文的,語音信號質(zhì)量也沒有保障。今天這項技術(shù)已經(jīng)已經(jīng)克服了上面提到的種種不便,成為設(shè)備經(jīng)銷商和運(yùn)營服務(wù)商爭搶的新“高地”。

  目前,思科公司、Avaya、中興公司、華為公司、上海貝爾等著名的通訊廠商都已經(jīng)涉足此領(lǐng)域。Avaya公司為了占得先機(jī),從本月19日開始的三天在上海、北京、香港三地召開Avaya DevConnect應(yīng)用開發(fā)合作伙伴招募大會。

拓寬門禁系統(tǒng)和數(shù)據(jù)加密的思路

  語音識別技術(shù)亦將給目前的門禁系統(tǒng)應(yīng)用方式打開新的思路。傳統(tǒng)方式需要使用員工身份卡片來開啟公司大門,如果采用語音識別技術(shù)就可以象電影《阿里巴巴和40大盜》那樣,說出口令“芝麻開門”就能打開門禁。通過語音識別控制技術(shù),系統(tǒng)可以根據(jù)每個人不同的音頻特征來識別人員身份,而不是僅僅通過口令,避免了阿里巴巴僅憑“芝麻開門”就打開石門的尷尬。

  在數(shù)據(jù)加密等方面,語音識別技術(shù)有著廣闊的應(yīng)用前景,甚至?xí)^目前應(yīng)用的熱點(diǎn)指紋識別技術(shù)。

數(shù)字家庭里的應(yīng)用

  對數(shù)字家電產(chǎn)品來說,通過語音識別技術(shù),可以做到用語音操作家電。比如語音控制電視的開關(guān)、切換頻道,對空調(diào)、洗衣機(jī)、冰箱、家庭多媒體、燈光等都可以進(jìn)行語音操控。相信下面的場景不久就可以實現(xiàn):當(dāng)人們深夜回到家中,洗漱完畢后,大聲向家庭控制中心發(fā)出指令:“系統(tǒng),請關(guān)閉電燈、TV和防盜門!本涂梢园踩蝗胨。

豐富軟件功能

  在軟件方面,Microsoft的Windows XP中所包含的語音識別功能(與Office XP軟件結(jié)合使用時)能夠?qū)崿F(xiàn)數(shù)據(jù)輸入或文字編輯等領(lǐng)域的基本功能。IBM WebSphere Voice Server語音中間件是 IBM 隨需應(yīng)變的重要組成部分,幫助客戶實現(xiàn)過程的自動化,能夠從任何連接通過 Web 瀏覽器、電話或者移動設(shè)備訪問信息,快速完成交易。IBM為ERP等軟件產(chǎn)品的語音功能提供了技術(shù)保障。相信未來SAP、Oracle、用友、金蝶等ERP廠商在采用此項新技術(shù)后,其軟件功能在語音導(dǎo)航、查詢等方面將有重大突破。尤其是在CRM軟件中,采用語音識別技術(shù)將大大改進(jìn)Call Center的工作方式,減少工作人員數(shù)量和勞動強(qiáng)度。

語音技術(shù)的重大突破

  現(xiàn)在的語音技術(shù)解決了語音識別不夠準(zhǔn)確、在嘈雜環(huán)境中無法應(yīng)用、人員身份無法識別等困擾難題。

  微軟為確保計算機(jī)能夠在辦公場所以外的嘈雜環(huán)境(如汽車或人流較多的餐館內(nèi))中使用語音識別信息技術(shù),在雷蒙德和中國成立研發(fā)團(tuán)隊開展一個稱作Dr. Who的研究項目,旨在解決噪音問題。

  筆者日前參加了由北京中科信利技術(shù)有限公司(中科院聲學(xué)所的科學(xué)研究成果產(chǎn)品化市場化的下屬產(chǎn)業(yè))和美國富迪科技有限公司聯(lián)合發(fā)布的結(jié)盟會議。其語音識別控制技術(shù)已經(jīng)可以免除周邊的回聲和噪音干擾,甚至解決了還在困擾微軟的噪音問題。

  中信科利的人機(jī)互動技術(shù)包括語音輸入處理任務(wù)和音頻內(nèi)容檢索。2005年中信科利通過三家VAR(增值服務(wù)商)將語音技術(shù)應(yīng)用于中國電信、中國網(wǎng)通、中國移動的20個省的語音呼叫服務(wù)上;在嵌入式方面中信科利已經(jīng)和夏新手機(jī)展開合作,并且和手機(jī)設(shè)計商北京中電賽龍通信研究中心、德信無線通訊科技有限公司等展開了深層次的語音輸入處理任務(wù)合作;在語音查詢方面中信科利和華為等通信器材廠商進(jìn)行了支持語音識別技術(shù)的通信設(shè)備開發(fā)合作。中信科利稱,其2006年市場預(yù)期收入將達(dá)到1000萬元,較上年度將有100%的增長。

  國內(nèi)的另一家語音合成技術(shù)企業(yè)安徽中科大訊飛信息科技有限公司,通過和美國Nuance公司的合作,在語音識別技術(shù)市場將和中信科利展開角逐。美國Nuance公司在全球的語音市場占有近一半的份額,憑借其多達(dá)28個語種的語音識別技術(shù)和在美國宇航局太空總署最新研發(fā)的宇宙飛船中的語音控制技術(shù),將有力地推動國內(nèi)語音市場的進(jìn)步。

  相信隨著語音識別控制技術(shù),在計算機(jī)、通信、軟件、家電領(lǐng)域的產(chǎn)品化、市場化,采用這項新技術(shù)的設(shè)備廠商將獲得領(lǐng)先于對手的競爭優(yōu)勢,并得到豐厚的利潤。同時,這項新技術(shù)也將給各種語音識別技術(shù)產(chǎn)品的方案商帶來新的市場機(jī)會和獲利空間。

《電腦商報》



相關(guān)鏈接:
科大訊飛總裁劉慶峰博士喜獲“中國青年五四獎?wù)隆?/a> 2006-05-08
2006科大訊飛·NUANCE語音技術(shù)解決方案巡展 2006-05-08
SSML 1.1啟動會議在北京順利召開 2006-04-28
運(yùn)營商擬推智能語音撥號系統(tǒng) 華為公司提供技術(shù) 2006-04-28
科大訊飛攜手NUANCE引領(lǐng)新一代語音技術(shù)應(yīng)用 2006-04-25

相關(guān)頻道:  語音合成TTS_與_語音識別ASR           文摘   技術(shù)_語音應(yīng)用_新聞   技術(shù)_語音應(yīng)用_新聞