jTalk語音總機(jī)和語音撥號(hào)完成超大容量詞匯識(shí)別率測(cè)試
2010/05/14
背景
長(zhǎng)期以來,關(guān)于語音識(shí)別準(zhǔn)確率這一硬性技術(shù)指標(biāo),業(yè)界給客戶的感覺總是支支吾吾,模棱兩可。很多語音技術(shù)供應(yīng)商在這項(xiàng)指標(biāo)上要么標(biāo)榜達(dá)到96%甚至98%的識(shí)別準(zhǔn)確率,但實(shí)際部署的系統(tǒng)遠(yuǎn)遠(yuǎn)達(dá)不到這個(gè)指標(biāo)或者這個(gè)指標(biāo)只是針對(duì)碼本非常小的系統(tǒng)(數(shù)百個(gè)碼本容量)而言。這種狀況很容易造成用戶對(duì)目前語音識(shí)別技術(shù)的誤解。特別是,現(xiàn)實(shí)情況中,有很多的語音技術(shù)供應(yīng)商由于本身技術(shù)的不過硬,造成實(shí)際部署的系統(tǒng)語音識(shí)別準(zhǔn)確率較低,難以令用戶滿意,間接對(duì)該技術(shù)的推廣造成了負(fù)面影響。
正是針對(duì)這種情況,也本著對(duì)客戶負(fù)責(zé)的理念,上海基立訊信息科技有限公司精心組織實(shí)施了對(duì)這一指標(biāo)的實(shí)際測(cè)試。為了體現(xiàn)測(cè)試結(jié)果的可信性、實(shí)用性,基立訊對(duì)碼本容量、測(cè)試數(shù)據(jù)、測(cè)試人樣本等等因素進(jìn)行了綜合考慮。實(shí)際測(cè)試系統(tǒng)在碼本容量的設(shè)置上全部超過6000條記錄;在測(cè)試數(shù)據(jù)的選擇上采用從互聯(lián)網(wǎng)隨機(jī)下載真實(shí)姓名以反映真實(shí)的用戶數(shù)據(jù);在測(cè)試人樣本上盡量考慮不同地域、不同性別和不同年齡的測(cè)試人,測(cè)試人樣本覆蓋全國絕大部分省市口音的男、女人員,同時(shí)測(cè)試人年齡限制在18-55歲的群體以反映語音識(shí)別技術(shù)最廣泛的目標(biāo)用戶群。
值得一提的是,測(cè)試數(shù)據(jù)中有非常多的姓名要么極其相近、要么發(fā)音即使真人都很難區(qū)分,是非常具有挑戰(zhàn)性的測(cè)試數(shù)據(jù)。但即使這樣,jTalk語音總機(jī)和語音撥號(hào)系統(tǒng)在采用先進(jìn)的語音采集和處理方法和獨(dú)特的N-Best結(jié)果分析處理算法后,不但有效提高了系統(tǒng)總體使用的語音識(shí)別準(zhǔn)確率,同時(shí)也增加了系統(tǒng)不用多選直接得到識(shí)別結(jié)果的概率,也降低了碼本外詞匯的誤識(shí)別率,使jTalk語音總機(jī)和語音撥號(hào)系統(tǒng)用戶使用總體感受非常準(zhǔn)確又很方便。
測(cè)試結(jié)果
經(jīng)過上百例的實(shí)際測(cè)試,基立訊jTalk語音總機(jī)和語音撥號(hào)系統(tǒng)得到的一次語音識(shí)別準(zhǔn)確率平均在93%左右,二次語音識(shí)別準(zhǔn)確率平均超過97%。也就是說,對(duì)于碼本在1萬個(gè)的情況下,用戶在說了一次姓名后,系統(tǒng)返回的結(jié)果中包含正確結(jié)果的概率約為93%,但如果用戶是說了2遍,那么用戶有97%以上的可能性會(huì)得到系統(tǒng)正確的識(shí)別結(jié)果響應(yīng)。其實(shí),根據(jù)測(cè)試,對(duì)很多白領(lǐng)而言,只有1%稍多一點(diǎn)的姓名是用戶在2次呼叫后都無法得到正確返回結(jié)果的,也就是說,對(duì)絕大多數(shù)的潛在白領(lǐng)語音識(shí)別用戶,2次呼叫之內(nèi)達(dá)到98%以上的識(shí)別結(jié)果準(zhǔn)確率是完全現(xiàn)實(shí)的?紤]到測(cè)試人樣本中不乏有濃重口音的人,這樣的數(shù)據(jù)非常令人鼓舞。此外,這次測(cè)試也對(duì)系統(tǒng)一次識(shí)別不用N-Best選擇就返回正確結(jié)果的概率等其他參數(shù)進(jìn)行了統(tǒng)計(jì),得到了非常寶貴的權(quán)威數(shù)據(jù)。需要指出的是,如果運(yùn)用jTalk語音總機(jī)和語音撥號(hào)平臺(tái)已經(jīng)集成的組合呼叫識(shí)別功能(例如,部門名+姓名,部門名+昵稱名等等),那么在2次呼叫內(nèi)系統(tǒng)有接近100%的概率返回用戶所呼叫的信息,這樣的測(cè)試結(jié)果完全說明基立訊語音識(shí)別產(chǎn)品在技術(shù)和應(yīng)用上都處于國內(nèi)領(lǐng)先,完全可以達(dá)到大規(guī)模商業(yè)應(yīng)用的要求。
基立訊jTalk語音總機(jī)和語音撥號(hào)系統(tǒng)除了具有業(yè)界最高的識(shí)別準(zhǔn)確率外,還無縫集成了電話防火墻、來電轉(zhuǎn)接、留言信箱、號(hào)碼綁定、事件提醒、114按鍵樹型自動(dòng)查號(hào)臺(tái)、號(hào)碼本管理、語音提示上載、節(jié)假日語音流程設(shè)置等等眾多實(shí)用功能,是企業(yè)電話通信的一站式解決方案。
通過這次權(quán)威的實(shí)際測(cè)試,基立訊得到了語音識(shí)別系統(tǒng)真實(shí)的識(shí)別率數(shù)據(jù),是目前國內(nèi)業(yè)界見到的公開的最權(quán)威也是最高的實(shí)際部署系統(tǒng)的識(shí)別準(zhǔn)確率。
CTI論壇編輯
相關(guān)閱讀: