首頁>>廠商>>語音識別與合成>>基立訊

jTalk語音總機(jī)和語音撥號完成超大容量詞匯識別率測試

2010/05/14

背景

  長期以來,關(guān)于語音識別準(zhǔn)確率這一硬性技術(shù)指標(biāo),業(yè)界給客戶的感覺總是支支吾吾,模棱兩可。很多語音技術(shù)供應(yīng)商在這項指標(biāo)上要么標(biāo)榜達(dá)到96%甚至98%的識別準(zhǔn)確率,但實際部署的系統(tǒng)遠(yuǎn)遠(yuǎn)達(dá)不到這個指標(biāo)或者這個指標(biāo)只是針對碼本非常小的系統(tǒng)(數(shù)百個碼本容量)而言。這種狀況很容易造成用戶對目前語音識別技術(shù)的誤解。特別是,現(xiàn)實情況中,有很多的語音技術(shù)供應(yīng)商由于本身技術(shù)的不過硬,造成實際部署的系統(tǒng)語音識別準(zhǔn)確率較低,難以令用戶滿意,間接對該技術(shù)的推廣造成了負(fù)面影響。

  正是針對這種情況,也本著對客戶負(fù)責(zé)的理念,上;⒂嵭畔⒖萍加邢薰揪慕M織實施了對這一指標(biāo)的實際測試。為了體現(xiàn)測試結(jié)果的可信性、實用性,基立訊對碼本容量、測試數(shù)據(jù)、測試人樣本等等因素進(jìn)行了綜合考慮。實際測試系統(tǒng)在碼本容量的設(shè)置上全部超過6000條記錄;在測試數(shù)據(jù)的選擇上采用從互聯(lián)網(wǎng)隨機(jī)下載真實姓名以反映真實的用戶數(shù)據(jù);在測試人樣本上盡量考慮不同地域、不同性別和不同年齡的測試人,測試人樣本覆蓋全國絕大部分省市口音的男、女人員,同時測試人年齡限制在18-55歲的群體以反映語音識別技術(shù)最廣泛的目標(biāo)用戶群。

  值得一提的是,測試數(shù)據(jù)中有非常多的姓名要么極其相近、要么發(fā)音即使真人都很難區(qū)分,是非常具有挑戰(zhàn)性的測試數(shù)據(jù)。但即使這樣,jTalk語音總機(jī)和語音撥號系統(tǒng)在采用先進(jìn)的語音采集和處理方法和獨特的N-Best結(jié)果分析處理算法后,不但有效提高了系統(tǒng)總體使用的語音識別準(zhǔn)確率,同時也增加了系統(tǒng)不用多選直接得到識別結(jié)果的概率,也降低了碼本外詞匯的誤識別率,使jTalk語音總機(jī)和語音撥號系統(tǒng)用戶使用總體感受非常準(zhǔn)確又很方便。

測試結(jié)果

  經(jīng)過上百例的實際測試,基立訊jTalk語音總機(jī)和語音撥號系統(tǒng)得到的一次語音識別準(zhǔn)確率平均在93%左右,二次語音識別準(zhǔn)確率平均超過97%。也就是說,對于碼本在1萬個的情況下,用戶在說了一次姓名后,系統(tǒng)返回的結(jié)果中包含正確結(jié)果的概率約為93%,但如果用戶是說了2遍,那么用戶有97%以上的可能性會得到系統(tǒng)正確的識別結(jié)果響應(yīng)。其實,根據(jù)測試,對很多白領(lǐng)而言,只有1%稍多一點的姓名是用戶在2次呼叫后都無法得到正確返回結(jié)果的,也就是說,對絕大多數(shù)的潛在白領(lǐng)語音識別用戶,2次呼叫之內(nèi)達(dá)到98%以上的識別結(jié)果準(zhǔn)確率是完全現(xiàn)實的?紤]到測試人樣本中不乏有濃重口音的人,這樣的數(shù)據(jù)非常令人鼓舞。此外,這次測試也對系統(tǒng)一次識別不用N-Best選擇就返回正確結(jié)果的概率等其他參數(shù)進(jìn)行了統(tǒng)計,得到了非常寶貴的權(quán)威數(shù)據(jù)。需要指出的是,如果運用jTalk語音總機(jī)和語音撥號平臺已經(jīng)集成的組合呼叫識別功能(例如,部門名+姓名,部門名+昵稱名等等),那么在2次呼叫內(nèi)系統(tǒng)有接近100%的概率返回用戶所呼叫的信息,這樣的測試結(jié)果完全說明基立訊語音識別產(chǎn)品在技術(shù)和應(yīng)用上都處于國內(nèi)領(lǐng)先,完全可以達(dá)到大規(guī)模商業(yè)應(yīng)用的要求。

  基立訊jTalk語音總機(jī)和語音撥號系統(tǒng)除了具有業(yè)界最高的識別準(zhǔn)確率外,還無縫集成了電話防火墻、來電轉(zhuǎn)接、留言信箱、號碼綁定、事件提醒、114按鍵樹型自動查號臺、號碼本管理、語音提示上載、節(jié)假日語音流程設(shè)置等等眾多實用功能,是企業(yè)電話通信的一站式解決方案。

  通過這次權(quán)威的實際測試,基立訊得到了語音識別系統(tǒng)真實的識別率數(shù)據(jù),是目前國內(nèi)業(yè)界見到的公開的最權(quán)威也是最高的實際部署系統(tǒng)的識別準(zhǔn)確率。

CTI論壇編輯



相關(guān)閱讀:
基立訊Jcc呼叫中心方案集成語音識別和語音合成 2010-04-09
基立訊jTalk語音通信平臺 2010-04-02
上;⒂嵧瞥龊艚兄行钠脚_軟件jcc V1.0 2010-03-31
基立訊Jcc呼叫中心軟件應(yīng)用于遼寧交通“96155” 2010-03-30
基立訊jTalk語音識別總機(jī)和撥號系統(tǒng)應(yīng)用浦發(fā)銀行 2010-03-29

分類信息:  企業(yè)通信_與_語音應(yīng)用  企業(yè)通信_與_企業(yè)  企業(yè)通信_與_企業(yè)