為了助力號碼百事通業(yè)務,科大訊飛公司除推出為號碼百事通進行專門優(yōu)化提升的重量級語音合成技術(shù)產(chǎn)品Interphonic 4.0 114專業(yè)版之外,科大訊飛的語音技術(shù)專家們同時也在積極探索如何通過自然語音來獲得用戶所需的信息和服務,并顯著提升語音信息服務的自動化程度。
通過與全球領先的語音識別技術(shù)提供商Nuance公司長期以來的戰(zhàn)略合作,科大訊飛能夠?qū)I(yè)界最領先、最成熟的電話語音識別技術(shù)成功應用于豐富多彩的電信增值業(yè)務,提供人性化的語音交互界面,提升語音信息查詢效率和降低運營成本,打造完善的自動語音服務應用。
針對語音識別技術(shù)應用于號碼百事通業(yè)務面臨的現(xiàn)實挑戰(zhàn),如呼叫量大、口語化、信息內(nèi)容龐雜以及語音信道和用戶使用環(huán)境復雜等等,科大訊飛與合作伙伴共同打造完善的解決方案。該解決方案能夠不斷增強用戶體驗,提升語音信息服務的自動化率。
Nuance業(yè)界領先的電話語音識別產(chǎn)品Nuance8.x在全球市場(包括中國)的市場占有率遙遙領先。具備業(yè)界最高的識別能力、支持大詞匯量語法,并提供用戶語音打斷識別、多關(guān)鍵字語法、返回符合條件的結(jié)果集合(N-Best)、隨意說(Say Anything)等眾多有助于改善應用效果的先進特性?拼笥嶏w與Nuance強強合作,推動本地化應用的深化。針對中國地域性語言差異,科大訊飛·Nuance聯(lián)合實驗室積極開展對地方口音主動適應性優(yōu)化工作,包含地域性語言模型的適應性訓練和語法的編寫規(guī)則制訂及優(yōu)化等。
在系統(tǒng)設計階段,根據(jù)項目目標,應對語音識別應用方案進行全面細致的規(guī)劃;谏詈竦恼Z音應用經(jīng)驗積累,通過詳細分析項目需求,科大訊飛和Nuance能夠提出合理的系統(tǒng)配置方案和系統(tǒng)架構(gòu)設計建議,并且根據(jù)語音應用具體業(yè)務、應用規(guī)模及發(fā)展要求,對語法集進行合理規(guī)劃設計。在這個階段,科大訊飛還注重加強對合作伙伴的培訓指導和溝通交流,確保語音識別的各項關(guān)鍵技術(shù)能夠被正確合理地集成,從系統(tǒng)設計階段就在影響語音應用的關(guān)鍵因素上努力保障應用效果。
在系統(tǒng)開發(fā)階段,科大訊飛積極配合合作伙伴進行系統(tǒng)開發(fā)工作,一方面提供語音識別語法設計、語法編寫和語法校驗方案,另一方面向號碼百事通業(yè)務開發(fā)人員提供語音用戶界面(VUI)開發(fā)建議,確保后續(xù)在系統(tǒng)使用過程中,在提供豐富便捷的人性化界面的同時,合理引導用戶正確合理的使用語音識別系統(tǒng),使得語音識別系統(tǒng)達到預期的應用效果。
考慮到后續(xù)的優(yōu)化將需要大量的用戶語音數(shù)據(jù),科大訊飛還搭建起一個語音識別試驗系統(tǒng),提供測試號碼,面向事先設計好的測試用戶群(符合系統(tǒng)發(fā)布時面向的用戶群分布規(guī)律),提供試驗性語音應用服務,搜集足夠的語料。
接下來,在系統(tǒng)測試和優(yōu)化階段,科大訊飛與Nuance一起,借助科大訊飛·Nuance聯(lián)合實驗室的研發(fā)力量,以及大量的專業(yè)數(shù)據(jù)人才和專業(yè)語音優(yōu)化工程師的努力,為號碼百事通提供全面的系統(tǒng)優(yōu)化服務。
第一,科大訊飛將根據(jù)試驗平臺搜集的語音數(shù)據(jù),對語音識別系統(tǒng)的識別模型進行當?shù)氐目谝暨m應性訓練,使當前針對標準普通話的識別模型更加適應當?shù)乜谝,提高系統(tǒng)的識別率。同時整理用戶的語言組織方式,并且反饋到語法中,使語法盡可能的覆蓋更多的用戶說法,從語法層繼續(xù)提高系統(tǒng)的識別率。
第二,針對現(xiàn)有業(yè)務中出現(xiàn)的涉及到字母識別的問題,由于具有明顯地方口音特點,在進行專業(yè)分析的基礎上,提供符合當?shù)乜谝舻挠⑽淖帜赴l(fā)音詞典,確保字母識別效果。
第三,科大訊飛將利用真實用戶語音數(shù)據(jù)對語法集合進行測試,分析當?shù)乜谝籼攸c,保障語音業(yè)務所面向區(qū)域的一些常見特色發(fā)音能夠被語音識別系統(tǒng)正確處理?拼笥嶏w與Nuance提供了較為完備的模糊音解決方案,能夠針對語音進行分析,提交出當?shù)匾族e音對應表,提高系統(tǒng)識別的準確率。
第四,語音識別應用中,置信度(認定語音被正確識別的門限)的合理設置是一個非常重要的問題。置信度設置過高,會將一些正確識別的結(jié)果屏蔽掉,置信度設置過低,會使一些錯誤結(jié)果被認定正確。如何權(quán)衡這兩點對最終的識別效果影響很大?拼笥嶏w通過分析系統(tǒng)數(shù)據(jù),提供合理的置信度設置方案,并向系統(tǒng)集成商提出置信度業(yè)務層解決方案的方式,既保證大多數(shù)用戶的操作的簡化,也同時通過增加如按鍵確認或者語音確認的流程,完善保障流程,確保少數(shù)口音較重或者發(fā)音不標準的用戶的語音被正確識別。
最后,科大訊飛與Nuance還將利用其豐富的語音用戶界面設計經(jīng)驗和豐富的用戶體驗資源,對號碼百事通業(yè)務部門提出的設計方案進行優(yōu)化,使得友好性和有效性能夠得到合理平衡,從而確保完整的用戶體驗和優(yōu)秀的語音識別效果。
科大訊飛公司供稿 CTI論壇編輯