在呼叫中心領(lǐng)域,自動語音識別技術(shù)在應(yīng)用方面比起一般PC系統(tǒng)的應(yīng)用來說要更加困難,這主要體現(xiàn)在語音在經(jīng)過壓縮及線路傳輸之后,會有一定程度的失真,而且用戶嘈雜的背景聲音,以及來自天南地北的口音也都會對識別率造成影響,所以在傳統(tǒng)的呼叫中心領(lǐng)域,ASR更多的是以一種輔助的姿態(tài)出現(xiàn)在功能清單之中。對于一個企業(yè)而言,了解客戶的需求是企業(yè)調(diào)整戰(zhàn)略部署最重要的依據(jù),否則就有可能出現(xiàn)花費數(shù)十億研制出來的新產(chǎn)品卻無人問津的尷尬境地。一些企業(yè)為了實現(xiàn)這個目的,常用的方法是進(jìn)行市場調(diào)查、或者由呼叫中心座席員向客戶發(fā)起電話調(diào)查等等,但這些方法一是受訪眾的覆蓋面積有限,二來客戶不一定配合,有些情況下甚至還會引起客戶的反感,如客戶正在召開重要會議,突然一個調(diào)查電話不合時宜的響起,可以想像客戶當(dāng)時的惱怒,更不要提客戶會積極配合企業(yè)的調(diào)查了。
智能語音分析系統(tǒng)對于該問題的解決之道是首先將海量的電話錄音轉(zhuǎn)為文本,這樣就可以像使用搜索引擎那樣來對通話進(jìn)行關(guān)鍵字搜索,以找到有價值的通話錄音。
ASR自動語音識別在呼叫中心系統(tǒng)中的應(yīng)用,自動語音識別通常有以下幾種分類方法:
1.按系統(tǒng)的用戶情況分:特定人和非特定人識別系統(tǒng);
2.按系統(tǒng)詞匯量分:小詞匯量、中詞匯量和大詞匯量系統(tǒng);
3.按語音的輸入方式分:孤立詞、連接詞、連續(xù)語音系統(tǒng)等;
4.按輸入語音的發(fā)音方式分:朗讀式、口語(自然發(fā)音)式;
5.按輸入語音的方言背景情況分:普通話、方言背景普通話、方言語音識別系統(tǒng);
6.按輸入語音的情感狀態(tài)分;中性語音、情感語音識別系統(tǒng)。
自動語音識別(ASR)在呼叫中心系統(tǒng)中的應(yīng)用,英語通常采用上下文相關(guān)的音素建模,漢語的協(xié)同發(fā)音不如英語嚴(yán)重,可以采用音節(jié)建模。系統(tǒng)所需的訓(xùn)練數(shù)據(jù)大小與模型復(fù)雜度有關(guān)。模型設(shè)計得過于復(fù)雜以至于超出了所提供的訓(xùn)練數(shù)據(jù)的能力,會使得性能急劇下降。