2009/04/15
CTI論壇(ctiforum)04月15日消息: 2009年4月14日至15日,CTI論壇主辦2009中國呼叫中心及企業(yè)通信大會(huì)在北京國際會(huì)議中心隆重召開,會(huì)議展開三十多場(chǎng)精彩紛呈的演講,邀請(qǐng)了一批業(yè)界知名專家在會(huì)上發(fā)表演說,以下是主題演講現(xiàn)場(chǎng)圖文報(bào)道:
安徽科大訊飛信息科技股份有限公司 吳曉如
這個(gè)是我們叫做呼叫導(dǎo)航的系統(tǒng),大家可以看到這個(gè)下拉菜單是用戶希望得到的服務(wù),但是我們這個(gè)服務(wù)列得不是很全。如果我們希望得到一項(xiàng)服務(wù),我家的煤氣費(fèi)沒錢了,我想交一點(diǎn)煤氣費(fèi)。大家可以看到,我可以以比較自由的方式,告訴IVR一件什么事情呢?就是我家的媒體費(fèi)沒錢了,我要交煤氣費(fèi)。在以前傳統(tǒng)的IVR的按鍵上,你可能需要按3、4次,但是現(xiàn)在用戶只需要說他的需求。
我們?cè)賮砜匆粋(gè)。
(演講人演示,說:"我想把定期的儲(chǔ)蓄轉(zhuǎn)成活期的", 菜單自動(dòng)跳轉(zhuǎn)到:定期轉(zhuǎn)活期)
我想把定期的儲(chǔ)蓄轉(zhuǎn)成活期的。這個(gè)演示實(shí)際上是給大家介紹一個(gè)什么叫做呼叫導(dǎo)航,與之前的基于命令的識(shí)別有什么差別。它可以給我們的呼叫中心起到一個(gè)什么幫助。
在這種基于自由說話的呼叫導(dǎo)航中,我們的用戶不用這么痛苦,必須記住我們的菜單名稱。我們?cè)谠O(shè)計(jì)我們的菜單的時(shí)候,我們整個(gè)呼叫中心的管理者,也不需要設(shè)計(jì)一個(gè)非常復(fù)雜的菜單。實(shí)際說準(zhǔn)確的呼叫導(dǎo)航是怎么做到的呢?叫做特定語音的語音識(shí)別,如果要語音識(shí)別,對(duì)于識(shí)別每一個(gè)字是很困難的,但是對(duì)于我們銀行的語音菜單是很簡(jiǎn)單的。即使1、2個(gè)字發(fā)生的困難,對(duì)于我們最后的解析也可以讓它理解我們最后用戶的需求是什么。所以,語音導(dǎo)航用戶只需要做什么事情呢?只需要說說你的需求。
我們說的呼叫中心,剛才說怎么讓我們的呼叫中心變得更加聰明。第二個(gè)問題是呼叫中心還面臨一個(gè)挑戰(zhàn),當(dāng)前的呼叫中心轉(zhuǎn)成成本中心,在一些用戶轉(zhuǎn)向呼叫中心做一些實(shí)際業(yè)務(wù)的時(shí)候,如何讓我們的呼叫中心變得更加安全。以我們銀行的呼叫中心,電話銀行是大家非常信任的業(yè)務(wù)的手段,但是有很多安全須知,千萬不要泄露你的帳號(hào)、密碼,如果你泄露了你可能會(huì)很痛苦,你的財(cái)產(chǎn)會(huì)受到損失。對(duì)于這方面,我們的語音技術(shù)能不能做一些工作,使我們的呼叫中心變得更加安全呢?目前的語音識(shí)別可以使我們的呼叫中心在風(fēng)險(xiǎn)控制方面得到很大的幫助。
如果我們的座席人員了解他家里面每一個(gè)家人的聲音那么熟悉去了解用戶的聲音,對(duì)于座席人員有點(diǎn)難,幾乎不可能完成。但是語音識(shí)別可以做到,實(shí)際上我們對(duì)于我們的用戶和座席,在說話的過程當(dāng)中我們可以實(shí)時(shí)監(jiān)控。如果發(fā)現(xiàn)當(dāng)前的通話是一個(gè)可疑的對(duì)話,可以告知座席,座席可以采取銀行要求他采取的步驟,這樣可以加強(qiáng)我們的風(fēng)險(xiǎn)控制。
對(duì)于有一些用戶,我們實(shí)際上在他做這個(gè)業(yè)務(wù)的過程中,我們可以采用一些,吸入說聲紋系統(tǒng),對(duì)于他的聲紋進(jìn)行實(shí)時(shí)的監(jiān)控,如果沒有聲紋識(shí)別,我們可以提醒這個(gè)用戶提高安全級(jí)別。
聲紋識(shí)別是辨別說話人身份的一項(xiàng)技術(shù),通話人說的可以是特定的內(nèi)容,也可以說一些任意無關(guān)的內(nèi)容。
其中兩個(gè)最關(guān)鍵的技術(shù),一個(gè)是聲紋確認(rèn),比如說這個(gè)用戶是某某帳號(hào)的聲紋,他說話的時(shí)候可以跟語音庫里的聲音進(jìn)行對(duì)照。開始我不知道你這個(gè)用戶是誰,你進(jìn)來之后我看你是不是屬于特殊的群體,比如說是我們銀行需要關(guān)注的黑名單。這樣的話,這個(gè)人在通話的過程中,我們可以和目標(biāo)聲紋庫里的聲紋模板進(jìn)行匹配。如果是可疑分子,我們要通知銀行注意這個(gè)業(yè)務(wù)當(dāng)中有風(fēng)險(xiǎn)。
實(shí)際上大家對(duì)于語音識(shí)別前期也在關(guān)注,但是我們覺得一個(gè)成功的語音識(shí)別有很多的核心技術(shù)。我們不但針對(duì)命令詞,而且對(duì)于連續(xù)的語音也可以識(shí)別,而且我們語音識(shí)別可以有很好的排除干擾的能力。同時(shí),我們的語音識(shí)別應(yīng)該有語義解析,正確理解一個(gè)人說話的目的。
語音識(shí)別在實(shí)際的應(yīng)用中,它會(huì)面臨不同的口音、不同的應(yīng)用環(huán)境,需要我們對(duì)使用中大規(guī)模的語音數(shù)據(jù)通過語音模型進(jìn)行訓(xùn)練,使我們可以排除不同的噪音。
實(shí)際上,所有的語音識(shí)別的技術(shù)都是基于統(tǒng)計(jì)的。如果我們了解過不同的口音、不同的信道地之后就可以很好地處理這些不同的數(shù)據(jù),一些不同口音的影響。
科大訊飛我們?cè)谌珖?個(gè)聯(lián)合實(shí)驗(yàn)室,在中國科技大學(xué)、清華大學(xué)、社科院語言所、國家普通話測(cè)試站中心,最后會(huì)整合成我們最后的語音合成、語音識(shí)別、聲紋識(shí)別等等。
另外,對(duì)于我們相關(guān)很重要的處理語音識(shí)別所需要的口音、信道,目前我們?cè)谌珖〖?jí)電信運(yùn)營商部署的音樂搜索等大規(guī)模語音識(shí)別業(yè)務(wù)已超過50個(gè),覆蓋不同地域等,使我們的語音識(shí)別可以應(yīng)用于不同的環(huán)境。
自助式的語音服務(wù)之前一直是按鍵加錄音,TTS技術(shù)的出現(xiàn),使我們的語音呼叫是按鍵+TTS。我們語音導(dǎo)航可以進(jìn)入ASR&TTS,用戶的需求不但可以通過3鍵和9鍵。
我們科大訊飛是語音技術(shù)領(lǐng)域唯一的國家863計(jì)劃產(chǎn)業(yè)化基地、國家規(guī)劃布局內(nèi)重點(diǎn)軟件企業(yè)、國家級(jí)企業(yè)技術(shù)中心。中國語音市場(chǎng)占有率最高達(dá)到了70%,同時(shí)我們代表工信部制定語音技術(shù)的國家標(biāo)準(zhǔn),目前我們有700人左右,設(shè)有博士后的工作站在全國有4個(gè)聯(lián)合實(shí)驗(yàn)室,公司是在去年的5月份在深交所正式發(fā)行上市。
科大訊飛的中文語音合成技術(shù),在理歷屆的國內(nèi)、國際的評(píng)測(cè)中都名列第一。2006年和2008年我們參加了全球英文語音技術(shù)合成大賽,我們也連續(xù)三年蟬聯(lián)了第一名。在這里,我簡(jiǎn)單地把我們的語音合成技術(shù),簡(jiǎn)單地做一個(gè)演示。
同時(shí),我們的語音合成可以提供不同的音樂和語種。目前,我們的音樂合成技術(shù)首先整合了我們06到08年三年比賽的成果,同時(shí)我們的產(chǎn)品可以支持各種主流的語種,同時(shí)可以支持不同的方言音色,合成系統(tǒng)可以有男女老少各種因素供我們用戶選擇。
為了使我們相關(guān)的產(chǎn)品可以在主流行業(yè)有更好的效果,我們針對(duì)像電信、金融等一些主流的行業(yè)進(jìn)行專門的優(yōu)化,可以提供專業(yè)的優(yōu)化版本。同時(shí),我們的系統(tǒng)還提供了多種實(shí)用的特性,它不僅僅是是文本轉(zhuǎn)語音,還可以進(jìn)行音頻的管理,可以進(jìn)行日志的管理和動(dòng)態(tài)的重啟。
比如說你分散式部署IVR的系統(tǒng),你可以把所有的提示音通過我們TTS的音頻管理進(jìn)行統(tǒng)一的安排,這樣各地的IVR的服務(wù)器,可以通過FTP、HTTP的格式進(jìn)行轉(zhuǎn)換。
聲紋識(shí)別目前在國際上最有名的技術(shù)評(píng)測(cè)是美國的國家標(biāo)準(zhǔn)技術(shù)研究院,每年會(huì)舉行一次大規(guī)模的聲紋識(shí)別大賽。科達(dá)訊飛在2008年我們參加了這次評(píng)測(cè),這次評(píng)測(cè)包含了國際上像MIT和斯坦福參加的比賽,我們?nèi)〉昧说谝幻。這有一個(gè)識(shí)別錯(cuò)誤里,如果有100個(gè)人想冒充別人,我發(fā)生錯(cuò)誤的是3個(gè),我可以抓住97個(gè)。這次比賽也表明了我們科大訊飛在識(shí)別方向上我們是國際領(lǐng)先。
目前,我們的語音識(shí)別除了目前已經(jīng)在各地電信廣泛音樂搜索中所使用的命令識(shí)別,你一說一個(gè)歌曲的名稱我就可以幫你下載下來,我們目前有成熟的呼叫導(dǎo)航,可以進(jìn)行語義的解析,同時(shí)我們可以提供相關(guān)的語音搜索和檢索。以后有大量的音視頻的呼叫,怎么管理,我們可以制定一些語音的標(biāo)簽,使我們搜索的時(shí)候更加方便。
實(shí)際上我們說了很多不同的語音服務(wù)的模塊,聽上去很多,但是應(yīng)用起來非常方便。
我們有多種的語音合成,多種的語音識(shí)別,我們的聲紋識(shí)別引擎等等。所有這些我們都可以通過統(tǒng)一的網(wǎng)絡(luò)平臺(tái)技術(shù)封裝。這種封裝既可以通過之前各個(gè)廠商非常熟悉的接口形式進(jìn)行封裝,也可以通過最新的基于SIP的、MRCP的服務(wù)進(jìn)行統(tǒng)一的管理。用戶無論使用什么引擎都可以得到我們的語音管理的服務(wù)。
目前我們這種平臺(tái)已經(jīng)可以支持華為、Avaya、思科等眾多的平臺(tái),可以支持眾多主流的操作系統(tǒng)。我們科大訊飛有著非常完備的研發(fā)和質(zhì)量體系,早在2006年的12月份我們就通過了CMMI L4評(píng)估認(rèn)證,目前我們也是首個(gè)國家的標(biāo)準(zhǔn)試點(diǎn)基地。
目前,我們?cè)谌珖?4個(gè)主要的城市設(shè)有子公司和辦事處,可以為我們所有的合作伙伴和用戶提供非常完備的技術(shù)支持和服務(wù)。
科大訊飛在去年5月份上市以后,也是成立了我國第一家以語音技術(shù)為主要產(chǎn)業(yè)化方向的上市公司。在當(dāng)前比較惡劣的經(jīng)濟(jì)環(huán)境下,科大訊飛受到了股市和分析師非常好的評(píng)價(jià),去年11月份開始我們中小版上升了60%,我們大概上升了140%。我們現(xiàn)在的股價(jià)大概維持在30多元。其中股價(jià)只是很表面的表現(xiàn),最主要的原因是各個(gè)行業(yè)的分析師,對(duì)于語音技術(shù)的水平,以及語音技術(shù)各個(gè)行業(yè)的廣泛應(yīng)用,表示高度的認(rèn)可。我們也希望我們不斷提供最優(yōu)的語音技術(shù),我們期待和我們的產(chǎn)業(yè)、呼叫中心相關(guān)的產(chǎn)業(yè)能夠合作共贏、共同發(fā)展。我的介紹就到這里,謝謝大家!
本文根據(jù)CTI論壇主辦的2009中國呼叫中心及企業(yè)通信大會(huì)會(huì)議記錄整理,轉(zhuǎn)載請(qǐng)注明出處!
CTI論壇報(bào)道