5月29日,2019年京交會(huì)中關(guān)村AI產(chǎn)業(yè)應(yīng)用與發(fā)展論壇在京成功舉辦,近百位來自學(xué)術(shù)界、產(chǎn)業(yè)界的大咖齊聚一堂,共話人工智能產(chǎn)業(yè)化發(fā)展之路。作為全方位AI技術(shù)融合應(yīng)用的開拓者,捷通華聲受邀分享AI技術(shù)讓機(jī)器“能說會(huì)聽、能思考會(huì)判斷”的產(chǎn)業(yè)應(yīng)用經(jīng)驗(yàn),現(xiàn)將捷通華聲總經(jīng)理武衛(wèi)東的發(fā)言整理如下。
主持人:李卓桓,谷歌機(jī)器學(xué)習(xí)開發(fā)者專家,微軟人工智能最具價(jià)值專家。
圓桌論壇嘉賓:武衛(wèi)東,北京捷通華聲科技股份有限公司總經(jīng)理,畢業(yè)于清華大學(xué),近20年一直從事于人工智能的產(chǎn)業(yè)化應(yīng)用。
主持人:武總,您好!咱們捷通華聲目前有哪些核心技術(shù),主要應(yīng)用于哪些領(lǐng)域。
武衛(wèi)東:捷通華聲是一家從事全方位人工智能技術(shù)研究和產(chǎn)業(yè)化應(yīng)用的公司。2011年,我們推出了全國首個(gè)全方位人工智能開放平臺(tái)——靈云(AIcloud。com),并將捷通的智能語音(語音識(shí)別,語音合成,聲紋識(shí)別,麥克風(fēng)陣列)、智能視覺(OCR,手寫識(shí)別,人臉識(shí)別,指紋識(shí)別,視頻識(shí)別)、智能語義(語義理解,自然語言處理,機(jī)器翻譯)、大數(shù)據(jù)分析等13項(xiàng)AI技術(shù)在靈云平臺(tái)上面向產(chǎn)業(yè)全面開放。我們想通過全方位AI技術(shù),賦能百業(yè),構(gòu)建人工智能產(chǎn)業(yè)生態(tài)。目前,我們的AI技術(shù)已廣泛應(yīng)用在金融、電信、能源、政企等各行業(yè)、各領(lǐng)域,服務(wù)上千家企業(yè)。
主持人:我們都知道,AI產(chǎn)業(yè)發(fā)展及商業(yè)變革,不僅僅依賴于技術(shù)的突破,更重要的是落地場景的實(shí)際應(yīng)用。捷通華聲作為一家全方位AI技術(shù)研究與產(chǎn)業(yè)化應(yīng)用企業(yè),提出人工智能讓機(jī)器“能說會(huì)聽、能思考會(huì)判斷”。請(qǐng)武總分享下,捷通華聲這方面的應(yīng)用水平到了什么樣的級(jí)別?解決了哪些行業(yè)痛點(diǎn)?
武衛(wèi)東:我們當(dāng)時(shí)提出“能說會(huì)聽、能思考會(huì)判斷”,是想讓人和機(jī)器之間,或者機(jī)器與機(jī)器之間,能像人與人一樣流暢溝通。
要實(shí)現(xiàn)“能說會(huì)聽、能思考會(huì)判斷”,就必須要多項(xiàng)AI技術(shù)融合應(yīng)用,所以我們當(dāng)時(shí)提出要打造全方位人工智能技術(shù),盡管學(xué)術(shù)界和產(chǎn)業(yè)界有很多人質(zhì)疑。
現(xiàn)在看來,很多產(chǎn)業(yè)應(yīng)用,要求多項(xiàng)AI技術(shù)融合服務(wù)。很多發(fā)展不錯(cuò)的AI公司,也在向全方位AI發(fā)展。從這一點(diǎn)來說,我們非常欣慰,經(jīng)過近10年的努力,我們靈云平臺(tái),已經(jīng)完成全方位人工智能,且很多產(chǎn)品已融合應(yīng)用多項(xiàng)AI技術(shù)。
舉個(gè)例子,我們2000年做語音合成技術(shù),應(yīng)用很廣泛,金融、交通、通訊、醫(yī)療等領(lǐng)域市場占有率很高:在呼叫中心,用語音合成(TTS)給用戶播報(bào)信息;在高鐵站,TTS用來做列車廣播通知,全國高鐵全部用的是捷通的技術(shù)。
單項(xiàng)TTS技術(shù),代替了人工播報(bào),減輕了人的負(fù)擔(dān),F(xiàn)在,我們通過多項(xiàng)AI技術(shù)融合應(yīng)用,能為企業(yè)大規(guī)模地節(jié)省人工成本,實(shí)現(xiàn)省力、省心、省錢。
分享個(gè)典型的案例,我們給國內(nèi)排行前三的某大型保險(xiǎn)公司,做了國內(nèi)最大的給上萬坐席同時(shí)提供實(shí)時(shí)話術(shù)輔助的智能語音分析系統(tǒng)。這套系統(tǒng),首先解決了過去通話無法結(jié)構(gòu)化的問題,應(yīng)用語音識(shí)別將通話全部轉(zhuǎn)為文字;其次,通過智能質(zhì)檢,將通話質(zhì)檢率從過去的5%提升到100%,有效提升了坐席的服務(wù)質(zhì)量和服務(wù)效率,真正實(shí)現(xiàn)為企業(yè)省力、省心、省錢、增效。
目前AI技術(shù)產(chǎn)業(yè)化應(yīng)用,還在不斷創(chuàng)造新的產(chǎn)品,但AI技術(shù)的提升,最近學(xué)術(shù)界和產(chǎn)業(yè)界都開始冷靜的思考:人工智能,計(jì)算能力,可以通過GPU來解決;算法能力,例如深度學(xué)習(xí),看到了一些天花板,需要我們更多的數(shù)學(xué)家來突破。因?yàn)锳I產(chǎn)業(yè)應(yīng)用市場是非常巨大的,所以我很有信心,全方位人工智能技術(shù)的融合,一定會(huì)在越來越多的場景落地。
主持人:非常感謝武總,對(duì)全方位AI技術(shù)融合應(yīng)用的寶貴分享,相信大家對(duì)AI產(chǎn)業(yè)發(fā)展及商業(yè)變革有了更深刻的見解。相信20年后人工智能可能已經(jīng)很普及并且能夠大大地造福人類,那今天在坐的各位老師大咖們都是人工智能時(shí)代的親歷者、創(chuàng)造者。如果假設(shè)現(xiàn)在您從20年后,回看現(xiàn)在,您最想對(duì)現(xiàn)在的自己和我們的同行們說的一句話是什么?
武衛(wèi)東:20年后,我們生活中的每一個(gè)行為、每一個(gè)動(dòng)作,背后都可能有人工智能技術(shù)輔助或幫我們完成,讓我們的生活更便捷。
“靈云智會(huì)系統(tǒng)“入選2019年人工智能新產(chǎn)品
京交會(huì)現(xiàn)場,聲音嘈雜,參觀者體驗(yàn)靈云語音識(shí)別,識(shí)別率極高