普強信息CEO何國濤
眼下是互聯(lián)網(wǎng)投資最糾結(jié)的時刻:智能手機基本普及、互聯(lián)網(wǎng)+產(chǎn)品不斷開發(fā),各行各業(yè)都在掀起革命,互聯(lián)網(wǎng)金融、互聯(lián)網(wǎng)農(nóng)業(yè)、互聯(lián)網(wǎng)醫(yī)療等等遍地開花,憑著對互聯(lián)網(wǎng)新技術(shù)的敏感和激情,越來越多的投資機構(gòu)也追逐創(chuàng)業(yè)者加入“互聯(lián)網(wǎng)+”的大軍,其背后卻是不足10%的創(chuàng)業(yè)成功率。領(lǐng)先一步的投資者已紛紛搶占了有利高地,而后續(xù)的突進因為過重燒錢沒有護城河的模式和諱莫如深看不懂的體制深水紛紛受阻,互聯(lián)網(wǎng)加了半天還是湊不上去。本來年初VR給諸位打了不少雞血、仿佛商用指日可待,但現(xiàn)在看來目前的終端tooyoung、恐怕至多也才剛剛達到“塞班的階段”;而最近一直在提的內(nèi)容、直播、網(wǎng)紅等伴隨著政策的收緊、大平臺制肘和數(shù)據(jù)造假的曝光,看起來越來越不像是真正的風(fēng)口??以上的種種似乎讓投資機構(gòu)們懵圈了,失去了往日的格局和耐心。
此時,我們不妨用另一個角度來思考投資方向:即縱向深度開發(fā)的科技。阿里巴巴,不過是利用現(xiàn)有互聯(lián)網(wǎng)技術(shù)整合現(xiàn)有資源,百度不過是利用現(xiàn)有計算機語言搜索社會既有的資源,騰訊不過是利用現(xiàn)有的技術(shù)為人與人的溝通搭建了一個橋梁,從這個意義上講,這些企業(yè)稱之為高科技企業(yè)真是勉為其難,因為這些所謂的高科技企業(yè)雖然改變了人們的生活方式,但也都不過是利用現(xiàn)有的計算技術(shù)對現(xiàn)有資源進行的整合,即科技的橫向利用。
那么重點來了:縱向深度開發(fā)的科技,相對于橫向資源整合的科技來說,更能從根本方式上改變社會的全方面。語音識別,你沒看錯,語音識別技術(shù)正是一項縱向開發(fā)的科技,這種語言的發(fā)明、發(fā)展、完善,以及語音識別技術(shù)的深入,必將深度影響人們社會生活的方方面面,同時也將引領(lǐng)社會各行業(yè)的新發(fā)展。語音識別技術(shù)的應(yīng)用被美國新聞界評為計算機發(fā)展十件大事之一。蘋果Siri的出現(xiàn),語音識別技術(shù)邁著花哨的小碎步走進大眾視野。這種語音識別技術(shù)讓機器通過識別和理解過程,把語音信號轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令,從而解放雙手和眼睛,實現(xiàn)隨時隨地的人機交互。在未來商業(yè)領(lǐng)域,語音識別技術(shù)將逐步進入工業(yè)、家電、通信、汽車電子、醫(yī)療、家庭服務(wù)、消費電子產(chǎn)品等各個領(lǐng)域,并且最終會成為人工智能的一項基礎(chǔ)科技。
語音識別技術(shù)作為科技縱向開發(fā)的一項科技手段,成為人工智能和機器學(xué)習(xí)應(yīng)用的一個重要方向,并將發(fā)展為一個具有廣闊前景的新興高技術(shù)產(chǎn)業(yè),具有敏銳嗅覺的商業(yè)巨頭們也在加速語音識別行業(yè)的布局。普強信息作為一家以智能語音識別和語言處理技術(shù)產(chǎn)業(yè)化為主要發(fā)展方向的新銳科技公司,成立于2009年美國加州硅谷,2010年于北京中關(guān)村設(shè)立中國運營公司,其業(yè)務(wù)定位是以中文為主的智能語音和語言核心技術(shù)的提供商、應(yīng)用方案提供商、云平臺服務(wù)提供商。經(jīng)過幾年時間的潛心研發(fā)和積累,普強信息正在成為眾多商業(yè)領(lǐng)域應(yīng)用中不可小覷的龍頭企業(yè),其發(fā)展趨勢和市場份額的井噴式增長,似乎預(yù)示著其角逐中國語音識別領(lǐng)域皇冠的決心。
技術(shù)為王
普強信息的創(chuàng)始人兼CEO,何國濤可謂是技術(shù)研究出身的管理人,作為一個具有管理上億元營收公司規(guī)模又具有跨國技術(shù)經(jīng)驗的美籍華人,何國濤先生在普強信息創(chuàng)立伊始,就將目光鎖定在中國剛剛起步的語音產(chǎn)業(yè),并將“核心技術(shù)的研發(fā)”視為企業(yè)發(fā)展之靈魂。“之前普通大眾對普強信息的熟知度并不高,普強信息從成立到現(xiàn)在已經(jīng)成功走完了初級階段,這一時期我們專心做的是技術(shù)研發(fā)、定制化應(yīng)用以及市場拓展,只是踏踏實實的做好技術(shù)提升和專業(yè)服務(wù)。”企業(yè)以此為經(jīng)營理念的前提下,何國濤攜手聯(lián)合創(chuàng)始人李全忠博士(現(xiàn)任普強信息CTO,負責公司語音識別及語音分析技術(shù))蒲瑤女士(現(xiàn)任普強產(chǎn)品副總)開啟了中國語音行業(yè)的征程。
普強信息在硅谷和中關(guān)村均建設(shè)有技術(shù)研發(fā)中心,集合了語音識別、語言處理和云計算技術(shù)領(lǐng)域世界級專家,擁有一流的研究及工程團隊。研發(fā)團隊占公司人員的80%左右,其中博士、碩士以上占團隊人員30%以上。
何國濤向《融資中國》記者介紹到,除此強大技術(shù)團隊之外,普強信息還與多名國內(nèi)外技術(shù)領(lǐng)域?qū)<乙?ldquo;技術(shù)顧問”形式展開合作,共同保障技術(shù)的領(lǐng)先性和前沿性。據(jù)了解,技術(shù)顧問大多來自國內(nèi)外知名大學(xué)從事語言學(xué)研究領(lǐng)域的專家,他們研發(fā)的成果大多被谷歌、微軟等科技巨頭公司所采用,技術(shù)方面的投入和研發(fā)正在為企業(yè)提供源源不斷的發(fā)展動力和商業(yè)價值。
核心產(chǎn)品
“千語”語音識別引擎和“千語千尋”語音分析系統(tǒng)是普強信息自主研發(fā)的核心產(chǎn)品,普強信息擁有其全部的知識產(chǎn)權(quán)和專利。針對不同的行業(yè),普強信息進行垂直化定制服務(wù),除了可以支持大詞匯量連續(xù)語音在線識別等語音服務(wù)外,還可以根據(jù)企業(yè)特有的應(yīng)用環(huán)境優(yōu)化識別模型和相關(guān)語音服務(wù)定制。其語音模型和聲學(xué)模型業(yè)務(wù)覆蓋金融、保險、銀行、電商、教育、政府、運營商等行業(yè),并提供定制化的SDK和接口調(diào)用。在中文系統(tǒng)的研發(fā)領(lǐng)域,普強信息已經(jīng)達到國際領(lǐng)先水平。“一些國際型巨頭公司可能會有多語言的語音識別,普強信息專攻中文語音領(lǐng)域的識別和分析,要好于國內(nèi)外技術(shù)水平。在某些技術(shù)上,與科大訊飛基本屬于持平狀態(tài),在一些方面,甚至優(yōu)于國內(nèi)龍頭企業(yè)。”何國濤介紹說,普強信息全文識別率可達85%以上,關(guān)鍵詞識別率達95%以上。
語音平臺是構(gòu)建一個可擴展的大數(shù)據(jù)分布式語音數(shù)據(jù)處理的平臺。該平臺既可以部署在一臺服務(wù)器上運行,也可以擴展到幾百臺服務(wù)器上分布式運行,其設(shè)計思路一開始就是針對處理大量的語音數(shù)據(jù);诖隧椩O(shè)計特點,該系統(tǒng)的很多組件都經(jīng)過精心設(shè)計,可以輕易擴展到分布式模式,以便減輕核心系統(tǒng)的負擔。系統(tǒng)中被經(jīng)常調(diào)用的部件也經(jīng)過優(yōu)化,使其對系統(tǒng)資源的占用減至最少,讓系統(tǒng)具備良好的封裝性和可擴展性。
“‘數(shù)據(jù)’已經(jīng)滲透到當今每一個行業(yè)和業(yè)務(wù)職能領(lǐng)域,成為重要的生產(chǎn)因素。人們對于海量數(shù)據(jù)的挖掘和運用,預(yù)示著新一波生產(chǎn)率增長和消費者盈余浪潮的到來。”何國濤向《融資中國》記者介紹說,在大數(shù)據(jù)的浪潮下,聯(lián)絡(luò)中心的客戶關(guān)系管理變得從未有過之近,也從未有過之重。企業(yè)借助普強信息的“千語千尋”語音分析系統(tǒng),對聯(lián)絡(luò)中心龐大的客戶對話錄音內(nèi)容進行全面質(zhì)檢和挖掘分析,感知客戶情感傾向,建立客戶主評測模型和外呼實踐知識應(yīng)用管理體系,在激烈市場競爭中迅速出擊。
“千語千尋”360度語音大數(shù)據(jù)分析系統(tǒng)建立的更深層意義在于支持數(shù)據(jù)的深度挖掘,具有對話信息分割、語速信息、靜音時長、識別可信度、聲紋信息、音素信息、時間邊界、情緒分析等功能,將運營中心座席與客戶的對話實時接入千尋系統(tǒng)的算法和模型,不僅能將不同地域口音的來電轉(zhuǎn)換成文字,還能根據(jù)不同的系統(tǒng)用戶需求,標注出關(guān)鍵用詞。這一分析系統(tǒng)支持市場上主要廠家的錄音系統(tǒng),既可以實時接入,也支持批量導(dǎo)入。該系統(tǒng)在識別率和處理速度上穩(wěn)居于行業(yè)優(yōu)先水平,目前公司客戶覆蓋金融、保險、汽車、教育、互聯(lián)網(wǎng)、政府、運營商等行業(yè)。目前,北京銀行、招商銀行、招商信諾、華安保險、中荷人壽、眾泰汽車、北汽、四維圖新、世紀高通、尚德教育、奇虎360、酷我音樂盒、我的南京、中國電信、中國移動、中國聯(lián)通、聯(lián)想等國內(nèi)外著名企業(yè)已經(jīng)和普強信息建立了合作關(guān)系。
產(chǎn)品優(yōu)勢成就企業(yè)價值,普強信息是全球領(lǐng)先的中文語音及語言技術(shù)提供商,作為技術(shù)原廠商,可保證項目達到最好的核心效果,公司具有中國大陸地區(qū)最好的語音分析、文本產(chǎn)品咨詢顧問,具有豐富的行業(yè)應(yīng)用案例,以及項目管理經(jīng)驗;龐大的本地化技術(shù)團隊,從核心到應(yīng)用均為自主研發(fā),可快速根據(jù)客戶的實際業(yè)務(wù)優(yōu)化語音識別效果和系統(tǒng)二次開發(fā)。
公司成立七年來,普強信心語音識別技術(shù)和應(yīng)用已經(jīng)在合作客戶企業(yè)中產(chǎn)生了強效應(yīng)。據(jù)可依據(jù)資料可以看到一組數(shù)字:通過將所有結(jié)構(gòu)化和非結(jié)構(gòu)化(錄音數(shù)據(jù)、隨路數(shù)據(jù))的數(shù)據(jù)標簽進行整合化分析,打造所有數(shù)據(jù)的可視化分析,為運營中心各類人員提供基于客戶心聲的360度視圖分析數(shù)據(jù)利用率達到100%;通過對所有錄音的自動識別分析,各級質(zhì)檢、運營、營銷、管理人員的工作效率提升16倍;通過對業(yè)務(wù)(話術(shù))流程的改進,使各項營銷業(yè)務(wù)的成單轉(zhuǎn)化率提升10%;通過對坐席服務(wù)能力和業(yè)務(wù)能力的改善,使客戶流失率降低5%;通過超長通話分析、重復(fù)來電分析、靜音時長分析降低來電量和平均通話時長,轉(zhuǎn)人工來電量降低3%,平均通話時長降低10S左右。
普強信息通過語音識別和語音分析領(lǐng)域的深耕,目前擁有其全部的知識產(chǎn)權(quán)和專利,其研發(fā)的多種語音技術(shù)均是業(yè)界領(lǐng)先的技術(shù),目前已經(jīng)獲得9項國家專利,13個計算機軟件著作權(quán)登記證書并參與制定2國家行業(yè)標準。
車載語音助手
普強信息作為四維圖新戰(zhàn)略布局重要一環(huán),以“千語”語音識別引擎和“千語千尋”語音分析系統(tǒng)為基礎(chǔ)支撐,著眼中國車載語音市場,通過普強信息車載語音助手,使駕駛者徹底解放雙手,真正實現(xiàn)讓汽車聽清楚并理解人類語言,聽語音指令進行硬件控制、通信、信息查詢,最終實現(xiàn)智能駕駛和車聯(lián)網(wǎng)。對于這一目標的胸有成竹,普強信息的自信和底氣來自于與四維圖新的戰(zhàn)略合作。
從2011年四維圖新首次成為普強信息的合作伙伴,到2015年普強信息再度獲得由四維圖新領(lǐng)投的新一輪融資,從另一個側(cè)面看到了雙方在全面布局車聯(lián)網(wǎng)領(lǐng)域布局的決心和普強信息的競爭力優(yōu)勢。通過四維圖新的戰(zhàn)略布局,針對智能語音及語言技術(shù)研究、軟件及芯片產(chǎn)品開發(fā)、語音信息服務(wù)及電子系統(tǒng)企業(yè)的布局,形成產(chǎn)業(yè)鏈閉環(huán)和強有力的壁壘,普強已經(jīng)把車載語音做到了同屬四維旗下的杰發(fā)科公司的公版上,完成了芯片級語音的第一步。
普強信息把注意力放在通話、導(dǎo)航和音樂等最基本的功能上,確保這些功能在駕車環(huán)境中穩(wěn)定而可靠,把在智能手機上非常熟悉的應(yīng)用和界面搬上車載顯示屏,整合各個汽車廠商定制的操控功能,采用智能語音技術(shù)進行智能化控制;針對車載語音識別由于容易受到外部環(huán)境噪音、引擎噪音和車內(nèi)環(huán)境噪音影響,普強信息在降噪技術(shù)上,一方面使用了DSP降噪芯片進行硬件去回聲降噪,另一方面通過定制化采集不同車型上的胎躁,發(fā)動機噪音,風(fēng)噪等噪音數(shù)據(jù)訓(xùn)練聲學(xué)模型,進行軟件降噪;同時還有2-4個的陣列硅麥麥克風(fēng)方案,實現(xiàn)聲源定位和聲源追蹤的功能。
隨著公司不斷的積累,語音識別的技術(shù)和產(chǎn)品都相應(yīng)獲得了全方面領(lǐng)先優(yōu)勢的發(fā)展。在產(chǎn)品的聲學(xué)建模上,開發(fā)使用了深度神經(jīng)網(wǎng)絡(luò)技術(shù);公司研發(fā)的語音切分技術(shù)及識別結(jié)果的置信度算法,不但為企業(yè)級應(yīng)用提供準確的識別結(jié)果,同時也提供了精確的說話人分割、時間邊界以及識別結(jié)果的置信度等信息,這些信息使企業(yè)在應(yīng)用中,更加便捷和準確地利用語音作為主要的交互方式,并且可以進一步挖掘、分析和利用海量語音數(shù)據(jù)的內(nèi)容。
高科技+互聯(lián)網(wǎng)的生活總是讓生活變得簡單、智能。車載語音助手針對駕駛環(huán)境設(shè)計最人性化交互體驗,保證駕駛安全的同時又可以用最自然的語言進行打電話、導(dǎo)航、音樂等。在未來,只要你對它說你要的命令,普強語音助手就可以理解并執(zhí)行,既可收聽股市、查詢天氣、周邊查詢、還能新聞閱讀、車輛控制等。未來,通過普強信息與客戶需要的深度整合,車載語音助手可通過車窗,座椅加熱等接口開放進行控制。
對于語音識別技術(shù),口音和方言一直是其挑戰(zhàn)的詬病。普強信息主攻技術(shù)為中文識別,語音分析系統(tǒng)在大數(shù)據(jù)語音分析的時候,積攢了大量的口音數(shù)據(jù),目前市場上見到的口音基本都已經(jīng)支持,針對個別方言需求也可以進行定制開發(fā)。
普強智能車載語音助手意在解決駕駛員的“手忙腳亂”,從前裝客戶提供完整、高效的車載語音交互,幫助車主實現(xiàn)真正的“全程脫屏”,并立足于前裝市場的云+端+芯方案,打造世界最好的中文車載語音交互系統(tǒng)。
未來發(fā)展趨勢
語音識別技術(shù)最早起源于1960年,英國的Denes等人研究成功了第一個計算機語音識別系統(tǒng),開啟了人類與機器人的奇幻旅程。1986中國高科技發(fā)展計劃(863計劃)啟動,中國開始了有組織的語音識別技術(shù)的研究,從此中國的語音識別技術(shù)進入了一個前所未有的發(fā)展階段。
翻開人類語音識別發(fā)展歷程,不得不提國際巨頭Nuance,這家公司擁有世界上超過80%的語音識別,曾經(jīng)在語音領(lǐng)域具有一統(tǒng)江湖的地位,幾乎壟斷了全世界金融和電信行業(yè)。就算現(xiàn)在Nuance依舊是全球最大的語音技術(shù)公司,掌握著全球多語種的語音技術(shù)專利。蘋果的Siri算是鼎鼎大名了,其技術(shù)經(jīng)過并購、研發(fā)逐漸走向成熟,算世界上語音識別的執(zhí)牛耳者。除此之外,國際巨頭微軟、谷歌、Facebook、Amazon等更多大佬紛紛布局全球市場。
風(fēng)景這邊獨好,隨著國內(nèi)創(chuàng)業(yè)熱潮和資本驅(qū)使,國內(nèi)語音市場近年來進入加速跑時期。面對未來市場的商業(yè)價值,每個人都想在巨大蛋糕前分得缽滿盆滿。
科大訊飛是目前國內(nèi)最有影響力的語音技術(shù)公司,成立于1999年,在2008年掛牌上市目前市值接近500億,根據(jù)2014年語音產(chǎn)業(yè)聯(lián)盟的數(shù)據(jù)調(diào)查顯示,科大訊飛占據(jù)了國內(nèi)超過60%的市場份額,絕對是國內(nèi)語音技術(shù)的龍頭企業(yè);百度也在很早將語音確立為戰(zhàn)略方向;搜狗開始采用云知聲的語音識別引擎;但很快就搭建起自己的語音識別引擎。騰訊當然不會落后,微信也建立了自己語音識別引擎,用于將語音轉(zhuǎn)換為文字;阿里,愛奇藝,360,樂視等等也都在搭建自己的語音識別引擎。
未來的語音識別市場,預(yù)計將會有越來越多的公司參與,未來語音識別的性能可能更多的體現(xiàn)在前端技術(shù)和語義理解上。機器要與人自然交流,當然就不能重復(fù)手機這套語音對話規(guī)則,必然就要考慮到用戶說話的環(huán)境、周圍環(huán)境的噪音、用戶發(fā)音不準或者方言等等諸多因素,這就要求前端技術(shù)更加精準的模擬人體結(jié)構(gòu),仿真出機器人聽覺系統(tǒng),以實現(xiàn)解放雙手自由對話的目的。在這些方面,普強信息的技術(shù)水平已經(jīng)走在了國內(nèi)前沿。
語音識別行業(yè)屬于聲學(xué)和計算機的交叉技術(shù),立足時代發(fā)展和科技進步,普強信息以技術(shù)為核心競爭力,真正實現(xiàn)語音從識別到交互的自然體驗。不僅實現(xiàn)將語音轉(zhuǎn)換成文字,更專注于機器從文字中理解說話人的含義,從而向穿戴設(shè)備、智能家居、機器人等領(lǐng)域進軍,打造專業(yè)的行業(yè)地位,帶動人類向人工智能邁進一步。