12月21日,作為國內(nèi)智能語音與人工智能產(chǎn)業(yè)領(lǐng)導(dǎo)者,科大訊飛在北京國家會議中心召開了以“AI復(fù)始,萬物更新”為主題的科技大會,亦即科大訊飛2015年年度發(fā)布會。作為被稱為“人工智能之年”的2015年的收官大會,科大訊飛主題大會的內(nèi)容異彩紛呈,可以說是中國人工智能領(lǐng)域的一場具有標(biāo)志意義的大會。
大會上,科大訊飛董事長劉慶峰回顧了人工智能誕生整整60年來所經(jīng)歷的兩次波峰波谷,對當(dāng)下的人工智能熱潮做出了精彩的評論。在發(fā)布環(huán)節(jié),劉慶峰發(fā)布了建設(shè)全新語音交互技術(shù)基礎(chǔ)上的人工智能時代的人機(jī)交互界面——AIUI,以及錄音寶、錄音筆、訊飛聽見網(wǎng)、智學(xué)網(wǎng)、E 聽說等To C產(chǎn)品,并對“訊飛超腦”2.0版本的近期科研成果進(jìn)行了精彩介紹和現(xiàn)場演示?拼笥嶏w高級副總裁、研究院院長胡郁,則在大會上詳細(xì)講解了人工智能的科技起源、歷史沿革與未來展望,以及科大訊飛產(chǎn)品的技術(shù)實現(xiàn)路徑。
劉慶峰介紹,1956年的達(dá)特茅斯會議是人工智能研究的歷史起點(diǎn),至今正好是一個60年甲子。在這60年的發(fā)展過程中,伴隨著計算機(jī)技術(shù)和民用科技突飛猛進(jìn)的發(fā)展,人工智能研究本身經(jīng)歷了兩次波峰與波谷,而從2006年起始至今愈發(fā)升溫的人工智能熱,是第三次人工智能浪潮,而60年甲子的當(dāng)下,正處于人工智能爆發(fā)的前夜。在這第三次浪潮中,中國、美國和歐洲,不約而同地將人類大腦研究上升為國家戰(zhàn)略科研高度,而以科大訊飛為代表的中國科學(xué)家與產(chǎn)業(yè)勢力,也是歷史上第一次與西方的同行們同步前進(jìn),共同推動人類科學(xué)技術(shù)的前沿探索。
劉慶峰表示,人工智能未來會像水和電一樣無所不在。而在人工智能的三個層次——計算智能、感知智能和認(rèn)知智能之中,前兩者機(jī)器的能力已經(jīng)超越人類,讓機(jī)器實現(xiàn)認(rèn)知智能是目前人工智能科研的焦點(diǎn),這也是人區(qū)別于動物的最本質(zhì)能力。
而從人類自身的發(fā)展來看,產(chǎn)生認(rèn)知智能的標(biāo)志是語言的廣泛使用。所以,在第三次人工智能浪潮中,世界上眾多的科學(xué)家都不約而同地從“自然語言理解”這個研究方向上,尋找人工智能的突破口,亦即從語音與語言入手實現(xiàn)機(jī)器的認(rèn)知革命。而科大訊飛也正是從這個方向上取得了令世人矚目的成就。
劉慶峰介紹,從1998年成功研發(fā)出可實用的中文語音交互系統(tǒng)開始,至2014年發(fā)布“訊飛超腦”的這17年間,科大訊飛取得了讓行業(yè)和科技界矚目的一系列科研成就與產(chǎn)業(yè)化成果?拼笥嶏w的這些成果中,包括獲得NIST全球語種識別比賽的冠軍,包括獲得JWSLT機(jī)器翻譯評測冠軍,包括其產(chǎn)品在國內(nèi)替代人工進(jìn)行英語口語測試與普通話級別考試,包括其產(chǎn)品在教育、車載、家居、通信、硬件和國家安全等眾多領(lǐng)域的產(chǎn)業(yè)化高速推進(jìn),并在這個過程中從一家大學(xué)生創(chuàng)業(yè)公司,成長成為目前市值超過500億的中國高科技公司。
在產(chǎn)品發(fā)布環(huán)節(jié),劉慶峰首先定義了認(rèn)知智能的三大核心支撐能力:人機(jī)交互、知識管理與推理學(xué)習(xí)。而隨后科大訊飛發(fā)布的訊飛超腦2.0科研項目,正是圍繞這三方面持續(xù)展開,不但賦予機(jī)器“能聽會說”的能力,還能賦予機(jī)器“能理解會思考”的能力,使機(jī)器可以在不久的將來在高考中折桂。
而在訊飛超腦的產(chǎn)業(yè)化應(yīng)用產(chǎn)品層面,劉慶峰發(fā)布了對科大訊飛具有里程碑意義的人機(jī)交互新產(chǎn)品——AIUI。劉慶峰認(rèn)為,在實際上已經(jīng)到來的“萬物互聯(lián)”時代,客觀上對人機(jī)交互提出了更高的要求。但是,一方面目前大多數(shù)設(shè)備沒有屏幕并且與用戶之間有一定的距離,另一方面隨時隨地的多方交互的需求越發(fā)明顯。于是,科大訊飛又在此次大會上定義了“萬物互聯(lián)”時代的人機(jī)語音交互標(biāo)準(zhǔn),其基本能力應(yīng)該包括三方面:遠(yuǎn)場識別、全雙工、多輪交互。
AIUI集成了包括雙全工技術(shù)、麥克風(fēng)陣列技術(shù)、聲紋識別技術(shù)、方言識別、語義理解技術(shù)和和內(nèi)容服務(wù)等等——科大訊飛一些列尖端科研成果和完善服務(wù),代表業(yè)界最高水準(zhǔn)的技術(shù)產(chǎn)品。在發(fā)布現(xiàn)場,科大訊飛在全球首次將演講人(劉慶峰)的演講同步轉(zhuǎn)寫成文字在大屏幕顯示,敢于接受現(xiàn)場數(shù)千參會者和數(shù)千萬觀看視頻直播觀眾的檢驗。
在作出兩個定義和相關(guān)發(fā)布之后,劉慶峰表示,在訊飛超腦的應(yīng)用層上,教育產(chǎn)業(yè)也是科大訊飛將自身科研成果產(chǎn)業(yè)化最成功的領(lǐng)域之一。目前,全國已經(jīng)有31個省市的8000萬師生在使用科大訊飛面向K12教育所推出的高科技教學(xué)與考評產(chǎn)品,有效解決了之前“老師忙、學(xué)生盲、資源茫”的教育行業(yè)困境,不僅實現(xiàn)了語音與文字的識別、合成與分類,并且實現(xiàn)了智能批改、全科閱卷、資源庫自動建設(shè)等真正具備“人工智能”的產(chǎn)品目標(biāo),為中國的整個教育體系實現(xiàn)夢寐以求的個性化教學(xué)提供了有力支撐。劉慶峰認(rèn)為,正是在此基礎(chǔ)上,作為科大訊飛的To C教育產(chǎn)品——智學(xué)網(wǎng)與E聽說具備非常可觀的市場價值。
除上述產(chǎn)品之外,科大訊飛還在大會上發(fā)布了實用性很強(qiáng)的To C產(chǎn)品——錄音寶、錄音筆與訊飛聽見網(wǎng)。據(jù)劉慶峰介紹,實際上,音文轉(zhuǎn)寫是當(dāng)下都市生活的一種經(jīng)常性需求,在正式發(fā)布之前,錄音寶產(chǎn)品已經(jīng)有了超過100萬的用戶就是這種需求的證明。而隨著流媒體的不斷演進(jìn)與普及,相信,在未來的圖文直播時代,科大訊飛的音文轉(zhuǎn)錄產(chǎn)品的價值將會更加凸顯。
劉慶峰表示,錄音寶、錄音筆與訊飛聽見網(wǎng)這三款新銳產(chǎn)品,將與訊飛輸入法(2.8億用戶)、靈犀語音助手(1.2億用戶)、叮咚智能音箱(2015年市場份額最大的WiFi音箱)、智學(xué)網(wǎng)、E聽說一道,構(gòu)成科大訊飛的To C產(chǎn)品線第一陣營,而科大訊飛還將繼續(xù)在To C業(yè)務(wù)的條線上,推出受市場歡迎的高科技產(chǎn)品。
在大會最后,劉慶峰表示,在實際上已經(jīng)到來的“萬物互聯(lián)時代”,語音為主,觸摸、圖像、手勢為輔,將成為人機(jī)交互的新常態(tài),而在這種人類生活的新常態(tài)中,人工智能技術(shù)的突破是用來延伸人類能力而非替代人類的。人工智能將使人類更幸福、更富想象力和創(chuàng)造力。
而相比之前的人工智能浪潮中的明星公司,科大訊飛將依靠自身強(qiáng)大的人工智能科研實力與優(yōu)質(zhì)產(chǎn)品,更具創(chuàng)造性地去改變世界,讓人們的生活更加美好。