過去十年自然語(yǔ)言理解技術(shù)已有了重大突破,在語(yǔ)音識(shí)別和機(jī)器翻譯等領(lǐng)域都取得了長(zhǎng)足發(fā)展,但在實(shí)際應(yīng)用中還存在很多不足,譬如大部分“智能客服”還基本處于“智障客服”階段。因此需要繼續(xù)加強(qiáng)對(duì)自然語(yǔ)言理解技術(shù)的投入,從而讓人工智能從感知智能跳躍到認(rèn)知智能。
認(rèn)知智能市場(chǎng)大有可為 NLP開放平臺(tái)應(yīng)運(yùn)而生
從技術(shù)到產(chǎn)品,從產(chǎn)業(yè)端到市場(chǎng)化,NLP落地應(yīng)用的探索長(zhǎng)期以來(lái)面臨著幾座大山。一是NLP技術(shù)的“知名度”不足,許多人不知道該技術(shù)怎么用以及如何獲取;二是學(xué)術(shù)研究與產(chǎn)業(yè)脫節(jié)的問題,掌握NLP最前沿技術(shù)的人幾乎都在高校中,而最需要使用這項(xiàng)技術(shù)的人還在市場(chǎng)中苦苦尋覓;三是針對(duì)各個(gè)行業(yè)的語(yǔ)料庫(kù)數(shù)據(jù)不足,導(dǎo)致落地時(shí)無(wú)法順利推進(jìn)。
在當(dāng)前NLP產(chǎn)學(xué)研用仍處于被動(dòng)掣肘的大環(huán)境下,中國(guó)人工智能市場(chǎng)的發(fā)展規(guī)模又是怎樣一番景象呢?我們來(lái)看一組數(shù)據(jù):
聚焦NLP市場(chǎng):放眼全球,whatech預(yù)測(cè)2020年全球NLP市場(chǎng)規(guī)模將近134億美元,而隨著中國(guó)NLP市場(chǎng)的逐年擴(kuò)大,保守估計(jì)到2020年,中國(guó)NLP市場(chǎng)至少占全球900億人民幣的10%,約90億人民幣,并將帶動(dòng)1000億相關(guān)市場(chǎng)的發(fā)展。此時(shí),正處于少年期的NLP將一展身手,大有可為。
NLP被稱為人工智能“皇冠上的明珠”,也是人工智能領(lǐng)域最難突破的部分。中國(guó)聲谷運(yùn)營(yíng)單位總裁祁東風(fēng)表示,“作為全國(guó)首個(gè)定位于人工智能領(lǐng)域的國(guó)家級(jí)產(chǎn)業(yè)基地——中國(guó)聲谷通過自然語(yǔ)言理解技術(shù)的市場(chǎng)應(yīng)用倒逼基礎(chǔ)理論和關(guān)鍵技術(shù)創(chuàng)新,走出了一條獨(dú)特且可持續(xù)的發(fā)展路徑,與神州泰岳、國(guó)家中文信息學(xué)會(huì)聯(lián)合打造了國(guó)內(nèi)首個(gè)‘NLP開放平臺(tái)——中文信息(深度)處理開放創(chuàng)新平臺(tái)’,將NLP核心技術(shù)應(yīng)用向各行業(yè)各領(lǐng)域縱深推進(jìn)。”
NLP開放平臺(tái)精耕細(xì)作 將實(shí)現(xiàn)多場(chǎng)景應(yīng)用落地
針對(duì)NLP的中文歧義性難題,NLP開放平臺(tái)擁有獨(dú)創(chuàng)的“本體建模技術(shù)”,把與場(chǎng)景相關(guān)的領(lǐng)域知識(shí)、NLP任務(wù)、語(yǔ)言資源等內(nèi)容進(jìn)行形式化規(guī)范描述,使得NLP場(chǎng)景應(yīng)用實(shí)現(xiàn)最大化的共享;如何處理語(yǔ)言結(jié)構(gòu)的另一難題,平臺(tái)又將符號(hào)化語(yǔ)義與深度學(xué)習(xí)技術(shù)結(jié)合,即能有效地識(shí)別多種語(yǔ)言結(jié)構(gòu),實(shí)現(xiàn)同一意思、不同結(jié)構(gòu)的歸一化處理。據(jù)了解,擁有自主知識(shí)產(chǎn)權(quán)的智慧語(yǔ)義認(rèn)知技術(shù)對(duì)語(yǔ)言結(jié)構(gòu)的遞歸嵌套處理也表現(xiàn)優(yōu)異,目前該平臺(tái)已經(jīng)具備可以識(shí)別出3層以上語(yǔ)言結(jié)構(gòu)遞歸嵌套的技術(shù),極大增強(qiáng)了NLP的可解釋性。
“NLP縱深行業(yè)應(yīng)用,需要盯準(zhǔn)需求,貼合業(yè)務(wù),直擊行業(yè)痛點(diǎn),才能打開市場(chǎng),獨(dú)占鰲頭。”近日,中國(guó)聲谷入園企業(yè)—神州泰岳副總裁李國(guó)東在以“見智見未來(lái)”為主題的2019全球人工智能產(chǎn)品應(yīng)用博覽會(huì)上介紹,神州泰岳在人工智能語(yǔ)義技術(shù)擁有10余年的技術(shù)研發(fā)優(yōu)勢(shì),更是中國(guó)中文信息學(xué)會(huì)唯一指定的產(chǎn)學(xué)研合作單位,2018年依托中國(guó)聲谷的“政策紅利”和自身在NLP技術(shù)上的前沿科技對(duì)NLP開放平臺(tái)進(jìn)行全面的資源整合、精耕細(xì)作,已在多領(lǐng)域推動(dòng)NLP技術(shù)賦能行業(yè)應(yīng)用。
公安行業(yè)首當(dāng)其沖,去年神州泰岳推出了一款面向公安行業(yè)的綜合應(yīng)用產(chǎn)品——“智腦2.0”,以人工智能-自然語(yǔ)言處理(AI-NLP)為核心,以極速計(jì)算、實(shí)體360°全息畫像、數(shù)據(jù)共享為支撐的跨警種跨網(wǎng)域的產(chǎn)品,適用于公安全警種。最重要的是,“智腦2.0”獨(dú)有的公安筆錄文本分析功能,能通過感知智能技術(shù)和語(yǔ)義智能識(shí)別,對(duì)所有警員的有效研判動(dòng)作進(jìn)行記憶存儲(chǔ)及分析,把海量的公安筆錄全部閱讀記錄,并且進(jìn)行提煉、歸納,將零碎的信息關(guān)聯(lián)起來(lái),為將來(lái)一鍵破案做足夠積累。
公安只是NLP技術(shù)落地的其中一個(gè)場(chǎng)景,只要有語(yǔ)言、有文本的地方,都能用上NLP技術(shù)。增值境外服務(wù)——智慧旅游小漫、知識(shí)產(chǎn)權(quán)及專利審查及服務(wù)、法務(wù)及合同審查服務(wù)、智慧招聘、中醫(yī)古籍知識(shí)挖掘服務(wù)、新聞(簡(jiǎn)訊)寫作、會(huì)議通知、調(diào)研報(bào)告自動(dòng)寫作等等。NLP平臺(tái)已開放的服務(wù)涵蓋16個(gè)行業(yè)領(lǐng)域、140多個(gè)場(chǎng)景和200多個(gè)服務(wù),未來(lái)將真正實(shí)現(xiàn)讓NLP技術(shù)賦能應(yīng)用開發(fā)。
神州泰岳&中國(guó)聲谷
神州泰岳是中國(guó)聲谷引入的智能語(yǔ)義領(lǐng)域龍頭企業(yè),于2017年正式入園。神州泰岳在人工智能語(yǔ)義技術(shù)擁有10余年的技術(shù)研發(fā)優(yōu)勢(shì),更是中國(guó)中文信息學(xué)會(huì)唯一指定的產(chǎn)學(xué)研合作單位。2018年,中國(guó)聲谷攜手神州泰岳在推進(jìn)發(fā)展智能語(yǔ)義應(yīng)用與生態(tài)系統(tǒng)建設(shè)新聞發(fā)布會(huì)上,正式發(fā)布NLP開放創(chuàng)新平臺(tái)。早前,權(quán)威媒體《互聯(lián)網(wǎng)周刊》聯(lián)合eNet研究院發(fā)布了“2018年度人工智能企業(yè)TOP100”,榜單中收錄了中國(guó)互聯(lián)網(wǎng)、人工智能、生物識(shí)別、大數(shù)據(jù)、基因健康等多領(lǐng)域的知名企業(yè),神州泰岳作為NLP引領(lǐng)者榮列人工智能企業(yè)百?gòu)?qiáng)榜單,并位列TOP18.