中文字幕无码久久精品,13—14同岁无码A片,99热门精品一区二区三区无码,菠萝菠萝蜜在线观看视频高清1

您當(dāng)前的位置是:  首頁(yè) > 新聞 > 文章精選 >
 首頁(yè) > 新聞 > 文章精選 >

泰岳AI晉耀紅博士:NLP落地需要語(yǔ)言、計(jì)算并舉

2018-03-15 10:11:49   作者:   來(lái)源:CTI論壇   評(píng)論:0  點(diǎn)擊:


晉耀紅
  神州泰岳人工智能研究院院長(zhǎng)兼首席科學(xué)家,博士生導(dǎo)師,中國(guó)計(jì)算機(jī)學(xué)會(huì)中文信息技術(shù)專委會(huì)專委,中國(guó)人工智能學(xué)會(huì)自然語(yǔ)言處理專委會(huì)專委。師從中國(guó)自然語(yǔ)言處理著名流派概念層次網(wǎng)絡(luò)(HNC)的創(chuàng)始人黃曾陽(yáng)教授并于2006年出版專著《HNC(概念層次網(wǎng)絡(luò))語(yǔ)言理解技術(shù)及其應(yīng)用》。國(guó)家863十二五課題(2012~2015)“海量文本多層次知識(shí)表示及中文文本理解應(yīng)用系統(tǒng)研制”的課題負(fù)責(zé)人。
  “NLP是語(yǔ)言與計(jì)算結(jié)合的技術(shù)。”
  自然語(yǔ)言處理(NLP)是人工智能和語(yǔ)言學(xué)的一部分,致力于使用計(jì)算機(jī)理解人類語(yǔ)言中的句子或詞語(yǔ),實(shí)現(xiàn)降低用戶工作量并滿足使用自然語(yǔ)言進(jìn)行人機(jī)交互的目的。
  語(yǔ)法、語(yǔ)義、語(yǔ)用一個(gè)都不能少
  晉耀紅博士認(rèn)為,在現(xiàn)階段自然語(yǔ)言處理存在重計(jì)算輕語(yǔ)言的傾向,這是比較片面的。因?yàn)镹LP的研究對(duì)象是語(yǔ)言,所以不能脫離語(yǔ)言談NLP,而必須基于語(yǔ)言知識(shí),同時(shí)利用計(jì)算機(jī)技術(shù)來(lái)進(jìn)行NLP的處理。
  語(yǔ)法的作用
  我打小明。
  狼吃羊。
  網(wǎng)易收購(gòu)Daydream公司。
  動(dòng)詞前面的主語(yǔ)是“我”、“狼”、“網(wǎng)易”是動(dòng)作的發(fā)出者,是施事,主語(yǔ)后的賓語(yǔ)“小明”、“羊”、“Daydream公司”是動(dòng)作的承受者,是受事。如果顛倒過(guò)來(lái),“小明打我”、“羊吃狼”、“Daydream公司收購(gòu)網(wǎng)易”,那么意思就完全變了。
  語(yǔ)序作為重要的語(yǔ)法手段,規(guī)定了誰(shuí)是動(dòng)作的實(shí)施者,誰(shuí)是動(dòng)作的承受者。
  語(yǔ)義的作用
  小鳥(niǎo)在天空中飛翔。
  白菜在天空中飛翔。
  第一個(gè)句子非常自然。而第二個(gè)句子雖然符合語(yǔ)法,卻讓人忍不住思考,在什么情況下,白菜才能在天上飛。這是因?yàn)?ldquo;小鳥(niǎo)”在語(yǔ)義平面上具有“飛翔”的功能,而“白菜”不具備此功能。
  語(yǔ)義歧義性是待攻克的難點(diǎn)。
  語(yǔ)用的作用
  有一個(gè)程序員出去買東西,妻子跟他說(shuō):“買五個(gè)桃子回來(lái),要是看見(jiàn)賣西瓜的,就買一個(gè)。”結(jié)果他買了一個(gè)桃子回來(lái)。妻子非常生氣。
  在這個(gè)情景里面,妻子的意思是如果看見(jiàn)賣西瓜的,就買五個(gè)桃子一個(gè)西瓜。而丈夫誤解了妻子的意思。
  誤解的產(chǎn)生及其原因是屬于語(yǔ)用平面的范疇。
  晉博士談到,泰岳AI研究院在此方面投入了大量研究精力,最新推出的非結(jié)構(gòu)化文本大數(shù)據(jù)分析挖掘平臺(tái)DINFO-OEC8.0,通過(guò)其獨(dú)有的專屬語(yǔ)義模型建設(shè)能力,能夠?qū)崿F(xiàn)語(yǔ)義消歧、語(yǔ)義歸一化/概念化,可解決非結(jié)構(gòu)化數(shù)據(jù)處理技術(shù)中語(yǔ)言表達(dá)靈活、多樣化的挑戰(zhàn)難題,精準(zhǔn)挖掘業(yè)務(wù)語(yǔ)義,提煉非結(jié)構(gòu)化數(shù)據(jù)中業(yè)務(wù)價(jià)值信息。
  計(jì)算方法是語(yǔ)言知識(shí)量化的手段和溝通橋梁
  晉博士認(rèn)為,除了語(yǔ)言學(xué)知識(shí),要對(duì)語(yǔ)言進(jìn)行全面分析,計(jì)算方法也必不可少,我們很長(zhǎng)時(shí)間內(nèi)以傳統(tǒng)的統(tǒng)計(jì)學(xué)習(xí)方法為主,進(jìn)入21世紀(jì)以后,基于詞嵌入的深度學(xué)習(xí)方法進(jìn)入了人們的視線并且迅速掀起新的浪潮。不同于之前的統(tǒng)計(jì)學(xué)習(xí),其訓(xùn)練基于淺層的、高度稀疏的特征,并且高度依賴于人工對(duì)特征的選擇。深度學(xué)習(xí)方法是基于密集向量表征做多層級(jí)的自動(dòng)特征表征的學(xué)習(xí),能夠?qū)崿F(xiàn)對(duì)特征的自動(dòng)學(xué)習(xí)。正如DINFO-OEC8.0,我們集成統(tǒng)計(jì)學(xué)習(xí)、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等關(guān)鍵自然語(yǔ)言處理技術(shù),針對(duì)泰岳自主研發(fā)的專屬語(yǔ)義模型作了進(jìn)一步創(chuàng)新與改進(jìn),集成深度學(xué)習(xí)計(jì)算能力,實(shí)現(xiàn)平臺(tái)對(duì)大規(guī)模訓(xùn)練語(yǔ)料的學(xué)習(xí)與預(yù)測(cè)。
  晉博士談到,目前在圖像識(shí)別領(lǐng)域,深度學(xué)習(xí)的識(shí)別準(zhǔn)確率達(dá)到、甚至超過(guò)了人類水平;在語(yǔ)音識(shí)別領(lǐng)域,深度學(xué)習(xí)幫助語(yǔ)音識(shí)別從實(shí)驗(yàn)室走向了商用。而在NLP領(lǐng)域,深度學(xué)習(xí)的應(yīng)用尚未有重大突破,但在文本分類、命名實(shí)體識(shí)別、詞義消歧、情感分析、機(jī)器翻譯領(lǐng)域,采用深度學(xué)習(xí)的應(yīng)用均超過(guò)了當(dāng)時(shí)的最優(yōu)方案,取得了不俗的成績(jī)。
  語(yǔ)言與計(jì)算的有機(jī)結(jié)合是NLP達(dá)到實(shí)用目標(biāo)的關(guān)鍵
  在實(shí)際應(yīng)用場(chǎng)景中,如客服熱點(diǎn)的自動(dòng)挖掘、企業(yè)關(guān)聯(lián)圖譜等,NLP的應(yīng)用經(jīng)常是多個(gè)任務(wù)協(xié)同處理,共同輸出結(jié)果。如何將語(yǔ)言知識(shí)與計(jì)算方法有機(jī)組織到一起,如何將各個(gè)NLP任務(wù)有效結(jié)合,是NLP應(yīng)用達(dá)到實(shí)用目標(biāo)的關(guān)鍵所在。
【免責(zé)聲明】本文僅代表作者本人觀點(diǎn),與CTI論壇無(wú)關(guān)。CTI論壇對(duì)文中陳述、觀點(diǎn)判斷保持中立,不對(duì)所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請(qǐng)讀者僅作參考,并請(qǐng)自行承擔(dān)全部責(zé)任。

專題