美女视频亚洲天堂,柳岩啪啪视频,韩国美女热舞福利视频

　　AI很火，但是AI的門檻也很高，普通的開發(fā)者想要搭上這波AI紅利依然困難。

　　近期，小i機(jī)器人推出了新一代智能Bot開放平臺(tái)，它整合了小i機(jī)器人ChattingBot、FAQBot、DiscoveryBot三大核心能力，為企業(yè)和開發(fā)者提供智能機(jī)器人服務(wù)+人工在線服務(wù)+智能人機(jī)協(xié)作學(xué)習(xí)的完整使用閉環(huán)，除智能客服場景應(yīng)用外，智能營銷、智能外呼、智能硬件等多種不同類型的應(yīng)用場景也將陸續(xù)開放。

　　平臺(tái)開放的目的就是降低企業(yè)使用和擁有AI技術(shù)的成本與門檻，讓企業(yè)和開發(fā)者快速開發(fā)出滿足自身業(yè)務(wù)需求的智能服務(wù)系統(tǒng)或者具有智能交互能力的對話機(jī)器人。

　　近日，小i機(jī)器人技術(shù)委員會(huì)輪值主席兼首席架構(gòu)師李波受邀做客CSDN主編下午茶，一起探討NLP技術(shù)落地的難點(diǎn)，以及如何降低開發(fā)者門檻等熱點(diǎn)話題。

NLP的發(fā)展方向

　　AI科技大本營：能簡單介紹下NLP技術(shù)嗎？

　　李波：NLP技術(shù)目前有兩種，一種是基于規(guī)則，還有一種是基于統(tǒng)計(jì)。近年來，基于統(tǒng)計(jì)的NLP技術(shù)占據(jù)了上風(fēng)，特別是深度學(xué)習(xí)出現(xiàn)之后，基于統(tǒng)計(jì)的NLP技術(shù)進(jìn)展快很多。并不是說誰更優(yōu)，或者誰更差，它們各有所長，比如基于統(tǒng)計(jì)的模型的泛化性比較好，但是它是一個(gè)黑盒。一些應(yīng)用還需要兩者結(jié)合使用，比如在問答系統(tǒng)中，有些機(jī)器回答并不是很友好，就可以利用基于規(guī)則的方法做補(bǔ)充，兩者結(jié)合來達(dá)到產(chǎn)品化的程度。

　　拋開運(yùn)算智能，人工智能主要包含兩個(gè)層面，一個(gè)是認(rèn)知智能，一個(gè)是感知智能。比如常見的語音識(shí)別、圖像識(shí)別就屬于感知智能的層面，目前比較成熟的落地應(yīng)用也比較多，而NLP則屬于認(rèn)知智能層面。NLP往往需要結(jié)合上下文信息，甚至考慮背景知識(shí)、常識(shí)性知識(shí)等。另外，感知智能（如圖片識(shí)別）的輸入輸出一般是單輪的(single-turn)，但是NLP往往需要多輪的(multi-turn)交互后才能得到結(jié)果。目前NLP技術(shù)還處于發(fā)展的早起階段，還有很多難點(diǎn)需要突破。

　　AI科技大本營：你覺得它未來還會(huì)有很快的進(jìn)展嗎？還有哪些需要探索的方向？

　　李波：常識(shí)和背景知識(shí)：用NLP做專業(yè)性很強(qiáng)的事情，可能效果會(huì)很好，反到是小概率簡單的事情做不到，因?yàn)槿狈ΤＷR(shí)。想要解決這個(gè)問題就需要構(gòu)建常識(shí)庫，然后與模型結(jié)合，這是一個(gè)難點(diǎn)，也是大家比較愿意探索的一個(gè)方向。

　　多模態(tài)：人類是通過視覺、聽覺等各種感觀結(jié)合在一起來理解一件事情的，也就是多模態(tài)。假設(shè)NLP系統(tǒng)可以同時(shí)結(jié)合音頻和視頻來理解用戶的意圖，那么可能會(huì)有更大的突破。

　　預(yù)訓(xùn)練：這是近期大家可以嘗試的一個(gè)熱點(diǎn)。預(yù)訓(xùn)練在音頻和圖片領(lǐng)域已經(jīng)得到了廣泛應(yīng)用，最近Google的BERT則是把預(yù)訓(xùn)練運(yùn)用到了NLP領(lǐng)域，取得了不錯(cuò)的效果。這也是近期的一個(gè)熱點(diǎn)，大家可以去嘗試。

　　強(qiáng)化學(xué)習(xí)：在認(rèn)知智能方面，強(qiáng)化學(xué)習(xí)也有些不錯(cuò)的方向。

　　NLP如何走出實(shí)驗(yàn)室

　　AI科技大本營：學(xué)術(shù)界的成果能夠及時(shí)地應(yīng)用到工業(yè)界嗎？

　　李波：有些技術(shù)可以及時(shí)轉(zhuǎn)化，有些技術(shù)還需要轉(zhuǎn)化周期。這個(gè)轉(zhuǎn)化周期意思就是說，我們要考慮商用模型的性能和準(zhǔn)確率，此外還有其他的工程條件，滿足這些標(biāo)準(zhǔn)之后，才可以把研究成果輸出到產(chǎn)品。學(xué)術(shù)界訓(xùn)練一個(gè)模型只看最后的評價(jià)指標(biāo)，也就是一個(gè)百分比的結(jié)果，但落地的時(shí)候考慮更多因素，比如一個(gè)準(zhǔn)確率99%的模型，但剩下1%的工程化的工作量，不一定比99%工作量小。

　　AI科技大本營：從實(shí)驗(yàn)室到模型商用化落地，你們最關(guān)心什么？

　　李波：我們最關(guān)心的首先是要模型的可用性要達(dá)到工業(yè)化落地的標(biāo)準(zhǔn)，除此之外包括產(chǎn)品的UI設(shè)計(jì)、體驗(yàn)設(shè)計(jì)等也非常重要。NLP不像圖片和語音，在UI方面需要考慮的更多。比如機(jī)器翻譯系統(tǒng)的準(zhǔn)確率達(dá)到一定程度后，如果UI做得不好，用戶體驗(yàn)不好，可能會(huì)對落地造成的很大的影響。這是一個(gè)系統(tǒng)化的工程，包括成本、用戶體驗(yàn)，為客戶帶來多少價(jià)值等，都需要考慮。

　　AI科技大本營：關(guān)于AI創(chuàng)業(yè)公司落地難的問題，小i機(jī)器人有什么好的經(jīng)驗(yàn)可以分享嗎？

　　李波：跟圖片和語音對比，NLP特別難，NLP涉及到的多模態(tài)是它的一個(gè)難點(diǎn)。第二個(gè)難點(diǎn)是需要結(jié)合背景知識(shí)及常識(shí)。這兩個(gè)問題在目前并沒有很好的處理方式。小i主要是結(jié)合基于規(guī)則+統(tǒng)計(jì)的方式，引入知識(shí)，比如我之前提到的領(lǐng)域語義庫，目的就是融入常識(shí)和背景知識(shí)。最后就是個(gè)性化的問題，NLP的輸出往往和個(gè)體相關(guān)，不同的個(gè)體需要依據(jù)人物畫像等信息給出不同的個(gè)性化的結(jié)果，這樣才更接近人類的處理方式。

　　此外，NLP的落地場景不是那么直接，需要結(jié)合客戶或者是產(chǎn)品設(shè)計(jì)。比如做推薦，我們訓(xùn)練模型的關(guān)注點(diǎn)可能就是模型對應(yīng)的幾個(gè)指標(biāo)，比如查準(zhǔn)率等，但是客戶看的是最后推薦的效果，也就是用戶實(shí)際的評價(jià)和購買情況。因此，不管實(shí)驗(yàn)室的效果如何，在實(shí)際效果中，需要根據(jù)客戶的反饋不斷調(diào)整系統(tǒng)參數(shù)，調(diào)整訓(xùn)練數(shù)據(jù)，或者結(jié)合其他算法等等，以此來提高最終落地的效果。

　　上線運(yùn)行之后，我們還需要根據(jù)運(yùn)營的日志和客戶的行為，再迭代模型，這是一個(gè)閉環(huán)。而不是說不結(jié)合實(shí)際場景，把模型訓(xùn)練好后直接投入使用，然后就不管了，不是這回事，需要根據(jù)運(yùn)營的數(shù)據(jù)，不斷調(diào)優(yōu)迭代。

　　AI科技大本營：模型可控性的問題怎么解決？

　　李波：比如我們幫客戶做的智能客服機(jī)器人，主要依靠混合模型引擎來達(dá)到可控的目的。另外也可以通過一些工程化手段來做到可控，如在問答中涉及到一些敏感的內(nèi)容，我們可以通過前處理、后處理等方式及時(shí)干預(yù)，而無需更新模型、重啟系統(tǒng)。在用戶真實(shí)的使用過程中發(fā)現(xiàn)問題時(shí)，我們需要有渠道、有方法控制系統(tǒng)的輸出，甚至邏輯，保證系統(tǒng)是可控的。

　　AI科技大本營：哪些方法可以使它可控？

　　李波：我們的混合模型引擎包含兩種模型，一個(gè)是黑盒子，就是深度學(xué)習(xí)模型，另一個(gè)是語義理解模型，基于傳統(tǒng)的語義表達(dá)式，可以用來做干預(yù)。語義理解模型可以直接通過語義表達(dá)式來進(jìn)行更改，而深度學(xué)習(xí)模型想要干預(yù)則必須重新訓(xùn)練。因此我們可以讓深度學(xué)習(xí)模型和語義理解模型同時(shí)作用，然后調(diào)整深度學(xué)習(xí)模型和語義理解模型的輸出策略（如優(yōu)先級策略等）來調(diào)優(yōu)。

　　小i機(jī)器人如何收集數(shù)據(jù)？

　　AI科技大本營：小i機(jī)器人是如何積累數(shù)據(jù)的？

　　李波：主要是三個(gè)方面：第一，我們會(huì)通過爬蟲去爬取相關(guān)的行業(yè)數(shù)據(jù)。第二，我們的云端產(chǎn)品產(chǎn)生的日志數(shù)據(jù)，會(huì)直接收集到我們的數(shù)據(jù)平臺(tái)里。第三，客戶提供的素材，我們會(huì)把它轉(zhuǎn)化成數(shù)據(jù)和知識(shí)。

　　AI科技大本營：數(shù)據(jù)收集之后怎么處理？

　　李波：非結(jié)構(gòu)化數(shù)據(jù)：首先我們會(huì)對收集到數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗，然后再按照知識(shí)的分類通過機(jī)器+人工方式將其歸類，再通過一些手段（如規(guī)則等）做一些粗顆粒度的標(biāo)注，之后由人工確認(rèn)，確認(rèn)完后入庫。

　　半結(jié)構(gòu)化數(shù)據(jù)：客戶提供的原始帶格式文檔，通過格式規(guī)則分析或者機(jī)器學(xué)習(xí)模型等手段來進(jìn)行分類或者聚類等輔助處理，然后再進(jìn)行人工梳理，最后入庫。

　　AI科技大本營：數(shù)據(jù)的處理靠機(jī)器和人工的結(jié)合？

　　李波：機(jī)器做前期輔助，人工做最終的確認(rèn)，而不是機(jī)器處理之后直接入庫。小i有一個(gè)大的數(shù)據(jù)平臺(tái)和一個(gè)標(biāo)注系統(tǒng)，還有一個(gè)實(shí)驗(yàn)室系統(tǒng)，共同運(yùn)作來產(chǎn)生這些行業(yè)訓(xùn)練數(shù)據(jù)以及行業(yè)背景知識(shí)，然后以領(lǐng)域語義庫的形式部署到實(shí)際系統(tǒng)中。

　　小i機(jī)器人如何賦能開發(fā)者？

　　AI科技大本營：現(xiàn)在有很多平臺(tái)和工具可以幫助開發(fā)者去降低門檻，據(jù)我所知，小i最近也推出了新一代智能Bot開放平臺(tái)，這個(gè)平臺(tái)能給開發(fā)者帶來什么？

　　李波：幫助中小企業(yè)或者開發(fā)者快速打造一個(gè)適應(yīng)各種實(shí)際場景的AI系統(tǒng)。第一個(gè)落地的場景是智能客服，以問答能力為主，降低人工客服的成本。第二個(gè)應(yīng)用場景是智能營銷，以營銷推薦為主，包括用戶畫像等，我們會(huì)在后期推出。第三個(gè)應(yīng)用場景是智能外呼。后續(xù)我們還會(huì)推出更多的場景。開發(fā)者不僅可以直接使用這些場景，還可以基于每個(gè)場景的API來擴(kuò)充應(yīng)用的能力。

　　AI科技大本營：因?yàn)楝F(xiàn)在有各種各樣的平臺(tái)和工具，假設(shè)我是個(gè)新手，我就做一個(gè)小項(xiàng)目練練手，應(yīng)該怎么做？

　　李波：這個(gè)平臺(tái)的目的是降低開發(fā)者的門檻。開發(fā)者如果是自己收集數(shù)據(jù)，然后訓(xùn)練模型，開發(fā)周期很長，而且有很多的坑要趟。我們的這個(gè)平臺(tái)有兩個(gè)目標(biāo)，第一，讓用戶可以直接使用；第二個(gè)，開發(fā)者可以基于這個(gè)平臺(tái)擴(kuò)充自己的能力。

　　使用我們的平臺(tái)，開發(fā)者需要提供的數(shù)據(jù)只是問答的基本意圖點(diǎn)，我們在底層有領(lǐng)域語義庫做支撐，我們會(huì)自動(dòng)在詞的層面，在句法層面幫你擴(kuò)充數(shù)據(jù)集，然后自動(dòng)幫你去訓(xùn)練。

　　AI科技大本營：關(guān)于NLP技術(shù)的工程實(shí)踐，您對開發(fā)者有什么建議嗎？

　　李波：針對NLP的開發(fā)者有幾點(diǎn)建議：首先，你要對相關(guān)技術(shù)有全面的了解，不一定要特別細(xì)化，這樣對開發(fā)會(huì)有幫助；第二，一定要明確你的輸入和輸出；最后，開發(fā)者要更多地關(guān)注產(chǎn)品體驗(yàn)。

　　AI科技大本營：最后，您平時(shí)都是怎樣自我學(xué)習(xí)的，有哪些經(jīng)驗(yàn)可以分享下嗎？

　　李波：互聯(lián)網(wǎng)是一個(gè)非常好的渠道，我比較喜歡“碰到問題后在解決問題的過程中學(xué)習(xí)“的方式。如果你只是通過書本去學(xué)習(xí)，而忽略實(shí)踐，就會(huì)比較虛。因此要結(jié)合實(shí)踐，哪怕是做一些Demo嘗試也可以。在嘗試過程中遇到問題，然后通過各種方式去獲取答案，而不是像學(xué)校里的傳統(tǒng)方式去學(xué)習(xí)。