近期,小i機(jī)器人推出了新一代智能Bot開放平臺(tái),它整合了小i機(jī)器人ChattingBot、FAQBot、DiscoveryBot三大核心能力,為企業(yè)和開發(fā)者提供智能機(jī)器人服務(wù)+人工在線服務(wù)+智能人機(jī)協(xié)作學(xué)習(xí)的完整使用閉環(huán),除智能客服場景應(yīng)用外,智能營銷、智能外呼、智能硬件等多種不同類型的應(yīng)用場景也將陸續(xù)開放。
平臺(tái)開放的目的就是降低企業(yè)使用和擁有AI技術(shù)的成本與門檻,讓企業(yè)和開發(fā)者快速開發(fā)出滿足自身業(yè)務(wù)需求的智能服務(wù)系統(tǒng)或者具有智能交互能力的對話機(jī)器人。
近日,小i機(jī)器人技術(shù)委員會(huì)輪值主席兼首席架構(gòu)師李波受邀做客CSDN主編下午茶,一起探討NLP技術(shù)落地的難點(diǎn),以及如何降低開發(fā)者門檻等熱點(diǎn)話題。
NLP的發(fā)展方向
AI科技大本營:能簡單介紹下NLP技術(shù)嗎?
李波:NLP技術(shù)目前有兩種,一種是基于規(guī)則,還有一種是基于統(tǒng)計(jì)。近年來,基于統(tǒng)計(jì)的NLP技術(shù)占據(jù)了上風(fēng),特別是深度學(xué)習(xí)出現(xiàn)之后,基于統(tǒng)計(jì)的NLP技術(shù)進(jìn)展快很多。并不是說誰更優(yōu),或者誰更差,它們各有所長,比如基于統(tǒng)計(jì)的模型的泛化性比較好,但是它是一個(gè)黑盒。一些應(yīng)用還需要兩者結(jié)合使用,比如在問答系統(tǒng)中,有些機(jī)器回答并不是很友好,就可以利用基于規(guī)則的方法做補(bǔ)充,兩者結(jié)合來達(dá)到產(chǎn)品化的程度。
拋開運(yùn)算智能,人工智能主要包含兩個(gè)層面,一個(gè)是認(rèn)知智能,一個(gè)是感知智能。比如常見的語音識(shí)別、圖像識(shí)別就屬于感知智能的層面,目前比較成熟的落地應(yīng)用也比較多,而NLP則屬于認(rèn)知智能層面。NLP往往需要結(jié)合上下文信息,甚至考慮背景知識(shí)、常識(shí)性知識(shí)等。另外,感知智能(如圖片識(shí)別)的輸入輸出一般是單輪的(single-turn),但是NLP往往需要多輪的(multi-turn)交互后才能得到結(jié)果。目前NLP技術(shù)還處于發(fā)展的早起階段,還有很多難點(diǎn)需要突破。
AI科技大本營:你覺得它未來還會(huì)有很快的進(jìn)展嗎?還有哪些需要探索的方向?
李波:常識(shí)和背景知識(shí):用NLP做專業(yè)性很強(qiáng)的事情,可能效果會(huì)很好,反到是小概率簡單的事情做不到,因?yàn)槿狈ΤWR(shí)。想要解決這個(gè)問題就需要構(gòu)建常識(shí)庫,然后與模型結(jié)合,這是一個(gè)難點(diǎn),也是大家比較愿意探索的一個(gè)方向。
多模態(tài):人類是通過視覺、聽覺等各種感觀結(jié)合在一起來理解一件事情的,也就是多模態(tài)。假設(shè)NLP系統(tǒng)可以同時(shí)結(jié)合音頻和視頻來理解用戶的意圖,那么可能會(huì)有更大的突破。
預(yù)訓(xùn)練:這是近期大家可以嘗試的一個(gè)熱點(diǎn)。預(yù)訓(xùn)練在音頻和圖片領(lǐng)域已經(jīng)得到了廣泛應(yīng)用,最近Google的BERT則是把預(yù)訓(xùn)練運(yùn)用到了NLP領(lǐng)域,取得了不錯(cuò)的效果。這也是近期的一個(gè)熱點(diǎn),大家可以去嘗試。
強(qiáng)化學(xué)習(xí):在認(rèn)知智能方面,強(qiáng)化學(xué)習(xí)也有些不錯(cuò)的方向。
NLP如何走出實(shí)驗(yàn)室
AI科技大本營:學(xué)術(shù)界的成果能夠及時(shí)地應(yīng)用到工業(yè)界嗎?
李波:有些技術(shù)可以及時(shí)轉(zhuǎn)化,有些技術(shù)還需要轉(zhuǎn)化周期。這個(gè)轉(zhuǎn)化周期意思就是說,我們要考慮商用模型的性能和準(zhǔn)確率,此外還有其他的工程條件,滿足這些標(biāo)準(zhǔn)之后,才可以把研究成果輸出到產(chǎn)品。學(xué)術(shù)界訓(xùn)練一個(gè)模型只看最后的評價(jià)指標(biāo),也就是一個(gè)百分比的結(jié)果,但落地的時(shí)候考慮更多因素,比如一個(gè)準(zhǔn)確率99%的模型,但剩下1%的工程化的工作量,不一定比99%工作量小。
AI科技大本營:從實(shí)驗(yàn)室到模型商用化落地,你們最關(guān)心什么?
李波:我們最關(guān)心的首先是要模型的可用性要達(dá)到工業(yè)化落地的標(biāo)準(zhǔn),除此之外包括產(chǎn)品的UI設(shè)計(jì)、體驗(yàn)設(shè)計(jì)等也非常重要。NLP不像圖片和語音,在UI方面需要考慮的更多。比如機(jī)器翻譯系統(tǒng)的準(zhǔn)確率達(dá)到一定程度后,如果UI做得不好,用戶體驗(yàn)不好,可能會(huì)對落地造成的很大的影響。這是一個(gè)系統(tǒng)化的工程,包括成本、用戶體驗(yàn),為客戶帶來多少價(jià)值等,都需要考慮。
AI科技大本營:關(guān)于AI創(chuàng)業(yè)公司落地難的問題,小i機(jī)器人有什么好的經(jīng)驗(yàn)可以分享嗎?
李波:跟圖片和語音對比,NLP特別難,NLP涉及到的多模態(tài)是它的一個(gè)難點(diǎn)。第二個(gè)難點(diǎn)是需要結(jié)合背景知識(shí)及常識(shí)。這兩個(gè)問題在目前并沒有很好的處理方式。小i主要是結(jié)合基于規(guī)則+統(tǒng)計(jì)的方式,引入知識(shí),比如我之前提到的領(lǐng)域語義庫,目的就是融入常識(shí)和背景知識(shí)。最后就是個(gè)性化的問題,NLP的輸出往往和個(gè)體相關(guān),不同的個(gè)體需要依據(jù)人物畫像等信息給出不同的個(gè)性化的結(jié)果,這樣才更接近人類的處理方式。
此外,NLP的落地場景不是那么直接,需要結(jié)合客戶或者是產(chǎn)品設(shè)計(jì)。比如做推薦,我們訓(xùn)練模型的關(guān)注點(diǎn)可能就是模型對應(yīng)的幾個(gè)指標(biāo),比如查準(zhǔn)率等,但是客戶看的是最后推薦的效果,也就是用戶實(shí)際的評價(jià)和購買情況。因此,不管實(shí)驗(yàn)室的效果如何,在實(shí)際效果中,需要根據(jù)客戶的反饋不斷調(diào)整系統(tǒng)參數(shù),調(diào)整訓(xùn)練數(shù)據(jù),或者結(jié)合其他算法等等,以此來提高最終落地的效果。
上線運(yùn)行之后,我們還需要根據(jù)運(yùn)營的日志和客戶的行為,再迭代模型,這是一個(gè)閉環(huán)。而不是說不結(jié)合實(shí)際場景,把模型訓(xùn)練好后直接投入使用,然后就不管了,不是這回事,需要根據(jù)運(yùn)營的數(shù)據(jù),不斷調(diào)優(yōu)迭代。
AI科技大本營:模型可控性的問題怎么解決?
李波:比如我們幫客戶做的智能客服機(jī)器人,主要依靠混合模型引擎來達(dá)到可控的目的。另外也可以通過一些工程化手段來做到可控,如在問答中涉及到一些敏感的內(nèi)容,我們可以通過前處理、后處理等方式及時(shí)干預(yù),而無需更新模型、重啟系統(tǒng)。在用戶真實(shí)的使用過程中發(fā)現(xiàn)問題時(shí),我們需要有渠道、有方法控制系統(tǒng)的輸出,甚至邏輯,保證系統(tǒng)是可控的。
AI科技大本營:哪些方法可以使它可控?
李波:我們的混合模型引擎包含兩種模型,一個(gè)是黑盒子,就是深度學(xué)習(xí)模型,另一個(gè)是語義理解模型,基于傳統(tǒng)的語義表達(dá)式,可以用來做干預(yù)。語義理解模型可以直接通過語義表達(dá)式來進(jìn)行更改,而深度學(xué)習(xí)模型想要干預(yù)則必須重新訓(xùn)練。因此我們可以讓深度學(xué)習(xí)模型和語義理解模型同時(shí)作用,然后調(diào)整深度學(xué)習(xí)模型和語義理解模型的輸出策略(如優(yōu)先級策略等)來調(diào)優(yōu)。
小i機(jī)器人如何收集數(shù)據(jù)?
AI科技大本營:小i機(jī)器人是如何積累數(shù)據(jù)的?
李波:主要是三個(gè)方面:第一,我們會(huì)通過爬蟲去爬取相關(guān)的行業(yè)數(shù)據(jù)。第二,我們的云端產(chǎn)品產(chǎn)生的日志數(shù)據(jù),會(huì)直接收集到我們的數(shù)據(jù)平臺(tái)里。第三,客戶提供的素材,我們會(huì)把它轉(zhuǎn)化成數(shù)據(jù)和知識(shí)。
AI科技大本營:數(shù)據(jù)收集之后怎么處理?
李波:非結(jié)構(gòu)化數(shù)據(jù):首先我們會(huì)對收集到數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗,然后再按照知識(shí)的分類通過機(jī)器+人工方式將其歸類,再通過一些手段(如規(guī)則等)做一些粗顆粒度的標(biāo)注,之后由人工確認(rèn),確認(rèn)完后入庫。
半結(jié)構(gòu)化數(shù)據(jù):客戶提供的原始帶格式文檔,通過格式規(guī)則分析或者機(jī)器學(xué)習(xí)模型等手段來進(jìn)行分類或者聚類等輔助處理,然后再進(jìn)行人工梳理,最后入庫。
AI科技大本營:數(shù)據(jù)的處理靠機(jī)器和人工的結(jié)合?
李波:機(jī)器做前期輔助,人工做最終的確認(rèn),而不是機(jī)器處理之后直接入庫。小i有一個(gè)大的數(shù)據(jù)平臺(tái)和一個(gè)標(biāo)注系統(tǒng),還有一個(gè)實(shí)驗(yàn)室系統(tǒng),共同運(yùn)作來產(chǎn)生這些行業(yè)訓(xùn)練數(shù)據(jù)以及行業(yè)背景知識(shí),然后以領(lǐng)域語義庫的形式部署到實(shí)際系統(tǒng)中。
小i機(jī)器人如何賦能開發(fā)者?
AI科技大本營:現(xiàn)在有很多平臺(tái)和工具可以幫助開發(fā)者去降低門檻,據(jù)我所知,小i最近也推出了新一代智能Bot開放平臺(tái),這個(gè)平臺(tái)能給開發(fā)者帶來什么?
李波:幫助中小企業(yè)或者開發(fā)者快速打造一個(gè)適應(yīng)各種實(shí)際場景的AI系統(tǒng)。第一個(gè)落地的場景是智能客服,以問答能力為主,降低人工客服的成本。第二個(gè)應(yīng)用場景是智能營銷,以營銷推薦為主,包括用戶畫像等,我們會(huì)在后期推出。第三個(gè)應(yīng)用場景是智能外呼。后續(xù)我們還會(huì)推出更多的場景。開發(fā)者不僅可以直接使用這些場景,還可以基于每個(gè)場景的API來擴(kuò)充應(yīng)用的能力。
AI科技大本營:因?yàn)楝F(xiàn)在有各種各樣的平臺(tái)和工具,假設(shè)我是個(gè)新手,我就做一個(gè)小項(xiàng)目練練手,應(yīng)該怎么做?
李波:這個(gè)平臺(tái)的目的是降低開發(fā)者的門檻。開發(fā)者如果是自己收集數(shù)據(jù),然后訓(xùn)練模型,開發(fā)周期很長,而且有很多的坑要趟。我們的這個(gè)平臺(tái)有兩個(gè)目標(biāo),第一,讓用戶可以直接使用;第二個(gè),開發(fā)者可以基于這個(gè)平臺(tái)擴(kuò)充自己的能力。
使用我們的平臺(tái),開發(fā)者需要提供的數(shù)據(jù)只是問答的基本意圖點(diǎn),我們在底層有領(lǐng)域語義庫做支撐,我們會(huì)自動(dòng)在詞的層面,在句法層面幫你擴(kuò)充數(shù)據(jù)集,然后自動(dòng)幫你去訓(xùn)練。
AI科技大本營:關(guān)于NLP技術(shù)的工程實(shí)踐,您對開發(fā)者有什么建議嗎?
李波:針對NLP的開發(fā)者有幾點(diǎn)建議:首先,你要對相關(guān)技術(shù)有全面的了解,不一定要特別細(xì)化,這樣對開發(fā)會(huì)有幫助;第二,一定要明確你的輸入和輸出;最后,開發(fā)者要更多地關(guān)注產(chǎn)品體驗(yàn)。
AI科技大本營:最后,您平時(shí)都是怎樣自我學(xué)習(xí)的,有哪些經(jīng)驗(yàn)可以分享下嗎?
李波:互聯(lián)網(wǎng)是一個(gè)非常好的渠道,我比較喜歡“碰到問題后在解決問題的過程中學(xué)習(xí)“的方式。如果你只是通過書本去學(xué)習(xí),而忽略實(shí)踐,就會(huì)比較虛。因此要結(jié)合實(shí)踐,哪怕是做一些Demo嘗試也可以。在嘗試過程中遇到問題,然后通過各種方式去獲取答案,而不是像學(xué)校里的傳統(tǒng)方式去學(xué)習(xí)。