中文字幕无码久久精品,13—14同岁无码A片,99热门精品一区二区三区无码,菠萝菠萝蜜在线观看视频高清1

您當前的位置是:  首頁 > 資訊 > 文章精選 >
 首頁 > 資訊 > 文章精選 >

WAIC·開發(fā)者日|竹間智能CEO簡仁賢談NLP落地修煉之道

2020-07-13 09:53:46   作者:   來源:CTI論壇   評論:0  點擊:


  7月11日,2020WAIC·開發(fā)者日特設「構建AI基礎設施」分論壇,邀請包括華為、騰訊、竹間智能、京東云等業(yè)內多家企業(yè)專家共同探討這一話題。竹間智能CEO&創(chuàng)始人簡仁賢將以《“懂語言者得天下”NLP落地修煉之道》為主題,分享新基建建設及企業(yè)數(shù)字化、智能化轉型新思路。
  以下分享分論壇演講實錄
  分論壇實錄
  大家都知道自然語言處理是人工智能里的掌上明珠。人工智能主要包含視覺、語音跟自然語言處理,而其中NLP自然語言處理是其中最難的部分,我相信大家都已經認同。那么視覺跟語音的發(fā)展也已經經過了一段時間,技術也相對比較成熟,場景也比較固定。
  那么自然語言理解的場景有多么浩瀚?自然語言理解需要處理的問題有多少呢?我們如何把自然語言理解結合人工智能的技術,在行業(yè)里去落地,通過行業(yè)應用的場景能夠產生更多的價值,這個是我們今天要來探討的問題。
  竹間智能從2015年成立到現(xiàn)在的5年里,一直以自然語言為核心,以情感計算為基礎,打造流暢的人機交互,追求有溫度的交互機器人,來解決人跟機器溝通的問題。不僅如此,我們也在解決人機協(xié)作的問題。竹間將自然語言處理技術應用到解決非結構化數(shù)據(jù),也就是從文本分析的范疇,把人機交互溝通、協(xié)同的問題,也同時運用到業(yè)務自動化,流程自動化,解決業(yè)務上的問題,提供更好的端到端的服務。所以自然語言理解、情感計算是竹間智能的兩大主軸。
  近5年來竹間一直在沉淀和積累行業(yè)的場景,今天來跟大家分享一下自然語言理解如何去落地。以前我的老上司沈向洋博士曾講過一句話:“懂語言者得天下”就是說未來的世界里面,不論是生活,工作或是娛樂,各個方面會有語言來輔助。不管這個語言是人跟人溝通的語言,還是人跟機器的溝通的語言,或者是未來幻想中一個機器跟機器溝通的語言,語言會成為一個人類生活層面的操作系統(tǒng),所以懂語言者得天下,如果能夠將語言了解透徹,就能幫助人類在言語的溝通上起到協(xié)同和賦能的作用。
  竹間在過去5年來,已經把自然語言的這些技術應用到各行各業(yè),沉淀下來非常多的場景,并把場景轉化成了產品和平臺,把產品做成平臺,把平臺當作產品。目的是幫助企業(yè)把NLP應用更快落地,更安全、更順暢、更低成本、更高效率。依靠竹間Bot Factory™這樣的產品平臺沉淀了數(shù)百個標桿客戶,5年來不斷的以自主研發(fā)的自然語言理解跟情感計算的技術和知識工程技術為基礎,搭建出平臺,讓機器人真的能夠看得懂,聽得懂,讀得懂,也能夠去解決所有的人的業(yè)務的問題。竹間智能一直以來的愿景:
  Emotional Robot for everyone,
  every business,and every smart device
  所以我們是來連接人、商業(yè)和終端三個為一體的一個環(huán)節(jié),來做情感機器人,能夠賦能于人類生態(tài)。
  把握NLP的契機
  今天要跟大家講的是如何在人的生活當中去找到NLP的契機,對于企業(yè)來講,我們如何去賦能企業(yè)來幫助個人生活得更好、更便利、更有效。
  企業(yè)內普遍存在以下難點,第一,營銷獲客,企業(yè)能夠獲客,能夠有新的業(yè)務才能生存,才能提給客戶更好的服務。
  第二點,提高服務的質量。有了新客戶,如何去服務已有客戶進行留存和轉化,則需要提供更好的體驗,讓企業(yè)能夠有持續(xù)性的商機,讓客戶享受到更好,更值得的高質量服務。那么還有最核心的一點是企業(yè)要減少人力成本,加上今年疫情給大家?guī)淼囊粋思考,就是:未來如何在各個環(huán)節(jié)減少人力的壓力,進而減少用工成本?通過技術來降低用工成本和壓力。未來世界其實將會減少接觸。更少的接觸,不代表沒有社交,社交當然必不可少,所以需要社交距離,但是能不需要接觸的時候,就要盡量避免。
  比如說要繳費,一定要去網點繳嗎?要辦信用卡一定要去網點辦嗎?如果辦信用卡通過電話,機器人能否幫助客戶自動解決這些繁瑣的事情。以這些契機,未來可以落地到哪些場景來幫助人類真正提供有價值的服務?其中很重要的一點,要解決人與人溝通、交互的問題,它靠的是語言,所以我們必須要把人類的語言懂透、摸透,通過計算機語言,把語言變成一個可計算的東西。這門學科非常窄,但卻是最高深的一個學科,因為它不但要了解人的心理,還要了解語言學,還要了解人機交互,三門非常重要的技術學科,了解這三項之后,你才能夠真的稱得上能夠懂計算機語言。我們講情感計算模型,就是建立在心理學交互的模型上,需要把語言學和情緒情感融入到最先進的人工智能,才能稱得上是懂交互的。交互不僅是觸屏這么簡單,語音的交互只是一個感官的交互,眼睛看到圖像也是感官的交互,圖片并不會跟你對話。真正的交互應該是相互的過程,是動態(tài)的。人類的大腦里面在想的,當他講一句話的時候,他的context是什么?他的情緒是什么?這是非常重要的,所以需要把計算機語言、自然語言處理跟心理學融合在一起,才有辦法達到真正的交互。這條路需要非常多的努力。
  NLP未來關鍵技術點
  單從NLP的角度來看,那么自然語言處理的技術難點有哪些?這是竹間做了5年,我個人做了20多年來的總結的一些經驗,以前還有很多技術難點,我們在一一克服之后,隨著技術不斷發(fā)展又會有新增的技術難點,當然也越來越有挑戰(zhàn)性,并且越來越有價值。第一點,少樣本零樣本的學習。這是目前這兩三年來預訓練模型的崛起,讓大家能夠開始去思考的問題,能不能用更少量的樣本和數(shù)據(jù)進行訓練達到預訓練,未來能讓語言模型更通用。所以這是一個挑戰(zhàn)方向,待大家共同努力減少學習樣本,讓模型交互的模型更豐富,能夠更快的去完成訓練。第二點,預訓練模型的壓縮。當然大家知道預訓練模型它需要的dimension非常廣,需要的數(shù)據(jù)就非常多,搭建出的模型也非常大,如何盡量壓縮,如何能夠超越Bert,做到比Bert更小,訓練速度更快,所需樣本更少?這樣的一個模型,是要靠大家融入各個方面的經驗進行優(yōu)化迭代。
  第三點,是很重要的一點,即自然語言處理是在處理人的語言,缺少了知識,認知,包括常識。以前做詞向量,做句向量,把詞變成一個向量,用向量來計算,這里面是缺少知識和常識,更沒有上下文的分析,F(xiàn)在的技術中慢慢開始加入上下文的解析,但僅憑上下文還是沒有邏輯性的,缺少了知識和常識的NLP,沒有認知交互在,就沒有辦法達到有意義的交互。那么很重要的一點,竹間的核心就是做多模態(tài),多模態(tài)的計算,要把情緒再加入交互,把語音、語義、圖像,人的眼睛能看的,耳朵能聽的,腦袋能思考的,嘴巴可以說的都融合起來做多模態(tài)的交互。有些時候不需要語言,用眼睛交互,有些時候不需要語言,用表情交互,喜怒哀樂用在各個不一樣的場景,有些時候通過聲音的相應的語調識別情緒,當然情緒識別不僅僅是識別語調聲音,所以需要把這些融合成為多模態(tài),這是最困難的部分,也是我們最終要達到的目的。能夠仿真人能夠達到多模態(tài)的交互,加上有認知的交互,加上有情感的交互,才是我們做人機交互的最終的一個目標。今天大家在做的詞向量也好,Bert也好,語義的理解都是一個步驟,要達到一個多模態(tài)不能做完語義理解再去做,一定要同時間結合整個文化發(fā)展、經濟發(fā)展、人類歷史發(fā)展的腳步去學習,是一個累積的過程。自然語言生成是非常重要的,人的語言是有邏輯性的,不是深度學習模型不可控的去隨便生成一句話,也不是靠大量互聯(lián)網的語料撈一個句子來進行對話,否則就會沒有邏輯可言。所以能不能生成自然語言,需要進行有邏輯性的交互。當然你有可能在進行閑聊,閑聊就沒有邏輯性,是情感性,情感也是一種邏輯,人類rational、emotion,這兩項都加入到自然語言生成NLG的部分,那么這樣的自然語言的生成才是能夠達到完整的人機對話。很重要的一點,知識的發(fā)現(xiàn)跟推理在交互里面是非常重要的。交互里如何去Auto discover一個knowledge,新的實體,新的知識,在這個知識上進行交互,這個叫contextual,也就是上下文如何去識別如何去提取。需要理解,實體的自然發(fā)現(xiàn),知識的自動發(fā)現(xiàn),累積起來,才能夠解決上下文的問題。上下文不是只有指代消解,更重要的是知識,知識可能有多個實體多個屬性在里面,對話里的上下文它還要解決自動去發(fā)現(xiàn)知識,自動去發(fā)現(xiàn)對話里的信息,達到順暢的上下文的交互,自然就形成了所謂的多輪交互。所以現(xiàn)在的對話交互是基于認知AI、情感AI,基于雙向的交互性AI,需要達到contextual上下文各個信息的理解,才能進行Compose text,這叫做Goal-oriented dialogue,Goal-oriented conversation。每一個gonversation還是一個goal,所有要解決的一個交互都是要解決一個goal,可能當中需要完成多個goal才能達到一個交互。
  所以除此之外很重要的一點,在深度學習里會碰到的一個問題就是模型越復雜,越不可控,也可以說超出了可控范圍。通過什么方式能保證人工智能技術交互技術是可控的呢?需要做到一點,在交互的時候得到的信息,識別到的知識等所有的實體都是可解釋的。機器從哪里學來的?怎么學的,學到了什么?可解釋,才可控。Humanity for AI最終要保護人類,不是傷害人類。It is to help human to live better,所以很重要的一點,機器學習的數(shù)據(jù)、語料、文本、圖像是不是都是可解釋的。
  那么接下來我探討語義解析的難點怎么樣去解決。很重要的一點就是場景,有了場景我們才能夠把自然語言處理進行應用去發(fā)揮價值,在運用到場景里也產生更多的數(shù)據(jù)反哺。那么如何去實踐復雜的場景?比如:逾期的提醒、快遞的寄送、問卷的回訪,我們自己做過幾百個不同的場景,每一個場景,要分析各個不同層面的技術來解決。那么類腦的語言的解析層,人的大腦有超過十幾億的神經元agent,每一個agent都代表一個工作,如何去拆分成最小的單位去解析,然后理解。包括上下文的理解、知識的推理、指代消解等非常多,數(shù)十個不同的小的components去解決。那么還有底層的算法,包括internet、分詞、詞性、NER、關鍵詞、依存句法分析、語義句法分析、語義角色標注的部分等等,數(shù)十個語言學的模塊,能不能通過AI去完完全全,一個一個的用最新的機器學習跟深度學習的方法構建出來,綜合語言學的部分,這是語義解析的一個難點。舉個簡單的例子,“購票成功,但是不出票怎么辦?”這句話的意圖很簡單:我想要知道我的票已經買了,但是不出票,這需要怎么解決?但是如果中間有一點不同,比如說:“我購票成功,但是取不出票怎么辦?”不出票跟取不出票差一個字差別卻很大,取不出整體是一個動詞,不是取/不出,中文的部分沒有空格,所以需要解決很重要的一個分詞的問題。一般市面上的分詞工具基本都解決不了這個問題,無法分辨“不出票”和“取不出票”。那這樣的問題需要如何解決?累積非常多的行業(yè)數(shù)據(jù),還要跨行業(yè)地去解決,所以要有眾多的數(shù)據(jù)跟眾多的模型搭建,才能在一個語音引擎里讓解析變得更通用,碰到這樣的問題才能理解說話者真正的語意是什么。其實這個是非常難攻克的一個問題,竹間現(xiàn)在已經攻克了。
  舉個例子:上海話中“我不要太喜歡你這雙鞋子”一般的分詞或者是翻譯器都會翻譯成I don't like this shoe too much。但這句話的正確含義其實是:我太喜歡這雙鞋子了,這就是為什么無法理解語言的真正含義進行翻譯,這樣的語料沒有辦法產生一個非常精確的可解釋的路徑。
  還有一點是,如何加入認知的部分,加入人類知識、計算的部分?我們的人腦是可以進行邏輯計算的,我一個月用1萬塊,那么一年就會用12萬。但是目前一般的語義對話聊天機器是完成不了計算的,如何把實體數(shù)字與常識知識融合在一起,讓整個引擎可以進行計算?舉一個例子,申請信用卡、申請貸款,或者是申請保險時,那么保險公司或者貸款公司,會需要進行風險評估,對收入進行詢問,如果你回答了:我月薪2萬,我老婆是個課程顧問,一年收入也在20萬左右。那么到底你們家收入是多少?一般的分詞分不出來的,因為這里面有什么呢?首先涉及多類型的NER的抽取,一個月2萬,還有一年20多萬,能不能去解析這20多萬是年薪,2萬是月薪?再進行總和,這就是機器模型要去完成的。那句話中還包含這樣一個信息“我老婆是課程顧問”。所以那句話中包含兩個實體,“我”跟“我老婆”中間還有relation,當然relationship是配偶關系,能不能把這個信息頁也抽取出來,就可以構建有知識的influence,再加上computation可以計算出家庭年收入是2萬×12+20萬=44萬。得出的結果再傳到風控系統(tǒng)中進行評估,評估結果再通過機器人傳達給客戶。這個叫做人機對話,接入企業(yè)的內部的計算系統(tǒng),達到一個complish一個test一個goal,這是最經典的一個例子,看似簡單其實非常難實現(xiàn)。這不僅僅是一個閑聊機器人或者一個語音助手,需要具有認知、常識、計算、語言學,通過整個contextual理解,才能獲取即使只有3個字亦或30個字里的真實信息和意圖。如何把對話信息都準確抽取,就是現(xiàn)在需要完成的最重要的工作,而竹間現(xiàn)在已經能達成不錯的效果,未來還會繼續(xù)努力去突破更多更難的語義問題。
  語義解析中還有一個難點,舉個簡單易懂的例子:“開通手機銀行就能繳燃氣費嗎?怎么開通?怎么繳?”這樣一個問句中“開通手機銀行能交燃氣費嗎”這是一個常用問答——Frequently Asked Questions即FAQ,但是句子中緊接著“怎么開通?怎么繳?”包含兩個意圖:第一,怎么去開通手機銀行;第二,怎么去繳燃氣費?所以在這個句子中包含一個常用問答和兩個意圖。所以機器人需要解決三件事情,首先要去提取關鍵信息,手機銀行是一個關鍵信息,燃氣費是一個關鍵信息,開通繳費是一個關鍵信息,通過組合后,進行多意圖解析,再根據(jù)事件邏輯跟后臺系統(tǒng)對接,并進行回答,還可以通過推薦問進行引導,與用戶連續(xù)對話進而解決用戶的問題,這樣就可以形成一個完美豐富的服務閉環(huán)。所以多意圖多實體,信息抽取這一門學科已經發(fā)展了幾十年,直到現(xiàn)在我們還在繼續(xù)優(yōu)化它。Information mining、Information retrieval這些傳統(tǒng)的文本分析、文本處理的技術,竹間今天用人工智能來實現(xiàn)。
  竹間智能646戰(zhàn)略
  最后向大家介紹一下竹間的三大支柱——“646戰(zhàn)略”。包含竹間的6大的核心技術,這是我們一直在聚焦的方向;4大核心產品平臺,是5年來打磨的成果,它既是一個平臺,也是一個產品;在6大行業(yè)里,竹間已經建立跨行業(yè)領域的合作。
  6大技術方向包含自然語言處理、知識工程、深度學習&AutoML、文本數(shù)據(jù)中臺、視覺計算、語音識別,集成在竹間的Bot Factory™平臺。竹間所有內部開發(fā)和客戶定制開發(fā)都是基于自動化的機器學習平臺上進行的,包含F(xiàn)inetuning,Pre-train等各式各樣不同的模塊,才能夠做到零代碼開發(fā)。二次開發(fā),客戶也可以使用自己開發(fā)好的模型代替我們自建的模型,所以整個Bot Factory™它是一個非常強大的模塊、引擎,當然也包含了龐大的NLP的技術模塊在里面。而文本數(shù)據(jù)中臺是解決企業(yè)里長文本分析應用,視覺計算也是竹間累積近5年的人臉的表情,情緒情感識別技術,像口罩識別、活體識別等應用。語音辨識是竹間除了語義之外非常擅長的部分,現(xiàn)在竹間的ASR和TTS技術已經向科大訊飛、阿里看齊。竹間把語音和語義技術結合,形成全雙工全場景AICC解決方案。
  那么由這6個技術,我們在這幾年來的沉淀出來4個平臺,Bot Factory™的平臺,能夠零代碼一鍵部署,能夠讓用戶不用寫代碼,就可以創(chuàng)建機器人。在某些跨行業(yè)領域里,竹間的機器人已經可以達到零啟動的水平,也就是不需要訓練,準確率可以達到80%以上,那么再加上后期的語料訓練和實際的運行準確率可以提升至95%甚至于97%。
  AICC是竹間的AI Contact Center TotalSolution,賦能于企業(yè)的Callcenter,比如說跟竹間合作的Avaya,我們把AI技術放到Callcenter里去,現(xiàn)在竹間在Callcenter里有八大不同的產品,AICC的產品包括智能客服,AI質檢,輔助坐席,陪練機器人,培訓,用戶畫像分析,還有營銷的分析,整個形成AICC的全方位解決方案,那么把語音跟語義再融合,我們是一個全場景的AICC解決方案,再加上我們的語音、語義、圖像的Total Solution,那么企業(yè)就不需要再找另外不同的AI廠商再去做非常復雜的集成了,這就是竹間能夠提供一個什么?一站式的企業(yè)級的人工智能平臺,這個平臺里面是由4個平臺組成的。
  還有NLP的平臺,它不僅僅是NLP的API,它更是一個NLP的Operatingsystem,企業(yè)客戶及端客戶需要做NLP二次開發(fā)的,可以部署這套系統(tǒng),這套系統(tǒng)能夠讓企業(yè)去進行數(shù)據(jù)處理、訓練、運維、測試跟上線,NLP平臺的27個模塊能夠幫助企業(yè)去做比對,完成校稿、審稿等很多業(yè)務。
  竹間的Gemini平臺,它是一個更強的認知型的平臺,Cognitive engineering的平臺,通過自動化來構建知識圖譜,擁有龐大的語義解析能力,有OCR能力,有image的能力,能夠去解析非結構化數(shù)據(jù),它有一個自動處理的pipeline,能夠做屬性的自動挖掘,實體的自動挖掘,模型的Finetuning,能夠自動發(fā)現(xiàn)實體跟屬性,構建知識圖譜。那么它不僅僅是構建知識圖譜,它是一套整套的技術平臺,也就是說整套的技術平臺可以license給到企業(yè),讓他們用這個技術平臺去自動構建知識圖譜,而不需要用人工去構建知識圖譜,F(xiàn)在傳統(tǒng)的知識圖譜的一些廠商,他們是以人工通過一個個的實體連接創(chuàng)建知識圖譜,這不屬于自動化。而竹間的Gemini是可以通過自動化創(chuàng)建知識圖譜,它可以通過解析100萬個的文檔,200萬個文檔構建一個知識圖譜,也可以給它預先定義的詞庫,預先定義的knowledge,它也會自動Auto discovery,發(fā)現(xiàn)屬性發(fā)現(xiàn)實體,那么可以形成一個人機交互,它做不出來東西再進行人工干預,所以它是一個自動化,構建知識圖譜的工程,也有inference的引擎在里面,還有一個很強大的process引擎在里面,可以處理所有流程自動化的問題。
  這4大產品平臺是我們累積6個技術在6個行業(yè)里過去5年內沉淀下來,包括金融行業(yè),智能終端行業(yè),像智能手機,包括傳統(tǒng)行業(yè)、互聯(lián)網行業(yè)、醫(yī)藥醫(yī)療,還有教育行業(yè)6大行業(yè),比如說銀行類的,有北京銀行、建設銀行等等,還有AIoT華為、OPPO,還有優(yōu)必選、科沃斯,央企的客戶有華潤、招商局輪船、中廣核等等,竹間幫他們落地了很多不用場景,有幾十個不同的應用。那么這些年來我們也非常感謝能夠跟數(shù)百個標桿企業(yè),包括很多這些行業(yè)里面數(shù)一數(shù)二的大型企業(yè)。今年在整個疫情爆發(fā)之后,更多的企業(yè)用戶已經開始要采用NLP的這些場景了,所以NLP的產業(yè)是在復蘇。我相信NLP會是比視覺產業(yè)跟語音產業(yè)大上上百倍甚至于上千倍的一個產業(yè),在未來的十年二十年里,它會是人類交互的一個operatingsystem的主要核心技術。
 
【免責聲明】本文僅代表作者本人觀點,與CTI論壇無關。CTI論壇對文中陳述、觀點判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。

相關熱詞搜索: 竹間智能 簡仁賢 NLP

上一篇:人工智能予力永續(xù)未來

下一篇:最后一頁

專題

CTI論壇會員企業(yè)