胡郁在現(xiàn)場發(fā)表演講
訊飛聽見為大會嘉賓演講提供實時的語音轉(zhuǎn)寫
此次GMIS 2017大會邀請到了來自美國、歐洲、加拿大及國內(nèi)的眾多頂級專家參會,包括國內(nèi)外各頂尖高校和研究機構(gòu)的相關(guān)負責人,以及來自科大訊飛、微軟、英特爾、英偉達、亞馬遜、騰訊、今日頭條、螞蟻金服、第四范式等國內(nèi)外行業(yè)產(chǎn)業(yè)專家。在機器之心「AI00」頒獎晚宴上,科大訊飛成為“語音和自然語言領(lǐng)域”獲獎企業(yè)之一。
頒獎現(xiàn)場
以下為胡郁在GMIS2017大會現(xiàn)場演講的內(nèi)容:
謝謝俞凱,非常高興今天是俞凱主持,因為我跟俞凱我們原來都是做語音的,而且我們現(xiàn)場還有位非常有名的鄧力老師,從語音到人工智能包括到最新的我們看到一個新的詞叫機器智能。前天在貴陽的數(shù)博會上,馬云有一個題為《數(shù)據(jù)創(chuàng)造價值創(chuàng)新驅(qū)動未來》的演講,我當時對馬總提問:“機器智能和人工智能到底區(qū)別在什么地方”,這個當時有一個理解,就是說人工智能還是模仿等等能力,但是機器能夠超越人的能力,這東西當然有一點小小的角度的差別。
但今天我上午來的時候碰到趙云峰(注:機器之心創(chuàng)始人),大家都知道機器之心今天這個會也非常的棒。趙云峰告訴我說這個機器智能,他們很早之前就開始提了,所以我覺得從這個角度上來講,其實我們對智能的一些理解和概念是在不斷往前發(fā)展的,我覺得這是很好的事情。雖然數(shù)博會上的討論當時在座的很多的人也沒有搞清楚什么是機器智能和什么是人工智能,但是我相信隨著技術(shù)不斷進步,有一個趨勢是不可改變的,就是什么呢?就是機器一定會有越來越多的驚喜帶給我們。我們走在這個路上。今天我的演講還是非常希望能夠帶一些新的觀點給大家。
那么首先講一下,我最近看了一本書,這本書里面就講到了不管是機器智能還是人工智能是在什么樣的環(huán)境中生長起來的。我們都知道在宇宙誕生以后,我們其實產(chǎn)生了一個叫做自然宇宙的東西,就是宇宙大爆炸,但這個自然宇宙一直很孤單,就里面只有星球這個宇宙,大家都知道自然宇宙里面經(jīng)過很長時間的發(fā)展,我們講到地球上,大概40億年前地球形成,然后有了生命,生命慢慢進化到人類,其實產(chǎn)生了一個新的東西。當有動物和人類以后產(chǎn)生了一個精神世界,但是到這個時候其實跟我們講的人工智能還沒有任何的關(guān)系。在1946年人類第一臺的數(shù)字計算機發(fā)明以后,就產(chǎn)生了一個新的宇宙,這個宇宙叫數(shù)字宇宙。因為我認為不管哪一種的智能也好,它要有一個生長的環(huán)境,而我們看到的人類的智能是在自然運動里面產(chǎn)生的,但是經(jīng)過了這么多年,在數(shù)字與宇宙里面的人工智能,如果比較一下這個時間的話,你會發(fā)現(xiàn)實在是太短。
在這個過程中,大家都知道1956年達特茅斯會議,但是最早提出數(shù)字宇宙里面的生命可能產(chǎn)生智能的討論,應(yīng)該是馮諾依曼和圖靈。但是非常可惜,他們兩個都英年早逝,一個1954年就去世了,一個1958年就去世了。我們看到的圖靈獎包括很多方面,是為了紀念他們設(shè)立的,包括我們現(xiàn)在的馮諾依曼計算機的體系結(jié)構(gòu)。人工智能的發(fā)展是有規(guī)律的。剛出生的時候機器最擅長的就是什么呢?運算和存儲。這兩天雖然柯潔輸給了我們的AlphaGo,但是就像剛才楊強老師說的,人類并不因為我們在圍棋上輸給了一個機器,就顯得我們?nèi)祟愔悄懿恍辛耍@是因為其實下圍棋在機器看來純粹是一個運算和存儲的事情,雖然這中間用了很多新的技術(shù),但是并不能改變這個事實。所以說從運算的角度,如果我把它叫做運算智能的話,一開始我們?nèi)祟惥褪锹浜笥跈C器的。
但是在另外兩個方面,這是我最近在思考的一個問題,就是我們經(jīng)常說的人類和動物都有的智能,在感知智能和運動智能上機器追趕人類還是比較快的。但是我今天特別想講一下運動智能,我們很多人都非常關(guān)注感知智能,比如說語音的識別、圖像的識別,但是可能大家沒有想到的是我們在運動智能上其實離動物都還差得很遠,為什么這么說呢?因為動物和人類的運動,我們的神經(jīng)系統(tǒng)和我們的肌肉的控制系統(tǒng)其實是一個完美的整體,他們之間通過一種我們現(xiàn)在還不知道的工作方式進行有效的工作。
比如說我們?nèi)祟,如果我們要抓住一個在空中飛行的網(wǎng)球或者籃球,我們根本不需要計算這個網(wǎng)球和籃球在空中飛行的位置和速度,通過一種反饋系統(tǒng),通過在訓(xùn)練過程中得到的記憶,我們就能把這個球抓住。而現(xiàn)在機器人是怎么做的呢?機器人還是用運算智能的方法,機器人基本上都要算出它的速度和位置,所以說其實在運動智能上,我認為現(xiàn)在機器和人類差距還是很大的,而這一點是將來機器人產(chǎn)業(yè)發(fā)展的一個非常重要的點,F(xiàn)在大家都知道我們在機器人領(lǐng)域主要用的還是控制論,這些是原來在信息處理領(lǐng)域的方法;還比較少的是用深度神經(jīng)網(wǎng)絡(luò),包括剛才楊強老師介紹的很多學(xué)習(xí)的方法,而這個是人類的方法,我認為在這一點在運動智能方面我們還有非常大的潛力。
我們講認知智能是因為人類有了語言,幫我們區(qū)別于動物,估計大家都知道了。因為語言能夠更好的描述世界,能夠更好的幫助我們進行溝通,能夠產(chǎn)生概念,那么有語言到后來的包括理解知識、表達邏輯推理成為我們現(xiàn)在認知智能攻克的一個重點。那么如果從這張圖上來看,其實我們可以看到一個過程就是機器在運算智能上是天生的比人類強,但是在感知智能和運動智能上正在快速的追趕人類。我對運動智能其實是抱有很大的期望的,因為我認為如果運動智能不能夠解決的話,大家所夢想的在家里面能夠幫你打掃衛(wèi)生,在外面能夠在工地上直接蓋樓的這種機器人,其實他們是很難被做出來、或者是被大規(guī)模低成本的推廣的。當然了,我們最后需要的克服的是認知智能。
那么第二個方面我想講一下,在什么樣的情況下才能促進產(chǎn)業(yè)的發(fā)展。我們都知道整個智能發(fā)展的三次浪潮,我這邊只想講一個結(jié)論,就是我覺得中國確實非常幸運,在第一次浪潮的時候基本上跟中國沒有什么太大的關(guān)系,為什么?因為那個時候國家還沒有這樣的條件和基礎(chǔ);在第二次浪潮的時候,中國通過863計劃儲備了一批技術(shù)人員和科研成果;第三次浪潮的時候我們都知道,中國的移動互聯(lián)網(wǎng)大數(shù)據(jù)和現(xiàn)代通訊技術(shù)的行業(yè)技術(shù)已經(jīng)建立了,保證了在人工智能領(lǐng)域、在全球只有中美同時具備了在科學(xué)技術(shù)和產(chǎn)業(yè)基礎(chǔ)方面兩大奠基的角色。
現(xiàn)在,人工智能在全球范圍內(nèi)的爭奪在中美兩國之間進行。在過去這一段時間中,我們看到了深度神經(jīng)網(wǎng)絡(luò)大數(shù)據(jù)和漣漪效應(yīng),就是利用互聯(lián)網(wǎng)的方法不斷的改進我們的系統(tǒng),這地方我對楊強老師剛才講的內(nèi)容非常地贊同。
我記得在15年的時候,我跟楊強老師第一次登臺,楊強老師就定義過什么叫弱人工智能、什么叫強人工智能,F(xiàn)在做的工業(yè)上的人工智能還都是弱人工智能,楊強老師講的遷移學(xué)習(xí),我覺得是從弱到強人工智能的逐步改進。但現(xiàn)在在工業(yè)界里面,我們現(xiàn)在主要用的還是這些弱人工智能學(xué)習(xí)的方法。今天大家看到的語音識別、自然語言理解取得了很快進展,是我們在深度神經(jīng)網(wǎng)絡(luò)方面的一系列進展。這個地方也非常感謝鄧力教授,他是世界上最早將深度神經(jīng)網(wǎng)絡(luò)用于語音識別、以及各種各樣模式識別的領(lǐng)路人,他在大會上也講到當時全球只有兩個公司吸收了它的成果、最早把它放在產(chǎn)品里面去,一個就是谷歌,一個就是科大訊飛。我這里再次對鄧力老師表示最誠心的感謝。
在這個過程中,我們可以看到利用深度神經(jīng)網(wǎng)絡(luò)和大數(shù)據(jù),特別是利用漣漪效應(yīng),一方面,隨著用戶的數(shù)量的增長,系統(tǒng)在不斷的學(xué)習(xí),連續(xù)五年每年有30%的增長,如果把這個東西叫做一種規(guī)律的話,我把它叫做人工智能系統(tǒng)基于互聯(lián)網(wǎng)的自我成長學(xué)習(xí)的這么一個框架,在圖像識別、語音識別、自然語言處理等很多方面都能看到它的身影。在這個過程中,我們將大數(shù)據(jù)能力與訊飛的現(xiàn)在人工智能計劃“訊飛超腦”進行結(jié)合,每一個里面都有非常多的數(shù)據(jù)參數(shù),要訓(xùn)練每一個參數(shù),就需要很多的數(shù)據(jù)來進行訓(xùn)練,而每個數(shù)據(jù)需要迭代很多次,我們可以看到這樣的結(jié)果。
那么最新的一些進展我也給大家分享一下,讓機器從“能聽會說”到“能理解會思考”是一段非常艱苦的過程。過去的一年里,在英文的識別方面我們已經(jīng)做到了世界上最好的水平,這是美國去年召開的一個全球的英文語音識別的評測大賽,我們獲得了第一名,并且我們比前年的結(jié)果應(yīng)該又提升了將近百分之百。
另外在認知智能方面,知識圖譜的構(gòu)建和最新的比賽叫Winograd測試。業(yè)界很多的人希望這個測試能夠代替圖靈測試,為什么呢?因為圖靈測試不太好進行評估,而這個叫Winograd的測試非常難,為什么這么說呢?因為它測的是人類的常識,人類的常識是非常難讓機器來學(xué)習(xí)的,它不是用運算智能的方法就能搞定的。
比如說我們看到屏幕上這句話叫做“爸爸沒有能力舉起它的兒子,因為他太重了”;問誰重或者“爸爸沒有辦法舉起它的兒子,因為他太虛弱了”,問誰虛弱。如果你只是從文字的上下文的角度,其實沒有太多的信心幫你來得到這個答案;這完全基于我們?nèi)祟惖腸ommonsense,而這種commonsense是認知智能一個非;A(chǔ)的東西。我們在去年的Winograd測試中也獲得第一名,不過這個第一名也沒什么好說的,為什么因為第一名我們也只得了60分,人類可以輕松的得到90分。
在過去的三年當中,我們在應(yīng)用方面的一個最深刻的認識,就是人工智能到底怎么樣改變我們的生活?我覺得可以把它分成兩個大的方面,一方面是人工智能可以改變我們和機器交互的方式,從而改變我們在消費者領(lǐng)域的各種產(chǎn)品的形態(tài);另一方面,人工智能可以學(xué)習(xí)很多專家的稀缺的資源,就是專家知識部分的東西。我們來逐步地看一下,大家都知道人機交互的發(fā)展思路肯定是機器越來越聰明,而人越來越不用改變我們的操作習(xí)慣,從原來的紙帶打孔到鍵盤、鼠標到后面的觸摸,我們現(xiàn)在可以看到人機交互、語音交互的產(chǎn)品正在成為一個新的方式,為什么這么說呢?因為機器是帶有顯示屏的,而我們?nèi)祟惪梢苑浅:玫乩斫鈾C器的顯示屏里面顯示的圖像的含義,而我們?nèi)祟悰]有顯示屏,人類最快的輸出信息的方法就是語音。而機器現(xiàn)在可以理解我們的語音,那么我們就可以用自然語音交互的方式來改變?nèi)祟惡蜋C器交互,自然交互越來越進入我們的生活。
今天我想回答一個問題,人工智能除了語音交互以外還能做什么?人工智能在各行各業(yè)都能夠發(fā)揮作用,為什么呢?因為在各行各業(yè)里面最稀缺的是資源行業(yè)的專家,在教育里面我們?nèi)鄙僮詈玫睦蠋煟卺t(yī)療里面我們?nèi)鄙僮詈玫尼t(yī)生。人工智能能不能改變這一點?其實在人工智能上一個浪潮,也就是上個世紀80年代的時候,我們都希望建立一個專家系統(tǒng),但是因為當時的技術(shù)和產(chǎn)業(yè)發(fā)展水平還不夠,當時沒有做成;現(xiàn)在我們又在做新的專家系統(tǒng)。
我給大家舉一個實際的例子,大家在學(xué)校里面,都希望每個學(xué)生最好有一個給他專門配置的老師,這個老師最好能夠改了學(xué)生的作業(yè)以后,知道這個學(xué)生有什么樣的弱點,他的哪些知識點強,哪些知識點弱,然后給學(xué)生專門的布置作業(yè)。就像現(xiàn)在的今日頭條一樣,每個人的喜好是不一樣的,大家看到的新聞也是不同的。
我們希望給每個學(xué)生布置的作業(yè)是不一樣的,從而提高它的效率,而現(xiàn)在整個的流程我們都已經(jīng)實現(xiàn)了。這個是我們在合肥一中做的具體的工作,在合肥一中有五個班級,他們使用了我們的個性化教學(xué)推薦系統(tǒng),經(jīng)過一個學(xué)期的學(xué)習(xí)后,其中有兩個班級從原來的第14名和第12名提升到第2名和第1名,其實我們利用人工智能的方法學(xué)習(xí)到老師的一些非常重要的技能。在北師大二附中里面270個學(xué)生的語文作文,他們成績平均提高了15%,之前語文作文和英文作文,因為老師沒有時間改,原來的作文分數(shù)是很低的,但是使用新的人工智能系統(tǒng)以后,我們的作文就可以比較高頻率的來進行批改,讓學(xué)生的信心能得到提升。
我們的技術(shù)應(yīng)用在智慧城市、醫(yī)療、國家安全、金融等很多方面。很多人都擔心人工智能是不是會取代我們的工作,但是其實人類的每一個工作都是由很多的技能構(gòu)成的,比如說老師除了有改作業(yè)的技能,有上課的技能,還有關(guān)心學(xué)生的技能,讓學(xué)生身心全面發(fā)展的技能;但是因為改作業(yè)、還有出題目這些的技能占用的時間太多,老師其實沒有時間去做那些真正提升學(xué)生的素質(zhì)的技能。而用人工智能我相信并不能替代老師所有的技能,F(xiàn)在我們?nèi)斯ぶ悄艿陌l(fā)展隨著運算智能、感知智能、運動智能和認知智能的發(fā)展,能夠替代老師的像布置作業(yè)、改作業(yè)這一方面的技能,但是對于關(guān)愛學(xué)生、對于提高學(xué)生的素質(zhì),對于啟蒙學(xué)生,我認為這些事情就是里面列的叫information free、information complete、Informationin complete,人工智能發(fā)展到一定階段,也無法取代人類。
所以我認為隨著人工智能的發(fā)展,人工智能能夠取代我們很多的職業(yè)中的某些技能,但不會替代人類的職業(yè),只是會改變?nèi)祟惖穆殬I(yè)。人類職業(yè)中的某些技能已經(jīng)可以用機器代替了,對人類社會和職業(yè)的發(fā)展將有著非常重大的影響,但是這個影響是需要有個時間的,也不是說今天我們這樣,明天睡覺起來之后完全變成另外一回事了。
我想簡單的說一下,我認為在將來的整個商業(yè)里面,每一個公司都會有自己的人工智能大數(shù)據(jù)和云計算。在這樣的一個過程中,大家會相互支持,這里面有很多公司是做人工智能的,而很多的公司是使用人工智能的,但是最終重要的就像羅振宇說的一樣,他能幫我們節(jié)省時間,能讓我們?nèi)祟惖臅r間使用得更加有效,這是我設(shè)想的在人工智能環(huán)境下商業(yè)生態(tài)的特點。公司之間需要復(fù)雜的融合,這些融合的變化是需要我們通過人工智能和所有對人工智能理解的人,通過商業(yè)合作的模式來共同實現(xiàn)的,我也期待著這個過程中能夠產(chǎn)生非常多的技術(shù)創(chuàng)新型的公司,我們一起來做這樣的事情。
在人工智能的整個發(fā)展過程中,是需要兩種不同的創(chuàng)業(yè)方式和風(fēng)格的公司,一種叫登山型的公司,它是一段一段不停的往前發(fā)展,你必須腳踏實地的努力去做,這個我們叫做原始核心技術(shù)系統(tǒng)的創(chuàng)新;但是當你應(yīng)用在一個具體的方面的時候,你需要抓住這個風(fēng)口浪尖,做出有沖擊力的創(chuàng)新型的產(chǎn)品。所以我期待著我們能夠在這個過程中,通過我們自己的人工智能的發(fā)展和很多創(chuàng)新創(chuàng)業(yè)者的結(jié)合,把登山和沖浪這兩個種好的公司的文化商業(yè)模式和技術(shù)的創(chuàng)新的精神結(jié)合在一起。
今天在座的各位,我相信有很多是創(chuàng)新創(chuàng)業(yè)的公司,那么我也希望在這個過程中大家能夠享受創(chuàng)業(yè)的過程。就像我們小時候玩耍一樣,做你想做的,喜歡做的事情跟你喜歡、或者想去跟他合作人一起去做。最重要的是享受過程,而當你享受這個過程以后,你想最終達到的目標也更加容易達到。所以我認為創(chuàng)業(yè)絕對不是一個痛苦的事情,還是我們講的快樂并痛苦著最終達到目標,并在這個過程中享受你的快樂。我期待著在將來和大家、包括在我們今天GMIS這個平臺上大家能夠更多的合作,更多地分享,一起創(chuàng)造更好的未來。謝謝大家。