中文字幕无码久久精品,13—14同岁无码A片,99热门精品一区二区三区无码,菠萝菠萝蜜在线观看视频高清1

您當(dāng)前的位置是:  首頁 > 新聞 > 專家觀點(diǎn) >
 首頁 > 新聞 > 專家觀點(diǎn) >

清華大學(xué)張拔院士起底:后深度學(xué)習(xí)時(shí)代的人工智能

2016-10-28 10:06:52   作者:   來源:雷鋒網(wǎng)   評論:0  點(diǎn)擊:


\
  今天CNCC2016在山西太原盛大開幕,開場演講中,CCF會士、CCF終身成就獲得者,中國科學(xué)院士、清華大學(xué)教授,中國自動化學(xué)會、中國計(jì)算機(jī)學(xué)報(bào)副主編、2011年獲得德國漢堡社會大學(xué)自然科學(xué)博士學(xué)位,2016年獲得杰出合作貢獻(xiàn)獎的清華大學(xué)張鈸院士做了人工智能未來展望,后深度學(xué)習(xí)時(shí)代的報(bào)告,雷鋒網(wǎng)為大家精編如下:
  今年是人工智能60周年,如果用人生的起步來衡量的話,已經(jīng)進(jìn)入了老年,不過還是有很多人希望人工智能能提供成熟的成果和技術(shù),用來發(fā)展產(chǎn)業(yè)、發(fā)展經(jīng)濟(jì)進(jìn)行科學(xué)研究。我今天做的報(bào)告,本著這樣的原則,關(guān)于人工智能的優(yōu)點(diǎn),它的成果我要說夠,對它的問題我要說透……
  后深度學(xué)習(xí)的前提-人工智能的春天又來了
  如今人工智能的春天又來了,不過和30年前在日本的那次相比,時(shí)間不同、地點(diǎn)不同,主題也不同,這一次是關(guān)于人工智能第二個(gè)成果,深度學(xué)習(xí)相關(guān)的。
  • 從知識情報(bào)處理到深度學(xué)習(xí)
  • 從第五代計(jì)算機(jī)到類腦計(jì)算機(jī)
  • 從大容量知識庫到大數(shù)據(jù)
  • 從高速符號推理到類腦芯片
  • 從自然語言理解到感知(機(jī)器人)
  我想這一次是不是我們的機(jī)會,我們能不能彎道超車還是又一個(gè)日本的“五代機(jī)”?我的看法是這兩個(gè)可能性都存在,關(guān)鍵我們怎么做。
\
  中國有句老話,三十年河?xùn)|,三十年河西,和30年前比現(xiàn)在有何不同?在我眼里兩點(diǎn),一點(diǎn)是大數(shù)據(jù),另一點(diǎn)是概率統(tǒng)計(jì)方法(及其理論)。正是因?yàn)檫@兩個(gè)因素催生了現(xiàn)在的深度學(xué)習(xí)大潮。
\
  這個(gè)第一點(diǎn)大數(shù)據(jù)我不用宣傳,大家看這個(gè)圖就行。
\
  這是在這種啟發(fā)下建立的神經(jīng)網(wǎng)絡(luò)模型,這里神經(jīng)網(wǎng)絡(luò)模型里要著重講下概率統(tǒng)計(jì)方法論,兩個(gè)詞,一個(gè)貝葉斯推理,一個(gè)概率統(tǒng)計(jì),被“引進(jìn)”了人工智能,并使得人工智能發(fā)生了革命性的變化。
\
  其實(shí)很多人不知道,作為對當(dāng)下人工智能有根本性貢獻(xiàn)的概率統(tǒng)計(jì),30年前的它跟現(xiàn)在的它還有很多不同。就是下圖的四個(gè)里程碑。
\
  我們現(xiàn)在能夠做深度學(xué)習(xí),能夠在幾百萬、幾千萬的參數(shù)下做優(yōu)化,很多人都以為是計(jì)算機(jī)變快,其實(shí)不完全是,而是要?dú)w功于概念統(tǒng)計(jì)方法的變化。這個(gè)變化使得我們現(xiàn)在能把深度學(xué)習(xí)做好。就是上面四個(gè)里程碑的出現(xiàn),大家一定要注意上面的四個(gè)里程碑。
  后來這些里程碑進(jìn)一步發(fā)展成神經(jīng)網(wǎng)絡(luò)了,特別是深度學(xué)習(xí),使用多層網(wǎng)絡(luò)進(jìn)行學(xué)習(xí)。所謂深度,就是層數(shù)比較多。由于用的深度學(xué)習(xí)方法,把模式識別、圖像識別等識別方法的準(zhǔn)確度提高了10%,這個(gè)事情又引起了深度學(xué)習(xí)的熱。
  為什么呢?因?yàn)樯疃葘W(xué)習(xí)解決了一個(gè)問題,有相當(dāng)一部分人,按中文的說法,我們知其然,不知其所以然。我能識別了了馬,但我們描述不了馬,然后怎么辦?那就用深度學(xué)習(xí)辦法:
  • 它可以解決一些不能完全表述的問題,也就是說“知其然,不知其所以然”的問題。
  • 第二個(gè)它能針對不確定性的問題,我們不斷的變化,我可以不斷的再學(xué)習(xí),最后,它能解決不能清楚表達(dá)的問題。
\
  • 另外,深度學(xué)習(xí)還有一個(gè)完全改變傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的作用,它不僅僅做函數(shù)映射,更重要提取那些多層次重復(fù)的模式,這是我們講的真正公共的特征。
  這樣使我們做模式識別可以達(dá)到很高的水平,后來這些用到模式識別、用到語音,包括用到文本(現(xiàn)在正在做,但是效果不如前面,但也有一些效果),效果都很不錯(cuò)。
\
  我們可以這么來說,深度學(xué)習(xí)這個(gè)第二個(gè)人工智能提供出來的成果,可以幫助我們解決在給定的數(shù)據(jù)庫下,有了可利用的大數(shù)據(jù),在感知信息處理上,有可能達(dá)到人類的水平甚至超過人類的水平。
\
  后深度學(xué)習(xí)時(shí)代的人工智能
  后深度學(xué)習(xí)時(shí)代的人工智能,就是想把人工智能從這個(gè)狹義的,只能解決一定范圍的方法,推廣更寬廣的范圍去,這就是我們現(xiàn)在講所謂弱人工智能、強(qiáng)人工智能、以及通用人工智能。那我們要做這個(gè)工作面臨什么挑戰(zhàn)?基本上面臨三個(gè)挑戰(zhàn)。
\
  1)一個(gè)是概念統(tǒng)計(jì)方法帶來的困難。
\
  我們剛剛說概率統(tǒng)計(jì)方法,對人工智能起到了革命性的變化,但是也給人工智能帶來極大的挑戰(zhàn),這就是概念統(tǒng)計(jì)本身的原因——通過大量的數(shù)據(jù),它只能搞出來重復(fù)出現(xiàn)的特征,或者是數(shù)據(jù)中間的統(tǒng)計(jì)關(guān)聯(lián)性,它找出來的不是本質(zhì)上的特征、語義上的特征,它找出來的關(guān)系,也不是因果關(guān)系,而是關(guān)聯(lián)關(guān)系。
  這樣做的后果是什么?這里有深度網(wǎng)絡(luò)做出來的手寫數(shù)字識別系統(tǒng),各種各樣的2它都能認(rèn)出來,它聲稱它這個(gè)性能超過了人,識別能力很超前。
\
  但你們看,當(dāng)我們用這種噪聲去欺騙它,它可以用99.99%的置信度確認(rèn)它是2,這在人是不可能發(fā)生的,為什么機(jī)器會發(fā)生,因?yàn)闄C(jī)器去認(rèn)識這種0和1,不是根據(jù)0和1本身的性質(zhì)來認(rèn)識,而是通過黑白分布的統(tǒng)計(jì)性質(zhì)來認(rèn)識它,因?yàn)檫@排噪聲跟2的統(tǒng)計(jì)是一樣的,所以才有這樣的錯(cuò)誤。
\
  這個(gè)在模式識別上沒有問題,但如果用到?jīng)Q策就會出現(xiàn)大錯(cuò),它甚至可以把一塊石頭看成是馬。這個(gè)問題非常嚴(yán)重,也就是說深度學(xué)習(xí)區(qū)分的是重復(fù)的模型,但大腦區(qū)分的是語義的特征,這兩種區(qū)分有本質(zhì)的區(qū)別,但是有關(guān)聯(lián)。
  2)第二個(gè),生數(shù)據(jù)帶來的問題。
\
  大數(shù)據(jù)有很多好處,其實(shí)大數(shù)據(jù)帶來很大問題。我們現(xiàn)在大數(shù)據(jù)跟以前的大數(shù)據(jù)不一樣,大量的數(shù)據(jù)是生數(shù)據(jù)。我們看網(wǎng)絡(luò)上傳來的數(shù)據(jù)都是摻雜了很多噪聲,有騙人的,有各種垃圾,這種數(shù)據(jù)叫生數(shù)據(jù)。大家看下機(jī)器對于生數(shù)據(jù)和經(jīng)過加工的數(shù)據(jù)的魯棒性表現(xiàn)相對很差,不像人。
  如果我們用右邊的圖去訓(xùn)練這個(gè)神經(jīng)網(wǎng)絡(luò),它能很好認(rèn)識的貓;如果用左邊的圖,它很難認(rèn)識,因?yàn)樗恢镭堅(jiān)谀膬骸_@個(gè)吳教授在我們學(xué)校做報(bào)告的時(shí)候,我跟他開玩笑說,你老說你的好成果,不說你的毛病,它為什么能在貓臉與人臉的識別上都識別地非常好,因?yàn)樗糜?xùn)練例的時(shí)候,是經(jīng)過精心挑選的,沒有背景,沒有經(jīng)過加工。因此,這三樣?xùn)|西的識別都做地非常好。但如果正例、負(fù)例都隨便取,那它的識別率只有百分之十幾,幾乎不認(rèn)識,可見機(jī)器跟人的認(rèn)識形式是很不一樣,它非常不魯棒。
  3)第三個(gè),推廣能力,領(lǐng)域遷移。
\
  這兩種方法都是就事論事,都很難推廣到不同領(lǐng)域,這就是我們的挑戰(zhàn)。我們要從一個(gè)弱的智能到通用智能,必須要克服這種困難,如果解決這種困難,目前來講兩個(gè)解決辦法。
  兩個(gè)解決辦法
  1)一個(gè)辦法,是人工智能的這兩個(gè)方法結(jié)合起來,因?yàn)檫@兩個(gè)方法是互補(bǔ)的。
\
  因?yàn)橹R驅(qū)動跟語義掛鉤,是理解;數(shù)據(jù)驅(qū)動是黑箱的方法,不理解,但可以保持從數(shù)據(jù)中提取模型。那么,前面那個(gè)必須有人工做模型,這個(gè)地方關(guān)鍵在哪兒?知識驅(qū)動方法是用離散的符號表示,深度學(xué)習(xí)是用高維空間里頭的向量,這兩個(gè)東西我們?nèi)绻馨阉?ldquo;溝通”起來,就會把人工智能推動非常大地一步,現(xiàn)在世界上很多機(jī)構(gòu)也在做這件事。
  2)另外一個(gè)辦法,就是回到神經(jīng)網(wǎng)絡(luò)的本源。
\
  它是根據(jù)神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)借助于人腦神經(jīng)的工作機(jī)制來形成的,人的神經(jīng)網(wǎng)絡(luò)有一套辦法,這套辦法可以借鑒到現(xiàn)在的人工神經(jīng)網(wǎng)絡(luò)來,這個(gè)工作,世界上也有很多機(jī)構(gòu)在做。
  我們一般把計(jì)算方法、深度學(xué)習(xí),這兩個(gè)東西如果能夠溝通起來,現(xiàn)在主要做的溝通,這兩個(gè)方法結(jié)合起來就會把人工智能推廣大大的應(yīng)用。
  第二個(gè),我一個(gè)文本看起來洋洋灑灑數(shù)萬頁,我為什么知道這里面說的是什么,因?yàn)椴煌植康,我怎么從局部的信息,把它整合成為全局的認(rèn)知,這個(gè)大腦里面也有一套辦法,這里面也涉及到很多研究。如果我們把這些研究移植到這個(gè)地方來,把人工智能往前走一步。
\
  后深度學(xué)習(xí)的計(jì)算機(jī)
\
  現(xiàn)在對計(jì)算機(jī)有這么幾個(gè)批評,一個(gè)你能耗太大,大腦這么大強(qiáng),才25W,你這一個(gè)計(jì)算機(jī)得多少?另外一個(gè)批評,就是對馮諾依曼結(jié)構(gòu),人腦里面是處理跟存儲在一起,你處理跟存儲分開,所以對對現(xiàn)在的計(jì)算機(jī)說三道四。
  我想給大家吃一個(gè)定心丸,現(xiàn)代的計(jì)算機(jī),我們這個(gè)人工智能學(xué)會(里的人)還是可以靠它維持很長時(shí)間的。首先,現(xiàn)在大家討論最熱的一個(gè)是個(gè)量子計(jì)算、一個(gè)是類腦計(jì)算。大家不要量子計(jì)算一出來現(xiàn)在的計(jì)算就不行了,不對了。因?yàn)榱孔铀惴,目前只有一個(gè)算法,它就是因子分解,它可以把指數(shù)變成多樣性,其它的都沒用。其它的,這個(gè)計(jì)算機(jī)即使它出來,只有涉及到因子分解那些算法,它有可能加快,其他它目前還沒有算法,算不了。所以量子計(jì)算機(jī)現(xiàn)在絕對代替不了現(xiàn)在的計(jì)算機(jī),就像量子通訊代替不了現(xiàn)在的通訊一樣。
  我想給大家吃的第二個(gè)定心丸,現(xiàn)在講的類腦計(jì)算,正確地講叫BrainInsoired Computer,而不是Brainlike,大腦你都不知道什么樣子,你like誰呢。
  如何建造計(jì)算,實(shí)現(xiàn)人工智能的兩種途徑,計(jì)算機(jī)方式或者學(xué)大腦的方式。數(shù)據(jù)提高了,加一個(gè)網(wǎng)絡(luò)芯片,目前做這個(gè)工作的人基本上都得保留一些馮諾依曼架構(gòu),不能把馮諾依曼立馬取消了。當(dāng)然也有人直接從右邊往左邊做,這個(gè)是屬于基礎(chǔ)研究的一類,我們要做的話,這個(gè)類腦就需要學(xué)科的交叉,我特別推薦要數(shù)學(xué)、認(rèn)知科學(xué)、心理學(xué)、神經(jīng)科學(xué)和語言學(xué)等。
  最后說一下,人工智能究竟有多大的希望呢?取決于我們對認(rèn)知的世界的認(rèn)知,取決于我們對自身的了解多少?
\
  好了,我們把我們對自身的了解分成兩個(gè)部分,左邊部分是“我們知道we know”,右邊那部分叫做“我們不知道”,所以我們把它畫大一點(diǎn)。
  • 我們知道的東西的白色的部分,這就是“我知道的知道”,這就是知其所以然更知其所以然,這就是白盒。
  比如說下國際象棋,就是我們能說清楚,我們知其所以然,又知其所以然,這個(gè)用傳統(tǒng)的人工智能模型可以解決它。
  • 我們知道的下方黑色部分,是“我們不知道的知道wo don't know what we know”。
  這是黑箱,感知就是這樣,我們知其所以然,不知其所以然,我們知道那是張三,但我們說不清楚張三鼻子多高眼睛多大,那怎么辦,用深度學(xué)習(xí)。
  從黑箱到白箱中間有個(gè)灰色地帶,好多問題有的說清楚,有的說不清楚。最典型的就是圍棋,圍棋有一部分能說清楚,而象棋都能說清楚,馬為什么這么走,卒為什么要向前走,圍棋絕大部分一顆白子為什么要落在這個(gè)地方,大師也說不清楚,他會說這是我的棋感。
  棋感怎么做?這就是Alpha Go的重大貢獻(xiàn),把棋感當(dāng)作模式識別來做,你看到這個(gè)版面以后,你就應(yīng)該知道怎么落子,這個(gè)版面就是一個(gè)模式,現(xiàn)在我們現(xiàn)在可以說,大師下圍棋下得好,不是因?yàn)樗斆髁耍撬哪J阶R別能力非常強(qiáng),棋子有一點(diǎn)點(diǎn)變化,他就知道變了,就知道我的策略要變,這個(gè)就是用傳統(tǒng)模型+深度學(xué)習(xí),Alpha Go就是這么做的,蒙特卡洛搜索+深度學(xué)習(xí)。這就是我們不知道的知道。
  • 還有藍(lán)色的部分,我們是不知道,但是我們(清楚地)知道我們不知道。
  比如情感、意識等等,這個(gè)也能夠用深度學(xué)習(xí)的方法來模擬,至少做到表面模擬。人工智能能做的這么多,這就是人工智能的厲害之處,為什么大家注意到,過去除了白色的部分,其它部分我們都不能做,人工智能能夠做這一切。
  • 但是唯獨(dú)黃色這部分,我們都不知道我們不知道。
  我們都不知道怎的情況下怎么做呢?腦科學(xué)研究覆蓋了所有,所以,我們的信息是建立在這個(gè)基礎(chǔ)上,我們不知道的我們不知道,變成我們知道的我們不知道,再把它變成我們知道的我們知道。傳統(tǒng)的算法只占在白色部分的一小部分,也就是說可以建立數(shù)學(xué)模型的問題,所以,我們?yōu)槭裁凑f人工智能寄予這么大的希望,原因就在這兒。
  我說這么多,謝謝大家。
 

專題