中文字幕无码久久精品,13—14同岁无码A片,99热门精品一区二区三区无码,菠萝菠萝蜜在线观看视频高清1

您當前的位置是:  首頁 > 新聞 > 文章精選 >
 首頁 > 新聞 > 文章精選 >

百度云首席數(shù)據(jù)科學家沈志勇:百度云ABC戰(zhàn)略

2017-07-26 14:28:48   作者:   來源:CTI論壇   評論:0  點擊:


  
  謝謝,非常榮幸來到這里跟大家分享百度云的ABC戰(zhàn)略。
  我先破一下題,這個ABC戰(zhàn)略跟剛才徐總有點英雄略同,A是人工智能AI,B是Big Data大數(shù)據(jù),C是Cloud Computing云計算。大家知道云計算其實在一定程度上一開始的時候,像亞馬遜出現(xiàn)的時候是作為一個能力共享的方式出來的,這里面互聯(lián)網(wǎng)公司為什么會具備三位一體這三個能力,我個人稍微解讀一下,它其實跟一個產(chǎn)業(yè)的發(fā)展或者需求的演進有關系,一開始一個行業(yè)一個產(chǎn)業(yè)要經(jīng)歷信息化的過程,像互聯(lián)網(wǎng)行業(yè)天生就是信息化的,解決的是信息的服務可用性,就像百度搜索引擎能讓用戶搜到東西。往后走發(fā)現(xiàn),信息化以后自然而然會產(chǎn)生很多數(shù)據(jù),自然而然會去想,這數(shù)據(jù)能用來干嗎。尤其是到了Web 2.0以后出現(xiàn)用戶的概念,怎么樣讓用戶體驗更好,讓他們在產(chǎn)品上停留更多時間。這個時候我們會去考慮怎么樣使用用戶行為的歷史數(shù)據(jù),或者UGC數(shù)據(jù)比如類似評論數(shù)據(jù)。這個時候其實是我們在做數(shù)據(jù)驅動的事情。再往上走會發(fā)現(xiàn),互聯(lián)網(wǎng)公司很多產(chǎn)品出現(xiàn)多樣化的交互形式,你不光可以通過文字輸入,還可以通過語音輸入,這個時候我們會用到人工智能的東西,其他還有機器翻譯等等;ヂ(lián)網(wǎng)公司經(jīng)歷過這樣一個發(fā)展過程,別的行業(yè)也在經(jīng)歷這個發(fā)展過程,慢慢從信息化再到數(shù)據(jù)驅動的需求,再往上走就是智能化。有些行業(yè)可能剛剛進入信息化的過程,有些行業(yè)可能發(fā)達一些,怎么把百度作為互聯(lián)網(wǎng)公司在發(fā)展中積累的能力分享出來,百度云是這樣一個很好的載體。接下來按照C-B-A的順序仔細闡述一下,我們到底有哪些東西已經(jīng)具備了,可以拿出來跟整個行業(yè)分享。
  首先是云Cloud基礎架構這一塊,我們要分享的主要一個是計算,第二是存儲,還有網(wǎng)絡這塊的架構,其他還包括一些像安全等方面。
  計算這塊,在百度我們有非常多的產(chǎn)品線,我們要支持非常多形式的而且高強度的計算場景,所以會形成不同的軟硬件為基礎的計算服務都在里面。需要特別強調(diào)的是人工智能,也是百度的戰(zhàn)略方向,人工智能背后用到的服務器主要是GPU集群,積累比較深厚,可以做一些規(guī);牟渴,在業(yè)界應該是比較領先的。另外一塊,存儲,大家都用百度網(wǎng)盤,它是一個對象存儲的存儲架構,當然我們還有其他的存儲形式可以提供。網(wǎng)絡,每個網(wǎng)絡服務的環(huán)節(jié)基本上都是TB級的帶寬。
  這是跟今天會議主題比較契合的頁面,我們在安全這塊是比較重視的,這是百度云具備的各種安全的資質(zhì)和證書,我們一直在努力營造安全的云服務環(huán)境。
  剛才講的是外部對我們百度云安全方面的認可,這一頁是我們內(nèi)部技術努力,我們在很多方面都有技術積累沉淀,包括DDoS攻擊的防護等等。
  接下來講Big Data,我是數(shù)據(jù)科學家,主要從事這塊多一些。百度在數(shù)據(jù)方面不光有數(shù)據(jù)能力,像數(shù)據(jù)存儲、分析等等這塊,還有很多的數(shù)據(jù)資源包括一些用戶產(chǎn)生的數(shù)據(jù)。這兩塊我們都在想法怎么樣利用它。
  先看一下百度的大數(shù)據(jù)到底大到什么程度,我們有大概6億用戶,每天會產(chǎn)生大概100億次的檢索,檢索里面包含了用戶的關注還有用戶的需求等等這樣一些信息,而且覆蓋的興趣面是非常廣的。還有一個比較大的我們的產(chǎn)品是百度地圖,會有很多別的相關的應用來用百度地圖的接口,這樣會產(chǎn)生每天大概720億次的地圖上的定位請求,里面的信息基本上是用戶用腳投票的信息,也有非常高的價值。我講到這里必須強調(diào)一個,這些數(shù)據(jù)里的原始數(shù)據(jù)信息我們是不可能拿來共享的,我們會對這些數(shù)據(jù)進行加工,得到一些不侵犯隱私的數(shù)據(jù)資源。
  用戶畫像產(chǎn)品是我們針對自有產(chǎn)品的改善,利用剛才講的地圖和搜索的數(shù)據(jù),再加上百度別的產(chǎn)品線的數(shù)據(jù)構造的。它實質(zhì)上是一個標簽體系,百度的的標簽體系維度非常大,體現(xiàn)出非常多樣的興趣的信息。
  剛才講的是數(shù)據(jù)資源,有些不包含隱私的加工后產(chǎn)品可以共享。但我們更重要的想分享的是我們處理這些數(shù)據(jù)的能力,這里分了很多層次,最底下是數(shù)據(jù)采集的能力,甚至包括了物聯(lián)網(wǎng)的數(shù)據(jù)采集能力。再往上是數(shù)據(jù)的存儲,包含關系數(shù)據(jù)庫,包括對象存儲數(shù)據(jù)庫以及NoSQL數(shù)據(jù)庫。再往上進行處理與分析,這塊是百度技術優(yōu)勢比較大的地方,基本上我們所有產(chǎn)品都是數(shù)據(jù)驅動的,有很多產(chǎn)品在里面,包括傳統(tǒng)的日志分析MapReduce相關的,深度學習的paddlepaddle平臺,還有機器學習的工具包BML等等。到了服務層,我們針對語音識別、智能客服用的智能問答等等,再往上是相關的服務組合起來能夠服務到的一些行業(yè),這樣一來大家對百度的數(shù)據(jù)能力有一個大概的了解,這整套能力構成的平臺,我們稱之為天算平臺。
  具體的,比方說里面有日志的分析,互聯(lián)網(wǎng)產(chǎn)品為什么能夠做的很貼心,用戶體驗比較好,離不開用戶歷史數(shù)據(jù)的分析,用來做用戶體驗和產(chǎn)品的優(yōu)化。針對用戶體驗的另外一個非常重要的工具叫推薦系統(tǒng),大家可能體會過,在買東西的時候旁邊會出來你可能想買什么,百度音樂會有你喜歡聽的音樂的推薦。這個技術能力我們也可以往外開放出來,做一個接口形式給大家使用。營銷這塊,可能在座的會更加熟悉一點,里面會有很多的模塊,像DSP、SSP,百度在這塊有相應的模塊對外開放,通過百度云對外開放,我們叫營銷云。RTB是里面一個具體的組成部分,營銷云里的實時競價的模塊。還有一個更重要的模塊是DMP,怎么樣知道用戶別的一些信息,但是我們不會直接共享我們的用戶數(shù)據(jù),而是怎么往外共享構造DMP的能力,怎么用客戶自己積累的數(shù)據(jù)去上面構建DMP。
  剛才講了大數(shù)據(jù),我們再來到人工智能。人工智能百度是多年來重點投入的方向,也是目前的戰(zhàn)略方向。我個人作為一個研究院人員,對人工智能作一個小小的解讀。我認為人工智能可以分為這樣三個境界,人工智能說白了其實就是想讓機器幫人干活,在干活的過程中提高效率和效果。但是為了讓機器具備干活的能力,我們首先讓它具備人的某些功能。第一個是怎么樣感知這個世界,怎么樣聽明白、看明白、讀懂人說的話,這個我們叫做感知世界的能力。比如像人臉識別、語音識別是最典型的應用,這些技術隨著深度學習的發(fā)展,基本上從實驗室走出來,走到可以商用的程度。機器感知到信息以后,能不能進行思考,像讓機器參加一些知識競賽。更有挑戰(zhàn)的人工智能體現(xiàn)在機器的自主行為上,能不能在一個現(xiàn)實世界的開放空間里,讓機器像人一樣真正去行為,自動駕駛、無人車是最典型的,還有機器人的技術,包括各種垂直行業(yè)的機器人。百度像自動駕駛這塊和人機交互機器人這塊已經(jīng)獨立成立事業(yè)部,歸我們的COO陸奇直接領導。前面包括感知世界能力和快速思考能力,百度在里面也都有深厚的積累。這三個層次的能力,我們也有對外共享的平臺來提供,我們叫百度云天智平臺。天智平臺對外方式有兩種,一種是可以直接用,還有是通過API調(diào)用。
  剛才講到大數(shù)據(jù),我們對應的是百度云天算平臺,人工智能對應的是天智平臺,這兩個平臺是按照能力劃分的。我們對于典型應用場景還構造了兩個平臺產(chǎn)品,一個叫天像,一個叫天工。天像平臺是針對視頻多媒體這塊,這里面像視頻需要的分發(fā)也好或者視頻里有些簡單的分析也好,都能在這個平臺上共享得到,典型應用方包含在線教育、直播平臺等。天工是最近比較火的智能制造與物聯(lián)網(wǎng)相關的,它主要是針對怎么樣喚醒萬物,針對現(xiàn)實世界,能不能把互聯(lián)網(wǎng)的一些模式也好、能力也好,能夠下沉到現(xiàn)實世界里面去,給他們做一個物與物之間的連接,把物與物產(chǎn)生的數(shù)據(jù)也都記錄下來,怎么樣再優(yōu)化現(xiàn)實世界的生產(chǎn)流程。典型的應用包括智慧城市、智慧樓宇、智慧生產(chǎn)線等等。
  最后把百度云ABC三塊的能力與資源,細化成大的模塊,怎么樣對外共享,有很多產(chǎn)品。我們不光是作為云自身有包括SaaS層、IaaS層、PaaS層的各種服務,我們還可以作為接口,對接其他百度的能力與服務。
  謝謝大家!

相關閱讀:

專題