從本科后半段到PhD期間,他們一直都在思考如何將所學(xué)技術(shù)做成有用的產(chǎn)品,也一直在考慮創(chuàng)業(yè)機(jī)會。
侯曉迪和郝佳男曾是人大附中同學(xué),高中時(shí)兩人同班。本科畢業(yè)后,侯曉迪去了加州理工讀PhD,研究方向是計(jì)算與神經(jīng)系統(tǒng),郝佳男則去了南洋理工大學(xué)攻讀博士學(xué)位,研究并行和分布式運(yùn)算。從本科后半段到PhD期間,他們一直都在思考如何將所學(xué)技術(shù)做成有用的產(chǎn)品,也一直在考慮創(chuàng)業(yè)機(jī)會。
2014年,還在香港科技大學(xué)讀機(jī)器學(xué)習(xí)與計(jì)算機(jī)視覺PhD的王乃巖去美國訪問,在那里認(rèn)識了侯曉迪。經(jīng)過一段時(shí)間的交流,兩人在創(chuàng)業(yè)想法上達(dá)成了一致,于是王乃巖決定和他們一起創(chuàng)業(yè)。
而陳默的加入則是在去年初。作為一位連續(xù)創(chuàng)業(yè)者,陳默曾獨(dú)立創(chuàng)立運(yùn)營過三家公司,后成功出售并退出。多年的商務(wù)合作和投資經(jīng)驗(yàn),讓他在互聯(lián)網(wǎng)領(lǐng)域積累了廣泛的資源。
2015年8月,圖森互聯(lián)正式成立。陳默任CEO,負(fù)責(zé)公司的戰(zhàn)略、資金等事務(wù)。侯曉迪任CTO,帶領(lǐng)北美研究院團(tuán)隊(duì),王乃巖任首席科學(xué)家,帶領(lǐng)國內(nèi)算法團(tuán)隊(duì),郝佳男任工程VP,帶領(lǐng)工程部門。
從去年成立至今,圖森一直在探索圖像識別技術(shù)的商業(yè)化方向。得益于新浪5000萬A輪融資及相關(guān)資源的進(jìn)入,他們首先從新浪微博的廣告開始做起。
圖像識別+廣告
圖森所做的事情是用圖片識別技術(shù),為用戶瀏覽過的圖片打上關(guān)鍵詞標(biāo)簽,讓廣告主找到最適合產(chǎn)品定位的投放廣告位,達(dá)到最佳的品牌傳播效果。比如在汽車廣告方面,圖森可以通過后端的圖像識別,為用戶之前瀏覽過的汽車圖片加上特定標(biāo)簽,從而幫助汽車廣告商進(jìn)行更精準(zhǔn)的定位。
除了精細(xì)化廣告定位,圖森還用圖像識別技術(shù)為新浪微博的廣告投放物料做審核。以前,平臺上每天50萬張素材都是人工審核,現(xiàn)在這一任務(wù)可以由機(jī)器執(zhí)行,大大提高了審核效率。
圖像識別+企業(yè)級應(yīng)用
圖森廣告業(yè)務(wù)目前每年2000萬營收。不過,由于廣告市場更多的是由資源而非技術(shù)驅(qū)動,因此圖森決定探索更多可以讓算法落地的領(lǐng)域。圖森CEO陳默在調(diào)研時(shí)表示,公司定位是做計(jì)算機(jī)視覺和機(jī)器學(xué)習(xí)領(lǐng)域的算法研究和企業(yè)端服務(wù)。
算法研究方面,圖森一直圍繞最前沿的技術(shù)進(jìn)行探索,同時(shí)也會做一些可演示的Demo,作為其技術(shù)實(shí)力的一種展示。此外,他們還會把一些容易商業(yè)化的技術(shù)拿出來,根據(jù)第三方企業(yè)的產(chǎn)品需求去做定制。
識車神器就是其中一例。這個(gè)專門為新浪汽車頻道研發(fā)的技術(shù),近日也在圖森官網(wǎng)開放了大眾試玩入口。只要用戶上傳汽車圖片,系統(tǒng)即可識別2016年3月前發(fā)布的主流乘用車品牌和車型。目前,該識別系統(tǒng)已覆蓋國內(nèi)市面上2000多種車型,識別準(zhǔn)確率達(dá)到95%以上。
據(jù)圖森首席科學(xué)家王乃巖介紹,在車型識別方面,從數(shù)據(jù)的收集、整理,到預(yù)處理和清洗,圖森都有一套完整的自動化算法,不僅把數(shù)據(jù)采集和標(biāo)定做到了基本沒有人工干預(yù),而且還實(shí)現(xiàn)了在一兩天之內(nèi)采集到百萬級別數(shù)據(jù)量的高效成果。
除了車型識別,圖森也在人臉識別、汽車自動駕駛、SLAM 3D地圖、數(shù)據(jù)平臺等方面做出了一些2B的技術(shù),用來開放給不同的企業(yè)需求方。
人臉識別方面,圖森已經(jīng)在一些國際比賽中拿到了很高的分?jǐn)?shù),但是由于進(jìn)入市場較晚,因此不會作為主攻方向,目前主要是將人臉識別技術(shù)應(yīng)用于駕駛員監(jiān)控系統(tǒng)(DMS)中。
自動駕駛領(lǐng)域,圖森會做一些車輛、行人、車道線、自行車、三輪車識別,以及道路分割、可行駛區(qū)域、車輛軌跡預(yù)測、自身定位等技術(shù),打包提供給想做自動駕駛的汽車廠商。
SLAM技術(shù)方面,圖森會用攝像頭做一些3D繪圖,四維地圖等,提供給騰訊、高德等相關(guān)企業(yè)產(chǎn)品。
數(shù)據(jù)平臺方面,圖森也會做一些數(shù)據(jù)采集標(biāo)定方案,包括數(shù)據(jù)的采集、加工、標(biāo)定、降噪等處理過程,提供給國外企業(yè)客戶。
圖像識別+智能駕駛
圖像識別技術(shù)目前的需求主要集中在人臉識別、安防和交通三大領(lǐng)域。
人臉識別方面,國內(nèi)幾家計(jì)算機(jī)視覺公司已有布局;安防領(lǐng)域市場相對封閉,而且已經(jīng)有?低暋⒋笕A等上市公司占領(lǐng)市場;而智能駕駛領(lǐng)域,目前各大公司尚在嘗試,整個(gè)市場還處在探索階段,于是圖森選擇了智能駕駛作為其未來商業(yè)化的主要方向。
在智能駕駛領(lǐng)域,圖森選擇了兩個(gè)方向進(jìn)行布局。一方面,圖森看重國內(nèi)車企對于研究無人駕駛的技術(shù)需求,通過和車企合作,在比較好的實(shí)驗(yàn)場景中,不斷磨練和提升自己的算法。另一方面,圖森也希望把的一些無人駕駛技術(shù)直接做成硬件級別的產(chǎn)品,形成一套完整的ADAS(高級輔助駕駛系統(tǒng))解決方案,從而實(shí)現(xiàn)商業(yè)化落地。
在無人駕駛技術(shù)研發(fā)方面,圖森已經(jīng)正式宣布和北奔研究院、北京理工大學(xué)合作,聯(lián)合研發(fā)軍用重型汽車的自動駕駛技術(shù)。北奔主要提供整車平臺以及相關(guān)試驗(yàn)資源,北理工為自動駕駛車輛的研發(fā)提供運(yùn)動控制技術(shù),圖森負(fù)責(zé)計(jì)算機(jī)視覺和深度學(xué)習(xí)算法部分,提供以攝像頭為主、配合毫米波雷達(dá)和視覺芯片的、經(jīng)濟(jì)型自動駕駛解決方案。
這種方案一方面降低了自動駕駛技術(shù)的應(yīng)用門檻,另一方面能夠?qū)崿F(xiàn)數(shù)據(jù)采集和高精地圖標(biāo)定的快速部署,在自動駕駛領(lǐng)域建立算法和數(shù)據(jù)的雙重優(yōu)勢。
而在ADAS硬件方面,圖森選擇從“兩客一危”、室內(nèi)公交等運(yùn)營車輛入手。通過將4路攝像頭連接車內(nèi)計(jì)算機(jī),在碰撞之前,對周邊行人和車輛進(jìn)行識別以及運(yùn)行軌跡的測算,從而為司機(jī)提供碰撞預(yù)警。該產(chǎn)品將在4個(gè)月后投入市場,目標(biāo)客戶是公交公司以及運(yùn)營車企等。
商業(yè)化落地
當(dāng)前,隨著人工智能越來越火,國內(nèi)幾家圖像識別公司已然成為明星公司,不僅在各類活動、論壇、會議上頻繁亮相,也經(jīng)常被各路媒體報(bào)道和提及,甚至合伙人的流動也成為業(yè)內(nèi)八卦熱點(diǎn)。
然而,光鮮背后,各家公司商業(yè)化落地情況并不樂觀,大多都還處于探索和規(guī)劃階段,要么通過和大公司合作,提供一些定制化需求來實(shí)現(xiàn)營收。
安防領(lǐng)域已有上市公司占領(lǐng)市場,圖片審核、服裝電商、金融等領(lǐng)域的需求尚未形成,各家公司很難說已經(jīng)找到明確的市場需求來落地自己的技術(shù),而圖森選擇的智能駕駛領(lǐng)域,除了國內(nèi)大公司紛紛試水,國外公司也早有研究和布局。
在美股上市的以色列公司Mobileye已經(jīng)做了近20年的ADAS系統(tǒng),目前全球市場占有率已達(dá)70%。與谷歌等大公司的方向不同,Mobileye通過強(qiáng)大算法,僅用單攝像頭就實(shí)現(xiàn)了ADAS主要功能,大大降低了設(shè)備成本,因此受到各大車企青睞。2015年,Mobileye營收2.4億美元,比2011年翻了12倍多,凈利潤6800萬美金,公司財(cái)務(wù)狀況良好。
今年3月,成立不到3年的自動駕駛初創(chuàng)公司Cruise Automation被通用以超過10億美元的價(jià)格收購。該公司的第一款產(chǎn)品就是安裝在普通汽車上的自動駕駛套件,可以在高速公路上接管汽車行駛,其組件包括毫米波雷達(dá)、立體攝像頭(雙目)、GPS 以及慣性傳感器,而非谷歌所采用的價(jià)格高昂的激光測距雷達(dá)系統(tǒng)。目前,該公司也開始研發(fā)全棧式無人駕駛技術(shù),成為谷歌競爭對手之一。
雖然這一方向前景未知,但至少可以證明,高昂的激光雷達(dá)并非無人車標(biāo)配,用毫米波雷達(dá)、立體攝像頭等也可以實(shí)現(xiàn)一定程度的自動駕駛,低成本和易量產(chǎn)反而更容易實(shí)現(xiàn)商業(yè)化落地。
對圖森來說,無人駕駛技術(shù)的商業(yè)化現(xiàn)在看來還很遠(yuǎn),能夠短期落地的就是針對運(yùn)營車輛的ADAS硬件產(chǎn)品,但這一細(xì)分市場未來落地情況如何,現(xiàn)在還不好說。不過陳默也表示,今年9月15日以后,圖森將開始針對其第三方服務(wù)向B端企業(yè)進(jìn)行收費(fèi)?梢,在圖像識別的商業(yè)化上,圖森至少已經(jīng)有了明確兩條路徑。
近期,愛分析對圖森互聯(lián)CEO陳默、首席科學(xué)家王乃巖、工程總監(jiān)郝佳男進(jìn)行了調(diào)研訪談,現(xiàn)將部分內(nèi)容摘錄如下。
Q:目前團(tuán)隊(duì)規(guī)模和構(gòu)成如何?
陳:北美和國內(nèi)團(tuán)隊(duì)加起來一共70人左右,北美研究院有20個(gè)人在做核心算法,國內(nèi)算法部門10人,硬件部門10人,工程部門10人,工程部門主要負(fù)責(zé)科研成果的產(chǎn)品化,比如系統(tǒng)對接,數(shù)據(jù)輸入輸出等。
Q:最開始是怎么考慮國內(nèi)和北美團(tuán)隊(duì)兩邊協(xié)作的?
陳:計(jì)算機(jī)視覺這個(gè)領(lǐng)域很新,生源也比較少。在這一領(lǐng)域北美又領(lǐng)先國內(nèi)平均水平。而且我們聯(lián)合創(chuàng)始人侯曉迪博士也在UCLA帶過一個(gè)研究院,之后出來創(chuàng)業(yè)就是為了把積累的技術(shù)商業(yè)化,他本身在美國各個(gè)大學(xué)有良好的關(guān)系,也是這個(gè)領(lǐng)域論文被引用最多的作者,所以就由他帶隊(duì),創(chuàng)建了北美研究院團(tuán)隊(duì),幫助我們吸引更多的PhD畢業(yè)生加入我們的團(tuán)隊(duì)。
Q:車型識別的技術(shù)實(shí)現(xiàn)過程是怎樣的?
王:先從數(shù)據(jù)準(zhǔn)備開始,也就是你要識別什么樣的車,每一類車對應(yīng)什么樣的圖片,然后就是訓(xùn)練數(shù)據(jù),把數(shù)據(jù)放到神經(jīng)網(wǎng)模里面去訓(xùn)練。同時(shí)在標(biāo)準(zhǔn)程度上做一些改進(jìn),比如有些車很相似,就需要在原有基礎(chǔ)上增加一些約束和限制,來辨識相似的圖片。
Q:圖片識別目前的難點(diǎn)在哪?
王:最難的地方還是數(shù)據(jù)的收集。這部分我們利用了在做互聯(lián)廣告時(shí)的技術(shù)架構(gòu),因此能夠比較快地拿到這些數(shù)據(jù)。
Q:數(shù)據(jù)是從哪獲取的?如何實(shí)現(xiàn)快速獲取?
郝:來源主要是互聯(lián)網(wǎng)的公開數(shù)據(jù)。從技術(shù)上講,大家都是利用爬蟲獲取公開數(shù)據(jù),但是關(guān)鍵在于能否在極短時(shí)間完成有效的下載、解析、清洗、標(biāo)注。對于每個(gè)環(huán)節(jié),我們都有很深的技術(shù)積累,人工干預(yù)的部分很少。比如對于解析,我們可以做到半自動地從未知結(jié)構(gòu)的網(wǎng)站獲取結(jié)構(gòu)化的數(shù)據(jù)。
Q:車型識別技術(shù)能否直接遷移到其他領(lǐng)域?
王:對模型來說沒有問題,主要還是數(shù)據(jù)方面,會有不同的采集方式。
Q:和車企合作研發(fā)無人駕駛技術(shù)是出于什么考慮?
郝:國內(nèi)車企確實(shí)有這方面的需求。一方面國外技術(shù)比較封閉,沒辦法給到國內(nèi)的車企,另一方面他們也想做無人駕駛,所以就有一些合作機(jī)會。但其實(shí)無人駕駛技術(shù)離真正實(shí)現(xiàn),或者說離大家都買得起,還有很長的時(shí)間。在這段時(shí)間,我們更多的還是去磨練算法,并且跟車企合作,他們能夠提供一些比較好的實(shí)驗(yàn)場景,反過來也可以幫助提升我們的算法。
Q:針對運(yùn)營車輛的ADAS產(chǎn)品需求如何?
陳:這一塊需求還是很大的。我國每年運(yùn)營車輛造成10萬人死亡,近百萬人受傷,不僅給運(yùn)營車企造成巨大損失,也給社會安全也帶來了巨大隱患。政府和相關(guān)監(jiān)管部門以及運(yùn)營車企都對車輛安全存在很大需求。
Q:產(chǎn)品自己生產(chǎn)嗎?計(jì)劃以什么形式收費(fèi)?
陳:攝像頭從外部采購,芯片用英偉達(dá)的,其他部分找代工生產(chǎn),銷售可以找代理,我們就提供技術(shù)。
收費(fèi)方面,按每臺車收取月服務(wù)費(fèi),我們負(fù)責(zé)做軟硬件升級,軟件系統(tǒng)需要經(jīng)常更新,硬件大概兩三年升級一次。
Q:國外在這一領(lǐng)域有類似形式嗎?
陳:國外主要還是以賣硬件為主。
Q:目前這一塊投入人力有多少?
陳:獨(dú)立立項(xiàng)投入20個(gè)人。
Q:在智能駕駛領(lǐng)域如何與現(xiàn)有玩家競爭?
郝:目前這一領(lǐng)域的玩家主要是谷歌、百度等大公司,以及基于Mobileye技術(shù)的車企。
谷歌采用的激光雷達(dá),雖然點(diǎn)云數(shù)據(jù)處理難度較低,但設(shè)備價(jià)格高昂,大概 7 萬美金左右。而且這種雷達(dá)目前基本都是手工制作,很難進(jìn)行工業(yè)化生產(chǎn),想要大幅度降價(jià)并不容易。因此,谷歌無人車的最終落地也很困難。
Mobileye十幾年來一直采用的是傳統(tǒng)算法,而對于近兩年才得以突破的深度學(xué)習(xí)技術(shù),大家都處在同一水平,至少沒有隔代差距。Mobileye的產(chǎn)品思路是供給芯片,但是完成支持深度學(xué)習(xí)的芯片,并把芯片做到量產(chǎn)還要花費(fèi)多年時(shí)間。我們則選擇更多從算法優(yōu)化層面來做優(yōu)化,使得深度學(xué)習(xí)算法可以在已經(jīng)發(fā)布的SoC(系統(tǒng)芯片)上運(yùn)行。
我們的目標(biāo)是可商業(yè)化、低成本的自動駕駛解決方案,通過攝像頭、慣性制導(dǎo)、GPS、毫米波雷達(dá)等廉價(jià)傳感器,配合深度學(xué)習(xí)算法完成感知、決策和控制。