車載語音識別十年沉浮路 各領(lǐng)風(fēng)騷幾多年?
2011/05/05
車聯(lián)網(wǎng)給了語音科技人第二次創(chuàng)業(yè)的希望
王力劭凝視著演講者,偶爾地,他還會把一根鉛筆放在嘴邊把玩著,似乎在思考著今天即將發(fā)生在自己身上的戲劇性轉(zhuǎn)變。今天是3月31日,他就坐在世紀金源大飯店一個研討會場的第二排。
下午5點20分,車音網(wǎng)首席科學(xué)家王力劭上臺,暢談平板電腦在未來的車載應(yīng)用。沒有多少人知道,就在20分鐘以前,他辭去原公司高管職位且離開公司的離職聲明正式生效。以非常職業(yè)的方式告別效力八年的老東家,王力劭再次回到了一個叫沈康麒的人身邊,回歸了一支十年前他曾經(jīng)戰(zhàn)斗過的團隊。
十年原班人馬再聚首
那是一支在夢想的甘甜和現(xiàn)實的苦澀中歷練過的隊伍,精神領(lǐng)袖沈康麒早年靠IT產(chǎn)品貿(mào)易生意起了家,2000年開始一根筋地投資語音識別產(chǎn)業(yè),第一家公司起名為北京金耳麥科技有限公司(下稱“金耳麥”)。
王力劭就是那年應(yīng)聘金耳麥實習(xí)時,第一次見到了沈康麒。
10年荏苒,語音識別產(chǎn)業(yè)發(fā)展小高潮偶有,但總體偏冷。期間,沈康麒完勝過,也大敗過。此后的東山再起做“車音網(wǎng)”,全因聚集了一幫精于此道、樂于此道的弟兄。
在王力劭看來,他們這幾個核心成員就好像組成了一支足球隊一樣,在不同的位置上各負其職、默契配合。
商人沈康麒作為團隊的引領(lǐng)者和精神領(lǐng)袖,扮演了球隊老板、經(jīng)理和教練的多重角色。沈老板決定公司做什么,然后提供公司所需資源。他顯然屬于思維超前的類型,熟悉他的人一方面會佩服他,另一方面也知道,他做事的風(fēng)格很愛“飛”。
后衛(wèi)“許大師”,負責(zé)基礎(chǔ)的算法編寫!霸S大師”是一個典型的研究型人才,早年在某國內(nèi)大學(xué)讀博士的時候,他主攻模式識別,研究的課題就是語音識別和信號處理。
后腰的位置則交給了“龐大師”。他負責(zé)把許大師制造出來的算法封裝成軟件的基本模塊。車音網(wǎng)作為專攻車載語音識別的公司,前期需要大量 “苦力式”勞動,如語料采集、分析、機器訓(xùn)練等!褒嫶髱煛睋碛行盘柼幚韺I(yè)的出身,正是這些工作的不二人選。
接下來,球傳到了中場這里。模塊做好之后,就需要構(gòu)建出平臺。王力劭就處于這個承前啟后的位置。能否在擴充支撐業(yè)務(wù)的同時,保證商業(yè)模式,成為了他要重點考慮的事情。有時候他更喜歡稱自己為工程師,而有的時候他做的事情卻像一個軍師。在做某一項投資時,質(zhì)量、成本、時間作為相互制約的三邊,構(gòu)成了一個三角形,王力劭很擅長做這樣三角形的平衡,并建議“球隊老板”之后的商務(wù)活動如何推進。
首席運營官曾輝是一位全能型的前腰,他不僅能貫徹戰(zhàn)術(shù)、把握球隊的內(nèi)控,還負責(zé)與外部的客戶群、整車企業(yè)、電信運營商的洽談等等。
球隊的前鋒,所做的便是平臺之上的應(yīng)用了。應(yīng)用是移動互聯(lián)網(wǎng)時代最千變?nèi)f化的,也是最接近用戶的產(chǎn)品。商業(yè)模式的選擇對于應(yīng)用的影響也很大。對于應(yīng)用的發(fā)展,車音網(wǎng)有著更深層次的考量。
沈康麒、曾輝、王力劭三個人的談話經(jīng)常這樣進行。沈說:“這個應(yīng)用,必須有!痹鴨柾酰骸八f這個必須有,那這個到底有,還是沒有?”王告訴曾:“這個,可以有。” 沈康麒和王力劭更是高興起來就勾肩搭背,有分歧的時候就拍著桌子互喊。
這五個人總是互相告誡:不能自我膨脹。3月31日,王力劭一結(jié)束完會議就立刻飛到深圳見沈康麒。他問沈康麒:“我出來跟你干,最大的使命是什么?”沈康麒思考了一下:“你把我們的理念整理一下,把整個平臺的規(guī)劃做一下,把很多和外面的溝通建立起來。”王力劭說:“錯。第一件事我是拉著你,你太能飛了。資金到了,你又可以往上飛了,我得把你扽下來!卑凑丈蚩调璧男宰樱靡粋月可以創(chuàng)造的奇跡,他絕不愿等到第32天。而王力劭則會告訴他,用三個月創(chuàng)造出來的奇跡會更穩(wěn)。
如今的車音網(wǎng)所走的路以及這個核心團隊在心態(tài)上的一些調(diào)整,和他們多年來摸爬滾打得到的經(jīng)驗教訓(xùn)是分不開的。
“金耳麥”的沉浮聚散
王力劭在2000年進入沈康麒的金耳麥公司實習(xí)。那年,金耳麥公司開始專注語音識別,主攻的方向定位在手機語音識別上 。早在1999年“許大師”用“586”電腦跑通了他們的第一套語音識別算法。只不過,在那個互聯(lián)網(wǎng)剛剛起步的年代,硬件設(shè)備并不支持復(fù)雜的網(wǎng)格計算,僅憑借自身力量難以短時間內(nèi)有所突破。在2001年,他們的語音識別技術(shù)已經(jīng)具備了較好的素質(zhì)。這時,金耳麥被一家頗具實力的境外同行公司看中了。當(dāng)對方提出收購案時,沈康麒并未太多猶豫,他仿佛看到了強強聯(lián)合之后,兼具兩家之長的搜索引擎能開拓出廣袤的市場。
國內(nèi)的語音識別市場仍未成形的時候,這家境外公司把另一家很早進入中國市場的美國Nuance通訊公司視為唯一競爭對手。當(dāng)時,一家當(dāng)今非常有名但尚未崛起的研發(fā)型企業(yè)——安徽中科大訊飛信息科技有限公司(2007年更名為安徽科大訊飛信息科技股份有限公司,下稱“科大訊飛”)進入了沈康麒的視線。他當(dāng)時非常看好自己公司與科大訊飛的互補性,曾與科大訊飛掌舵人劉慶峰先生多次交談后,向公司建議收購科大訊飛。然而,這家境外公司因為理念與文化的差異,拒絕了他的建議。今天看來,這個拒絕收購科大訊飛的境外公司與一個千載難逢的黃金機會失之交臂,而這次錯過卻成全了科大訊飛和時任科大訊飛董事長劉慶峰的一番偉業(yè)。
造化弄人,如果科大訊飛被并購,將同“金耳麥”一樣,按照收購者的意愿發(fā)展。自稱“競爭隊友”的王力劭都為科大訊飛感到慶幸,他并不認為科大訊飛與車音網(wǎng)是競爭對手,而是“競爭隊友”。“這個世界本身就靠競爭這點規(guī)律才能做起來的。所以從行業(yè)的角度來看,我們很慶幸,訊飛也扛過來了。這個行業(yè)里沒有多少旅伴,多些人一起往前跑實際上更踏實!
沈康麒的“金耳麥”面臨的境況卻和科大訊飛不同。在他看來,他當(dāng)時所擁有的中文語音識別技術(shù)已經(jīng)是國內(nèi)領(lǐng)先,但是,通過尋找強大的合作者來快速實現(xiàn)擴張以期早日形成語音識別應(yīng)用市場規(guī);乃悸穮s并不盡如人意。這次并入國外大公司的抉擇并未能夠幫助沈康麒實現(xiàn)愿望。
此后的“蜜月磨合期”,兩種理念、兩種文化慢慢產(chǎn)生了不可調(diào)和的沖突。沈康麒的團隊希望讓研發(fā)更多考慮實用性,貼近用戶的需求和行業(yè)的應(yīng)用。然而,這家境外公司當(dāng)時手握巨額風(fēng)投,卻執(zhí)意把語音識別的技術(shù)和引擎開發(fā)全部轉(zhuǎn)向境外研發(fā),且對于研發(fā)內(nèi)容未來的商業(yè)應(yīng)用價值并未考慮清楚,對于國內(nèi)市場的語音應(yīng)用趨勢也沒有深入關(guān)注,因此也就并未理會沈康麒的多次呼吁。而在市場發(fā)展方向上,由于文化差異難以融合,這家境外公司把持著當(dāng)時水平最高的語音識別技術(shù)卻開始出現(xiàn)了水土不服的現(xiàn)象。
由于趕上了“CTI(計算機電話集成)時代”,許、龐兩位大師同在一個涉及核心部分的團隊,一個在做IVR(互動式語音問答),一個在做語音識別,都是偏CTI的方向。而王力劭所在的團隊,則因公司研發(fā)策略的變化,被分化到去做重復(fù)性的工作,如應(yīng)用軟件封裝等等,原本很強的團隊?wèi)?zhàn)斗力越來越弱,沈的話語權(quán)也越來越小。2002年,王力劭向當(dāng)時已然被架空權(quán)力的沈康麒告別,開始了八年的獨自闖蕩。
沈康麒決定再等等,到了2006年,他終于發(fā)現(xiàn),在這家公司,他的很多理念不但沒有加速實現(xiàn),反而向著反方向漸行漸遠。眼看科大訊飛穩(wěn)步發(fā)展,沈康麒堅信自己曾經(jīng)的判斷是正確的,他不愿認輸,毅然決定放棄一份很高的薪水,從那家公司辭去中國公司CFO的職位,堅定地破釜沉舟,重頭再來。
一口氣爭出車音網(wǎng)
車務(wù)服務(wù)對現(xiàn)在的中國人來說仍是一個新東西,喜歡追逐新潮事物的沈康麒發(fā)現(xiàn)車載環(huán)境非常適合做語音識別,掂量一下自己的資本——多年的原始語料積累和幾名核心骨干的追隨,沈康麒從這家合資公司撤出了。
跟著沈康麒一起出來的是曾輝、“龐大師”以及幾個“金耳麥”的老人;I劃新公司之前的一年多,他們過得異常艱苦。沈康麒給所有跟他出來的人定了薪金,但是長達一年的時間里,他沒有付給他們錢,全部約定欠薪。即便如此,他的資金仍然斷了好幾次。扎根在多媒體及通信研發(fā)領(lǐng)域的王力劭和遠赴海外的“許大師”也在工作之余,經(jīng)常隔山跨海地幫沈康麒改寫原有引擎、提供架構(gòu)方案。“當(dāng)時沒覺得他能成功,就是覺得他不容易。”王力劭眼中的沈老板頗具傳奇色彩,“他就有這樣一種魅力。有人說純爺們兒是終生追逐財富,但視財富如糞土的人。他有點兒像!
2007年開始,沈康麒看時機成熟,四處籌集資金,包括借錢、尋求朋友幫助。憑著“沈老板仗義”這句口碑,很多朋友對他伸出援助之手。同時他破釜沉舟地變賣了自己所有的股份、別墅、兩部高檔轎車,在2008年的時候籌集到了1000萬元的啟動資金,車音網(wǎng)誕生了。經(jīng)濟和精神壓力極度緊張之時,沈康麒的妻子在還有一星期到預(yù)產(chǎn)期的時候,手頭只剩百十來塊錢。
2010年6月底,車音網(wǎng)與中國聯(lián)合網(wǎng)絡(luò)通信集團有限公司及中央人民廣播電臺簽訂合約,在汽車語音服務(wù)中進行主要基于3G網(wǎng)絡(luò)的合作。在北京、上海、廣州、深圳等城市和地方,車音網(wǎng)已經(jīng)擁有4萬用戶。而多家國際頂級車廠紛紛向車音網(wǎng)拋出橄欖枝,預(yù)計在6月份前后,車音網(wǎng)將讓中國的技術(shù)歷史性地出現(xiàn)在進口高檔轎車上。
車音網(wǎng)在電信運營商如中國聯(lián)通(5.62,-0.04,-0.71%)的3G通信網(wǎng)絡(luò)內(nèi)再單獨組網(wǎng),用戶可以在使用車音網(wǎng)撥打電話時而免交話費。用戶的手機通過藍牙與方向盤后一個按鈕連接,按下按鈕自動撥號;诿恳惶幾赓U的數(shù)據(jù)中心的云平臺,用戶通過車音網(wǎng)的智能輔助駕駛系統(tǒng)實現(xiàn)語音呼叫、點播音樂等功能。
盡管很多人對于車務(wù)服務(wù),即音譯過來的“特馬服務(wù)”(Telematics)比較陌生,但是從目前中國汽車市場的增長速度和移動互聯(lián)網(wǎng)的普及趨勢來看,車載語音識別的市場將非常廣闊。正因如此,國內(nèi)、國際的頂尖風(fēng)投公司都對這個行業(yè)趨之若鶩。車音網(wǎng)因此也處于一個自身發(fā)展的非常敏感、脆弱的時期。如何分配投資結(jié)構(gòu)和保持正確的發(fā)展方向?qū)⑹巧蚩调璧热嗣媾R的一大難題。同時,站在車音網(wǎng)的立場,王力劭希望有更多的企業(yè)參與到行業(yè)中!皼]有水,魚再大活不了。”
選擇在具體的某一條細分行業(yè)中,比如汽車行業(yè)中發(fā)展規(guī)模商用,或?qū)⒊蔀檐囈艟W(wǎng)的一次正確決策。從金耳麥時代起,以“龐大師”為首的“后腰”苦力們,在全國各地不同的環(huán)境里用不同的錄音方式,收集不同口音的語料。每位幫助他們錄音并達到要求的路人被支付10元錢作為回報,這項工作持續(xù)到車音網(wǎng)的車載語音識別系統(tǒng)運營。此時,每天已有大量的語料匯入系統(tǒng)!按髱焸儭币龅氖峭晟片F(xiàn)有系統(tǒng)以及在此基礎(chǔ)上進一步研發(fā)語義分析等更高端的領(lǐng)域。
“后金耳麥時代”,Nuance的發(fā)展模式一直是沈康麒所在團隊分析和學(xué)習(xí)的,時至今日,沈康麒憑借一口氣做出了車音網(wǎng),多少受到了Nuance的影響。而在國內(nèi)市場未成形的今天,遠未達到飽和、競爭程度的語音應(yīng)用市場還有很大空間,需要更多同行走進來,把蛋糕做大。
讓語音世界“開源”
蘋果創(chuàng)始人喬布斯所賦予幾千萬iPhone粉絲的是什么?是一個平臺。當(dāng)足夠多的用戶欣賞它的結(jié)構(gòu)時,在喬老爺子提供的商業(yè)模式下,大量的開發(fā)者讓iPhone的應(yīng)用數(shù)不勝數(shù)。正所謂一流的企業(yè)做標(biāo)準(zhǔn),二流的企業(yè)做服務(wù),三流的企業(yè)才賣產(chǎn)品。喬布斯就是這樣引領(lǐng)了產(chǎn)業(yè)的標(biāo)準(zhǔn),智能手機的市場做得越大,這樣的標(biāo)準(zhǔn)就越值錢,處在最上層的喬布斯實際上拿到的錢更多。
喬布斯不會選擇一個荒蕪的產(chǎn)業(yè)去制定他的標(biāo)準(zhǔn),這個機會留給了劉慶峰,也留給了沈康麒。國內(nèi)外頂級風(fēng)投對語音識別的看好,多少是這個荒蕪的產(chǎn)業(yè)向肥沃轉(zhuǎn)變的前兆。沈康麒作為站在產(chǎn)業(yè)前端的一份子,在車載語音識別這塊地上,已經(jīng)收獲不小。最實在的當(dāng)屬他對用戶需求的把握。對車音網(wǎng)4萬用戶的統(tǒng)計表明,約70%的用戶是女性,年齡普遍在20~35歲之間,所擁有轎車的價位主要集中在10萬~30萬元。有了這些經(jīng)驗,沈康麒手中的資源,從研發(fā)到產(chǎn)業(yè)模式,將會更加有的放矢。這也是支撐他在2010年12月的特馬高峰論壇上所說“明年會有30萬用戶接入我們的平臺”的后盾。
但是5年之后又會怎樣呢?市場再大也會有飽和的一天,當(dāng)這個模式被認可時,一夜之間便可以有無數(shù)同類企業(yè)加入競爭,2004年、2005年的SP亂象就是一個前例。不止一次地被證明,從最流行的電子產(chǎn)品iPhone,到名牌球鞋,從高精尖的科學(xué)技術(shù),到頂級的經(jīng)營理念,用超常的模仿能力彌補匱乏的創(chuàng)造力,乃眾多中國商人所長。在此之前的一句話換一個說法就是,低級的模仿者模仿產(chǎn)品,中級的模仿者模仿產(chǎn)業(yè)模式,而高級的模仿者模仿喬布斯!拔覀兒芟M谡Z音這個層面上,做中國喬布斯。這是個夢想,也是個大話,但是我的路子要這么走!蓖趿康脑挃S地有聲。
對于這樣的“大話”,車音網(wǎng)最基礎(chǔ)的依仗來自于對商用級的語音平臺的積累。目前車音網(wǎng)在運營的車載語音平臺,不論是和聯(lián)通還是和移動合作的,只是在車聯(lián)網(wǎng)領(lǐng)域的范例。毫無疑問,車音網(wǎng)將在車聯(lián)網(wǎng)領(lǐng)域持續(xù)深耕,而他們很多正在和將要進行的各種高端的研發(fā),很可能和一個用于語音產(chǎn)業(yè)的普適云平臺有關(guān)。這個云平臺將在銀行、金融、教育等各行各業(yè)中適用,并將租賃給行業(yè)下端,由不同的行業(yè)發(fā)展出適合自身的商業(yè)模式及應(yīng)用。王力劭說起這個新構(gòu)想,顯得神采奕奕:“我將用一個極低的成本,讓門檻很高的語音技術(shù)平民化,然后用規(guī)模效應(yīng),用云計算本身有的模式,去獲取我在上端那一塊。盈利對一個公司是必須的,但繁榮語音市場也是我們的使命!彼踔猎O(shè)想今后在車聯(lián)網(wǎng)領(lǐng)域引進諸多類似的合作商,這些合作商選擇的運營商和平臺可能不同,但是他們手中的武器則都是他這個語音云平臺。通過語音平臺加上諸多參與者的無限創(chuàng)造力,百花齊放地構(gòu)建更多的應(yīng)用模式。
王力劭對于這個想法的坦誠,源自他的寂寞。畢竟語音產(chǎn)業(yè)人丁稀薄,這對所有人都是一種風(fēng)險。只有在產(chǎn)業(yè)壯大之后車音網(wǎng)的平臺開放策略才有可能實現(xiàn)。王力劭表示,實現(xiàn)這個開放的目標(biāo)將會用去3~5年時間。
相比于車音網(wǎng)的縱深行業(yè)積累優(yōu)勢,“競爭隊友”科大訊飛的長期研發(fā)優(yōu)勢似乎讓他們看起來同樣非常適合這一經(jīng)營模式。也許,5年后的車音網(wǎng)實現(xiàn)了他們的夢想,而科大訊飛也會成為車音網(wǎng)對面的Android?而對沈康麒等人來說,10年的語料積累,兩次重大抉擇中打磨出來的商業(yè)模式和他們?yōu)檫@個商業(yè)模式所付出的代價,讓他們有充足的自信和理由向“競爭隊友”們張開懷抱,合作式競爭。
《中國經(jīng)濟和信息化》雜志
相關(guān)閱讀: