首頁>>>技術>>>視像通信  視像通信產(chǎn)品

云計算讓視頻識別成為現(xiàn)實

2010/08/25

  北京時間8月24日消息,三網(wǎng)融合中國峰會在北京召開。天脈聚源(北京)傳媒科技有限公司執(zhí)行總裁尹遜鈺參加了本次論壇并發(fā)表主題演講。

  尹遜鈺:謝謝各位,我今天演講的題目大家看一下叫“視頻中國,共贏云端”,今天聽了很多專家的講解,今天的收獲也很大。在視頻領域,尤其在三網(wǎng)融合的視頻領域,哪些部分可以由云計算完成的?

  過去我們了解了云計算的方向發(fā)展,包括科技,大家往往覺得云計算離我們很遠,包括無錫有IBM的云計算中心,曙光6000等大型計算機都在做云計算,F(xiàn)實生活中有沒有根據(jù)我們視頻行業(yè)有關的云計算案例,今天我們就把這塊與大家分享一下。

  在座各位都是廣電領域的專家,包括網(wǎng)絡公司、電視臺、企業(yè)和廠商的,我們要做三網(wǎng)融合的平臺,除了網(wǎng)絡之外還有三部分,一是內(nèi)容,二是平臺,三是產(chǎn)品。這是怎么也繞不開的,你必須得有大量的內(nèi)容,有好的傳輸平臺和好的運營平成、支撐平臺才能夠構(gòu)架出業(yè)務體系,最終得有好的產(chǎn)品化包裝,才能讓用戶買單,才能有人群來使用,才能產(chǎn)生商業(yè)價值。今天我會重點針對內(nèi)容角度,平臺和產(chǎn)品更多是由廣電運營商來建設,而內(nèi)容建設,我們認為會有新的解決方案提供這樣的服務,來把海量的內(nèi)容經(jīng)過云端處理,把內(nèi)容發(fā)送給不同的合作伙伴之中。

  很多人講廣電是以內(nèi)容為王,的確也是這樣,因為有內(nèi)容的牌照,我們才能在三網(wǎng)融合掌握先機,掌握市場準入的機會,達到目前的狀況。同時,這些海量到底有多大的利用率?據(jù)我了解,電視臺或者電視網(wǎng)絡公司都有大量的內(nèi)容,但都是以傳統(tǒng)的方式存在,包括帶庫生產(chǎn)效率和新媒體化是很低的。有一個統(tǒng)計,目前只能利用到7%,還有90%多的內(nèi)容沒有被利用到。為什么呢?這塊內(nèi)容缺乏有效和高效的生產(chǎn)和處理手段來迅速轉(zhuǎn)變成基于互聯(lián)網(wǎng)上的,基于手機上的,基于IPTV的快速的面向用戶的產(chǎn)品,網(wǎng)絡是一個快速消費品,和電視還是有點不同的,電視的播出是由編導、導演的思路決定,我們電視每天要做的事情并不復雜,是一兩個編導決定下來要過什么東西,從庫里調(diào)出來,或者到外面拍攝,選擇素材就可以了,但物聯(lián)網(wǎng)不是,內(nèi)容選擇權(quán)要交給用戶,而不是自己,當你有這種選擇權(quán)的時候,就會發(fā)現(xiàn)這種選擇權(quán)變得非常重要,這該需要龐大的資源體系。

  當前電視臺和網(wǎng)絡電視臺在做新媒體的時候更多采用傳統(tǒng)公司非編的方式來做,昨天晚上下班之前我在車里看到消息,就是菲律賓劫持人質(zhì),7點半到8點之間,當時也播放了現(xiàn)場畫面,說剛剛有15個人被殺死了,當時我非常愿意見證這個市場。我就在停車的時候用我的iPad打開了,當時通過iPad通過鳳凰咨詢臺全程直播,打開的時候確實出現(xiàn)了窗口出現(xiàn)了六個彈孔,說明剛剛發(fā)生槍戰(zhàn)的過程。當突發(fā)事件出現(xiàn)的時候,能不能借助好的新媒體終端快速看到這些內(nèi)容,這就是網(wǎng)絡所帶給我們的轉(zhuǎn)變,以往電視播出很簡單,你要守在電視前,現(xiàn)在不是這樣。

  今天早上遇到紅燈我同事在做另外的事情,到底有多少人傷亡,因為昨天晚上沒有明確答案,我搜索到全國電視臺關于境外的頻道最新報道菲律賓劫持人質(zhì)的事情。我這里有剛剛?cè)c鐘的報道,所以,互聯(lián)網(wǎng)的內(nèi)容很多是來自于傳統(tǒng)的,但傳統(tǒng)的內(nèi)容需要高效的方法變成互聯(lián)網(wǎng)化、顆;,信息的播出是連續(xù)的內(nèi)容,而不是針對現(xiàn)在越來越完善,越來越簡單精致的新終端的模式。

  如果在座各位下面有專門做產(chǎn)品和運營的朋友可能會有這樣的想法,大家會有一個夢想,我們會有一個訴求,能不能在我們每天晚上睡覺的時候,來自于電視臺上大量的內(nèi)容就能夠自動地被收錄或截取成有效的,適合于互聯(lián)網(wǎng)或者新媒體播出的資源,每天電視頻道播了這么多東西,我們把數(shù)字化好,把有用的信息提取出來,這要快,要準,要省錢、省力。因為內(nèi)容處理本身是一個體力活,沒有太多的技術含量,就是一個數(shù)字化的過程。但數(shù)字化過程本身并不意味著簡單地把內(nèi)容錄制下來或者把內(nèi)容做一個直播,這個意義是不大的,更多的是要把你有價值信息里的核心內(nèi)容整理出來,建立好有效的標簽、標準的機制。

  我們同時還在想,電視內(nèi)容是一方面,還需要把現(xiàn)有媒資和第三方合作伙伴的資源和用戶上載的資源變成我強大的資源平臺而一致面向我各種各樣的終端:電腦、手機或互聯(lián)網(wǎng)、電視來進行發(fā)布。我想大家都有這樣的想法。

  歸結(jié)下來,從實際的問題來講,除了我們在播控平臺的流程、政策方面的理解以外,實際開展這項業(yè)務的時候,的確會有這幾個任務出現(xiàn),我列出了幾個問題,一是信源的要求,電視、媒資庫、第三方內(nèi)容、UGC。二是編碼質(zhì)量,高清收錄,高清編碼,采用H.264協(xié)議。三是處理能力,我們必須把自己從煤老板變成“媒老板”。四是處理效率,能不能做到電視發(fā)生了以后,我十分鐘就可以檢索到這個事件,通過各種通道看到它,這是用戶的最終使用行為,為什么用戶不用電視、IPTV一定要用電腦來看,一定是傳統(tǒng)媒體無法滿足的,就是時效性。四是碎片化,把一個個內(nèi)容變成非常精準的內(nèi)容。五是模式識別,盡量提取電視語音的特征幫你構(gòu)成索引。六是做好新的媒體標引的屬性。網(wǎng)絡電視都有一些媒資,傳統(tǒng)媒資側(cè)重編導、節(jié)目制作角度去做,比如場景、角度,而新媒體的媒資面向應用的,傳統(tǒng)媒資好比圖書館,面向?qū)<液蛯W者服務的,新媒資像亞馬遜,像賣書的,資料賣給1萬多人的,需要新的標引重新建立,以往的媒資不能滿足快速網(wǎng)絡化消費。七是內(nèi)容支持,iPad既不是手機,也不是電腦,但可以3G上網(wǎng),我們很多政策對手機的約定對它是無效的,這些東西都是我們要考慮的。八是業(yè)務支持,就是要考慮基于視頻的業(yè)務,直播、輪播、回看和搜索。八是產(chǎn)品能力,就是信息整合,信息關聯(lián)和信息挖掘,這是根據(jù)你的平臺和廣告做出的具體的數(shù)據(jù)體系。

  這是我搜索到的菲律賓人質(zhì)的劫持事件,這是天脈在無錫建立的云計算收錄平臺,給各大有線電視臺提供電視臺收錄、碎片化的處理,現(xiàn)在大概有200人、500個服務器,600T存儲,每天進行生產(chǎn),而且是源源不斷的。這是下午14:02馬尼拉事件的報道,這是CNN的。當前我們采用云計算的模式到底能做什么,為什么要這么做?中午12:20的新聞,北京電視臺播出的。這是一段電視節(jié)目,是標清的質(zhì)量,應該是在1.3M H.264的編碼。我們在云計算的時候是把一個完整電視新聞或者新聞內(nèi)容碎片化,把廣告剔除,只剔除出內(nèi)部的文本,F(xiàn)在天脈已經(jīng)把語音識別、文字識別處理程度達到95%以上是自動化完成的,有了語音識別的模式以后,對我來講,我在對視頻的理解,就可以把它當成文字一樣,我在搜索任何一個視頻的時候,在搜索文本的時候就找到視頻的內(nèi)容,這個文字就是播音員的話,視頻的內(nèi)容反復在文字旁邊反復播控。這是高碼流、中碼流,手機、IPTV、互聯(lián)網(wǎng)全部特征和索引體系,這個體系到了用戶端可以迅速地構(gòu)建出一個有效的應用,因為對外發(fā)布來講,基礎內(nèi)容有了,碎片化特征有了,欄目特征有了,主持人特征有了,里面的標清語音特征有了,這就是云計算的過程。用人工校對的話,每個文字和畫面進行精準對應的話,這個2分鐘的視頻沒有一天是做不出來的。這是建立公共云的必要性。

  這是平臺的商用情況。天脈這個平臺目前定義為視頻中國海量視頻云計算中心,定位為無錫國家物聯(lián)網(wǎng)產(chǎn)業(yè)園。目前天脈有三個機構(gòu),分別坐落于北京、無錫和上海,在北京主要做核心研發(fā),各種各樣模式識別的技術,手機、終端技術、互動展示技術,最近大家有沒有注意到央視的《豪門盛宴》“阿凡達”的事情都是天脈來做的,一方面要看源頭,有沒有東西,有了東西之后能不能賣出去,所以,我們在做第二個事情就是內(nèi)容怎么展現(xiàn)。

  整個天脈有400多號人,無錫云計算中心,每天有400多臺服務器源源不斷地處理著來自中國各地的電視節(jié)目,現(xiàn)在能處理200個頻道,2000檔欄目,3萬條信息。目前我們在無錫云計算中心已經(jīng)是世界最大的電視采集收錄基地,國外數(shù)量沒有這么多,這個模式可能不成立。

  因為各省、各城市都需要做這個事情,其實電視收錄本身是一個體力活,如果用人去做的話,有點太殘酷了,其實它就應該讓機器去完成,但現(xiàn)在的形狀又不令人樂觀,很多地方都在建立小而全的小型收錄,效率非常低下,都是靠人一條處理的,這沒有必要;ヂ(lián)網(wǎng)建立以后,異地采集,異地存儲,遠程推送、互聯(lián)網(wǎng)交付都已經(jīng)變成一個很實在的東西了,不再是個概念了。天脈做這個事情已經(jīng)一年多了,我們現(xiàn)在已經(jīng)為很多大型用戶做異地采集,遠程傳輸,成品推送這樣的服務。

  基于這一點,我們有一個比較多或者比較完善的技術體系來實現(xiàn),這個體系不是一個科研室的產(chǎn)品,也不是我們設計中的一個理念,而是實實在在在商用過程中的東西。一是海量的處理,當你處理10個或者20個頻道都不算海量,當你能處理幾千檔欄目就是海量。智能識別,語音識別的東西,很多用小軟件也可以看到,但用到商用上替代人這有一個過程,而且它適合不同方言,不同地域的過程也是很復雜的過程。

  模式識別,畫面比對,我們會知道什么是廣告,廣告與文字中的區(qū)別,也需要大量的廣告識別,而且怎么樣讓它通過Google搜索電視也是我們強調(diào)的。還有面對無數(shù)的終端,終端非常多,它的格式是什么樣的,有的是用戶原有的,有的是新格式的,所以需要非常強大的轉(zhuǎn)碼系統(tǒng),不是一兩個轉(zhuǎn)碼系統(tǒng)就可以了,而是需要云,吃進去的是草,擠出來的是奶。整個服務器的云是播出云,提供分發(fā)和CNN流量的,我們這里沒有流量,就是簡單的信號流量進,成品出,但500臺服務器日夜咆哮,運算量都比別人大,因為它真的在做復雜的視頻運算。做云計算來講,包括存儲體系,并行工作的體系我們都做非常好的設計。異地從北京送到上海、無錫計算以后,經(jīng)過人工校對,這里面還會有5%會錯,人名、地名會錯,對國家的一些安全要求必須經(jīng)過人的審核,審核之后到成品中心進行分解,分解之后做推送。

  天脈的案例不是做代工生產(chǎn)平臺,是幫助媒體挖掘出視頻影音的DNA,你表面上看是視頻,實際上是有DNA的,畫面特征有大量豐富信息,意味著你會有不同的表現(xiàn),比如深化同步的部分,在上海文廣他們有一個對海外華人的播出平臺,就是拿這種模式教中文,說中國的普通話,看中國時事的時候看著中國文字。這是一個商業(yè)資源,不僅僅是一個索引資源。

  天脈可以通過云計算把傳統(tǒng)的簡單索引變成立體標引,視頻內(nèi)涵的標引,而且它確實面向前端個性化的,我經(jīng)常會跟現(xiàn)在的一些用戶講,我們要搜一個NBA的比賽,很多人都會說我能找到,我想看火箭隊的比賽我也能找到,但看到姚明出場沒有,但沒有這個特征,因為電視上只有比賽沒有特征,看姚明扣籃的動作肯定沒有,但事實上我就想看姚明的比賽和扣籃,而現(xiàn)在要看姚明的比賽只能看場次,這不符合互聯(lián)網(wǎng)的消費模式的習慣。互聯(lián)網(wǎng)的消費模式是Google一搜就出來了,這個新的處理模式,技術比較復雜,必須構(gòu)建在云端,不能每家獨立建設,煤價獨立建設也需要有龐大的技術成本在里面。

  天脈在給新媒體提供的服務理念里提到三塊:第一我們可以給各個地方做內(nèi)容代加工,開玩笑就是視頻領域的富士康,幫你加工內(nèi)容就可以了,但我雇傭的是機器不是人去做。第二我們幫你做好一套適合于新媒體的標引體系,有了這個體系之后,你就可以快速標引產(chǎn)品,標引離你最近,最不能再做改造。第三創(chuàng)新模式或雙子電視的模式幫你構(gòu)建前端引用,我覺得這應該是運營商、用戶最關心的和我們最擅長的,因為這是我最擅長的。天脈從目前的技術現(xiàn)狀可以做到幾點,三天之內(nèi)可以完成異地電視臺的節(jié)目收購,五天就可以把成品送過去,七天就能幫您構(gòu)筑一套全業(yè)務的資源平臺,包括IPTV、手機和互聯(lián)網(wǎng),十分鐘就能讓用戶你的電視節(jié)目里播出的片斷,一毫秒你可以看到基于毫秒的鏡頭來。

  我的合作案例,目前都是積極比較大的合作案例,天脈云端目前支撐著國內(nèi)幾個大的客戶做,央視,央視需要大量的網(wǎng)絡信號和內(nèi)容,其它公司做不了,我們在給他們提供服務,還有北京文廣、中國教育電視臺、陜西電視臺,安徽電視臺,全部資源平臺推送過去。這是我們給教育電視臺做的,這是給北京電視臺的“北京時間”做的,網(wǎng)絡電視、手機電視、TV社區(qū),互動點播都是我們做的;上海文廣SMG百事通IPTV的內(nèi)容,現(xiàn)在中國IPTV的內(nèi)容做得最成功的就是百事通平臺,有200萬用戶,上海本地100萬,江蘇100萬,無錫這個城市就20萬,央視在云南只有幾萬用戶,加在一起沒有文廣大,所以文廣最成熟。文廣現(xiàn)在實際上主要跟中國電信合作,中國電信提供機頂盒、計費,文廣負責分發(fā)、節(jié)目播控,但節(jié)目源文廣交給我們,直播節(jié)目是文廣推送的,而點播和搜索的內(nèi)容每一都是天脈來提供的,我們制作好的H.264編碼格式的標清視頻流每天Push到上海文廣中心,由上海文廣中心Push到各地SMG來做審核,所以,他對我有要求,什么東西要做一兩小時,什么東西不能過夜等等,新聞類、影視類都交給我,手機上、網(wǎng)站上都交給我們做,其它電視電視臺。

  我們非常想把生產(chǎn)價值展示給前端,所以,我們給冬奧會做了全景大型活動,包括央視的豪門盛宴,這些素材都是通過網(wǎng)絡平臺挖掘的,主持人張斌通過網(wǎng)絡形式進行了新的資源展示,而且做到傳統(tǒng)電視臺的內(nèi)容優(yōu)化和節(jié)目優(yōu)化里,帶來新的收視率,同時我們給上海世博局提供關于上海世博會的媒體監(jiān)測服務。

  我們愿意與在座合作伙伴精誠合作,共贏未來!謝謝大家!

搜狐IT 



相關閱讀:
華為總裁任正非:讓用戶像用電一樣享受云計算 2010-11-30
中國聯(lián)通:云計算架構(gòu)和運營 2010-11-29
云計算架構(gòu)下的設備互操作性亟待解決 2010-11-08
三網(wǎng)融合、云計算等推動下 CDN將成基礎網(wǎng) 2010-11-08
曾鳴:移動互聯(lián)網(wǎng)發(fā)展需突破支付和云計算瓶頸 2010-10-20

熱點專題:  視像通信    云計算
分類信息:  云計算_與_電信
相關頻道:  云計算