首頁>>>技術(shù)>>>語音應(yīng)用>>>語音識別(ASR)  語音識別產(chǎn)品

掌握自主視音頻編解碼技術(shù)標(biāo)準(zhǔn) 擎起民族數(shù)字多媒體產(chǎn)業(yè)的大旗
——漢唐編解碼核心技術(shù)為國家產(chǎn)業(yè)標(biāo)準(zhǔn)提供基礎(chǔ)

2002/09/13

  隨著互聯(lián)網(wǎng)的飛速發(fā)展,消費類電子、通信、電視電影廣播、計算機技術(shù)日益緊密地結(jié)合起來,計算機與通訊、娛樂業(yè)融合的趨勢不可逆轉(zhuǎn),使得基于互聯(lián)網(wǎng)的數(shù)字視音頻產(chǎn)業(yè)(即數(shù)字多媒體產(chǎn)業(yè))成為本世紀(jì)初發(fā)展最快、規(guī)模最大的產(chǎn)業(yè)。而數(shù)字視音頻產(chǎn)業(yè)的核心技術(shù)是視音頻編解碼軟件技術(shù),發(fā)展新一代視音頻編解碼軟件技術(shù)成為全球關(guān)注的焦點。

  目前,象微軟、IBM、思科、英特爾、飛利浦、蘋果、摩托羅拉、諾基亞、SONY、東芝、REAL等公司都在競爭新一代的視音頻編解碼技術(shù),爭奪數(shù)字視音頻標(biāo)準(zhǔn)、產(chǎn)品、市場的控制權(quán)。IT界的巨頭微軟已經(jīng)著手調(diào)整其新世紀(jì)的戰(zhàn)略發(fā)展方向,全面向數(shù)字視音頻多媒體領(lǐng)域進軍。

  當(dāng)前國際上主流的新一代視音頻編解碼軟件技術(shù)標(biāo)準(zhǔn):國際運動圖像專家組于1999年公布MPEG-4技術(shù)標(biāo)準(zhǔn),將逐漸取代現(xiàn)有的MPEG-1(VCD)、MPEG-2(DVD)標(biāo)準(zhǔn)。MPEG-4主要為了實現(xiàn)在有線、移動網(wǎng)絡(luò)上傳輸互動的視音頻內(nèi)容,目前世界主要公司的編解碼軟件都支持MPEG-4標(biāo)準(zhǔn)。雖然微軟等幾個公司在發(fā)展自己的技術(shù)和標(biāo)準(zhǔn),但都脫不開MPEG-4標(biāo)準(zhǔn)底層的基礎(chǔ)專利技術(shù)。MPEG-4等編解碼技術(shù)的革命,極大的擴展了數(shù)字多媒體嶄新的應(yīng)用市場。

  我國作為世界最大的視音頻產(chǎn)品市場,必須把握住這個幾十年不遇的歷史機遇,打破國外在這個領(lǐng)域的壟斷,發(fā)展新一代的自主知識產(chǎn)權(quán)的視音頻編解碼軟件技術(shù)和產(chǎn)品,建立我國自主知識產(chǎn)權(quán)的視音頻編解碼標(biāo)準(zhǔn)(相當(dāng)或超過MPEG-4)。這是我國視音頻多媒體產(chǎn)業(yè)發(fā)展的關(guān)鍵,也是我國軟件業(yè)當(dāng)前最重要的任務(wù)。一方面,在政府組織下力爭建立符合或超過MPEG-4標(biāo)準(zhǔn)的、基本具有自主知識產(chǎn)權(quán)的編解碼技術(shù)標(biāo)準(zhǔn)體系;同時,我們應(yīng)該大力支持開發(fā)符合或超過MPEG-4標(biāo)準(zhǔn)的自主知識產(chǎn)權(quán)的先進的編解碼軟件技術(shù)和產(chǎn)品。

  一、發(fā)展視音頻編解碼軟件對國民經(jīng)濟發(fā)展的重大意義

  新一代的視音頻編解碼軟件技術(shù)屬于在市場前景好、產(chǎn)業(yè)關(guān)聯(lián)度大、關(guān)系國民經(jīng)濟發(fā)展和國家安全的戰(zhàn)略性技術(shù),是數(shù)字視音頻產(chǎn)業(yè)的核心技術(shù),發(fā)展編解碼軟件技術(shù),既可以占領(lǐng)編解碼軟件市場,也是發(fā)展數(shù)字多媒體產(chǎn)業(yè)的基礎(chǔ)。所以,該戰(zhàn)略技術(shù)應(yīng)引起我們的高度重視。

  1、數(shù)字視音頻產(chǎn)業(yè)的規(guī)模巨大

  數(shù)字視音頻產(chǎn)業(yè)是今后幾年世界上發(fā)展最快的產(chǎn)業(yè)。信息產(chǎn)業(yè)部2001年度的《電子信息產(chǎn)品投資指南》的調(diào)查顯示,到2005年我國的數(shù)字視頻產(chǎn)業(yè)(不含數(shù)字音頻)將是一個4000億元產(chǎn)值的朝陽產(chǎn)業(yè)。到2008年,數(shù)字視音頻產(chǎn)業(yè)年產(chǎn)值將達9000萬元,超過通信產(chǎn)業(yè)成為信息產(chǎn)業(yè)第一大產(chǎn)業(yè)。到2010年將達到15000億,成為國民經(jīng)濟第一大支柱產(chǎn)業(yè)。從現(xiàn)在到2010年,國內(nèi)數(shù)字視音頻市場規(guī)?傆嫾s為5萬億以上,其中視音頻編解碼軟件市場超過2000億。廣電領(lǐng)域是視音頻產(chǎn)業(yè)鏈的戰(zhàn)略制高點,占領(lǐng)影視廣播業(yè)的媒體格式發(fā)布市場的技術(shù),就占領(lǐng)了產(chǎn)業(yè)標(biāo)準(zhǔn)及整個視音頻市場。

  2、視音頻編解碼軟件的市場規(guī)模也很巨大

  視音頻編解碼軟件作為視音頻產(chǎn)業(yè)的核心技術(shù),占整個視音頻產(chǎn)業(yè)市場的4%左右。從2005年以后,這是一個每年幾百億的國內(nèi)市場,全球市場更不可限量。編解碼軟件產(chǎn)品主要有流媒體系統(tǒng)軟件、嵌入式編解碼軟件、專利技術(shù)授權(quán)、編解碼軟件授權(quán)等系列產(chǎn)品,其所能涉及的領(lǐng)域非常廣泛。

  3、對相關(guān)產(chǎn)業(yè)的發(fā)展有巨大的帶動作用

  視音頻產(chǎn)業(yè)覆蓋面很廣,其應(yīng)用技術(shù)涉及很多其他產(chǎn)業(yè),視音頻產(chǎn)業(yè)的發(fā)展必將帶動如下這些相關(guān)應(yīng)用產(chǎn)業(yè)的發(fā)展,包括:軟件業(yè)、大規(guī)模集成電路產(chǎn)業(yè)、影視廣播業(yè)、數(shù)字電視業(yè)、寬帶通信業(yè)、移動多媒體通信業(yè)、電子出版業(yè)、軍用領(lǐng)域等。在這些產(chǎn)業(yè)中的典型應(yīng)用如下:

  ○網(wǎng)絡(luò)視頻點播、遠程教育、遠程監(jiān)控、視頻會議、遠程醫(yī)療等計算機應(yīng)用系統(tǒng)

  ○集成電路編解碼芯片、數(shù)字電視機、數(shù)字電視機頂盒、影碟播放機、高密度光盤、多媒體手機、數(shù)字?jǐn)z像機等消費類電子產(chǎn)品

  ○2.5G\3G的無線視頻、多媒體通信系統(tǒng)

  ○視音頻節(jié)目的媒體格式發(fā)布、交互式數(shù)字電視系統(tǒng)、多媒體制作發(fā)行系統(tǒng)等影視廣播業(yè)的應(yīng)用

  ○軍用:航空偵察系統(tǒng)、巡航導(dǎo)彈系統(tǒng)、單兵作戰(zhàn)偵察指揮系統(tǒng)

  二、開發(fā)自主知識產(chǎn)權(quán)的視音頻編解碼技術(shù)和標(biāo)準(zhǔn)的必要性在關(guān)系到國家經(jīng)濟命脈和安全的核心技術(shù)領(lǐng)域,要以自主創(chuàng)新產(chǎn)業(yè)化為主發(fā)展。所以我們必須制定我國自己的編解碼標(biāo)準(zhǔn),開發(fā)自主知識產(chǎn)權(quán)的超過或相當(dāng)于MPEG-4標(biāo)準(zhǔn)的編解碼技術(shù)和產(chǎn)品。

  1、產(chǎn)業(yè)發(fā)展的需要

  產(chǎn)業(yè)發(fā)展的基礎(chǔ)是標(biāo)準(zhǔn),標(biāo)準(zhǔn)的基礎(chǔ)是核心技術(shù)。高科技產(chǎn)業(yè)的競爭主要就是標(biāo)準(zhǔn)的競爭,核心技術(shù)的競爭。標(biāo)準(zhǔn)與核心技術(shù)已經(jīng)成為產(chǎn)業(yè)競爭的最主要的壁壘,只有掌握了產(chǎn)業(yè)標(biāo)準(zhǔn)與核心技術(shù),才能保證產(chǎn)業(yè)的發(fā)展。視音頻產(chǎn)業(yè)的基礎(chǔ)是視音頻編解碼標(biāo)準(zhǔn),視音頻編解碼標(biāo)準(zhǔn)的基礎(chǔ)是視音頻編解碼軟件技術(shù)。所以掌握自主知識產(chǎn)權(quán)的編解碼技術(shù),建立自主的編解碼標(biāo)準(zhǔn),是發(fā)展我國視音頻產(chǎn)業(yè)的前提和基礎(chǔ)。

  震驚整個民族的DVD事件,就是因為我國沒有自主的視音頻編解碼軟件技術(shù)和編解碼標(biāo)準(zhǔn)造成的,DVD產(chǎn)業(yè)危在旦夕。今后的視音頻產(chǎn)業(yè)發(fā)展更為廣闊,發(fā)展自主的編解碼軟件技術(shù)、產(chǎn)品、標(biāo)準(zhǔn)迫在眉睫!

  2、國家信息安全的需要

  不掌握視音頻編解碼軟件核心技術(shù),就無法保證國家的信息安全。

 、、用國外的產(chǎn)品存在安全問題

  例如微軟的流媒體編解碼軟件可以獲取用戶的視音頻內(nèi)容,也可以輕易改變其系統(tǒng)傳輸、播放的視音頻內(nèi)容,這無論對于國家還是企業(yè)都是非常重大的安全問題。

  ②、國家多媒體通訊的安全需要

  通信技術(shù)正從傳統(tǒng)的語音通信向基于互聯(lián)網(wǎng)的以視音頻為主的多媒體通信方向發(fā)展,多媒體通信是今后最主要的通信方式,(MPEG-4)視音頻編解碼軟件技術(shù)是多媒體通信的核心技術(shù)。2.5/3G移動多媒體通信、會議電視、遠程監(jiān)控、可視電話、視頻點播等快速發(fā)展,很多重要的傳輸內(nèi)容都需要保密。

 、、國家文化宣傳、意識形態(tài)領(lǐng)域的安全需要

  數(shù)字電視、網(wǎng)絡(luò)電視臺等都是基于互聯(lián)網(wǎng)絡(luò)用類似(MPEG-4)技術(shù)傳輸內(nèi)容的,用國外產(chǎn)品,外方可以輕易系統(tǒng)傳輸、播放的視音頻內(nèi)容,有可能造成國家政治、信息、文化的重大影響。前段時間法輪功邪教組織利用干擾衛(wèi)星微波發(fā)射、切割線纜插播的方式破壞我國的電視系統(tǒng),就是一個應(yīng)警惕的教訓(xùn)。

  3、國防安全的需要

  另外,(MPEG-4)編解碼技術(shù)在軍用領(lǐng)域地位重要,是航空偵察系統(tǒng)、巡航導(dǎo)彈系統(tǒng)、單兵作戰(zhàn)偵察指揮系統(tǒng)的關(guān)鍵核心技術(shù)。

  三、傲行視音頻編解碼軟件為我國制定具有自主知識產(chǎn)權(quán)的編解碼和流媒體技術(shù)標(biāo)準(zhǔn)提供技術(shù)和產(chǎn)品基礎(chǔ)

  上海漢唐科技有限公司是總部設(shè)在上海的一家高科技企業(yè),從1999年初開始從事MPEG-4視頻編解碼技術(shù)研究和產(chǎn)品開發(fā),先后投入近2000萬資金。目前是國內(nèi)唯一擁有自主知識產(chǎn)權(quán)的MPEG-4視頻編解碼軟件技術(shù)、流媒體服務(wù)器技術(shù)、嵌入式編解碼軟件(Dsp芯片)技術(shù)及產(chǎn)品的公司,與微軟等國際先進水平產(chǎn)品技術(shù)同步。漢唐的傲行系列視音頻編解碼軟件,擁有大量專利技術(shù),產(chǎn)品目前支持MPEG-4標(biāo)準(zhǔn),但公司目前自主知識產(chǎn)權(quán)的技術(shù)有部分已經(jīng)超過MPEG-4標(biāo)準(zhǔn)。

  漢唐擁有編解碼軟件相關(guān)的全線產(chǎn)品,包括:流媒體系統(tǒng)軟件、嵌入式編解碼軟件、專利技術(shù)授權(quán)、編解碼軟件授權(quán)等系列產(chǎn)品。2002年6月中旬推出了流媒體平臺系統(tǒng)、嵌入式編解碼軟件系統(tǒng)(DSP芯片)、視頻點直播系統(tǒng),同時正在與合作伙伴共同開發(fā)視音頻編碼卡、會議電視系統(tǒng)、遠程教育系統(tǒng)。傲行流媒體系統(tǒng)平臺經(jīng)過與微軟、Real等產(chǎn)品的競爭,已經(jīng)在國內(nèi)信息產(chǎn)業(yè)部的賽迪網(wǎng)、上海嘉定電信局、河南電信、南京有線等幾十個用戶處成功使用,市場效果非常理想,目前正在開拓北美市場。傲行嵌入式編解碼軟件(Dsp)技術(shù)國際領(lǐng)先,目前正與國際上一些跨國公司洽談,合作開發(fā)集成電路編解碼芯片或視頻編解碼卡。

  數(shù)字視音頻產(chǎn)業(yè)市場潛力巨大,目前國際上一些大公司對國內(nèi)這個巨大的市場虎視眈眈,微軟已經(jīng)在國內(nèi)投放產(chǎn)品,想壟斷國內(nèi)市場,壟斷產(chǎn)業(yè)標(biāo)準(zhǔn)。作為國內(nèi)唯一擁有自主知識產(chǎn)權(quán)的MPEG-4視頻編解碼軟件技術(shù)、流媒體服務(wù)器技術(shù)、嵌入式編解碼軟件(Dsp芯片)技術(shù)及產(chǎn)品的公司,漢唐一定會擔(dān)負起民族產(chǎn)業(yè)的重任,為我國的數(shù)字視音頻產(chǎn)業(yè)的發(fā)展作出自己的貢獻。

  漢唐一直在努力,但這個市場是大資金、高技術(shù)的競爭,國外競爭對手強大,國際上技術(shù)進步很快,單靠企業(yè)自身實力發(fā)展速度太慢。公司目前正在積極爭取融資,爭取政府支持,以便獲得繼續(xù)研發(fā)和市場的費用,更好地完成發(fā)展民族產(chǎn)業(yè)地任務(wù)。

  四、結(jié)束語:

  總之,在標(biāo)準(zhǔn)的市場,如果失去了進入市場的先機,就喪失了競爭的資格。國際上正處于流媒體技術(shù)標(biāo)準(zhǔn)競爭的緊要關(guān)頭,對我國發(fā)展視音頻產(chǎn)業(yè)是機遇、也是挑戰(zhàn)。我國既是世界最大的視音頻產(chǎn)品的市場,也是最大的視音頻產(chǎn)品的生產(chǎn)國,這是我國建立自己的視音頻標(biāo)準(zhǔn)并推廣成為國際標(biāo)準(zhǔn)或事實標(biāo)準(zhǔn)的得天獨厚的條件。我們要從DVD危機中吸取教訓(xùn),把握住機會,及時采取正確的方法應(yīng)對。掌握核心技術(shù),建立我國自主的(與世界主流標(biāo)準(zhǔn)相當(dāng))的數(shù)字視音頻編解碼技術(shù)標(biāo)準(zhǔn)體系,大力發(fā)展數(shù)字視音頻產(chǎn)業(yè),對我國的經(jīng)濟發(fā)展、國家安全等有戰(zhàn)略意義。

新浪科技


相關(guān)鏈接:
美國Navman發(fā)表iPAQ用語音GPS導(dǎo)航系統(tǒng) 2002-09-13
美ISP推出語音郵件 電子郵件不寫只說 2002-09-12
捷通華聲TTS助南昌火車站提升客服水平 2002-09-06
言豐科技與新加坡淡馬钖理工學(xué)院合作設(shè)立語音技術(shù)研究所 2002-09-05
DragonBall處理器將具有語音識別功能 2002-09-05

分類信息:  語音合成TTS_與_語音識別ASR     新聞頻道   技術(shù)_語音合成_新聞   技術(shù)_語音識別_新聞