分析音頻技術Siren 14
美國寶利通(中國區(qū))公司 陳鐘琰
2004/08/17
對高質(zhì)量的視頻會議來說,什么是最重要的產(chǎn)品功能?大多數(shù)人可能回答說是出色的視頻質(zhì)量。然而,卓越的音頻品質(zhì)也是視頻通信中不可或缺的重要因素,因為在視頻會議中對話和討論通常是最重要的溝通手段,傳遞了與會者之間的交流信息,可以說高質(zhì)量的音頻也許比視頻來得更重要。
Siren 14技術能提供14kHz的音頻保真度,實現(xiàn)自然的語音交流,避免由于音頻質(zhì)量不好造成的長時間通話疲勞,讓與會者彼此聽得更清晰,利于相互間的交流。
為什么采用它?
當人們處在同一個房間時,如何來定義音頻質(zhì)量水平呢?首先,人的耳朵可以聽到的音頻范圍為20Hz~20kHz,人的聲音一般是在100Hz~7kHz之間,而音樂和其他聲源發(fā)出的聲音一般范圍更大,例如:
- CD播放機:20Hz~20kHz
- 調(diào)頻收音機:最高為15kHz
- 中波收音機:最高為5kHz
- 電話:最高為3.4kHz
如果要讓與會者能聽到全頻段的聲音,視頻會議系統(tǒng)應該能夠回放從20Hz~20kHz范圍內(nèi)的音頻。因此,為了保證與會者聽到遠端發(fā)言者的全頻段聲音,系統(tǒng)需要滿足提供14
kHz“接近CD音質(zhì)”的音頻質(zhì)量,即必須回放至少7kHz的音頻。
專為可擴展的寬帶音頻解決方案而設計的Siren算法,能在24kbps~48kbps(目前視頻會議中音頻通信通用的帶寬環(huán)境)帶寬上實現(xiàn)14kHz音頻質(zhì)量,結(jié)合回音消除技術,可以使本地和遠端的通話者盡享同時發(fā)言的自然交流方式,而不會損失信號。與其他音頻算法相比,在較低的網(wǎng)速下,Siren 14能夠提供比MPEG 3和MPEG 4更流暢、更出色的音質(zhì)。
誰來與它搭檔
大多數(shù)視頻會議系統(tǒng)使用簡單的定向麥克風。一般來說,這種麥克風有一個以麥克風指向為軸正負45度的拾音范圍。這種麥克風的缺點是,除了那些靠近麥克風的發(fā)言者,人們很難聽清楚坐在麥克風拾音范圍以外的發(fā)言者的發(fā)言,因此要求麥克風能在半徑7英尺(2.13米)范圍內(nèi)進行360度拾音。同時需要擁有背景噪音消除功能,能消除排風機、電扇等發(fā)出的背景噪音,為大多數(shù)的會議環(huán)境提供近乎無噪音的音頻效果。如此,坐在會議室任何位置的與會者,將不用擔心遠端的參會者是否能夠聽到他們的發(fā)言。
對于視頻會議音頻保真度同樣重要的另一個因素是高質(zhì)量的揚聲器。通常,人們會使用電視揚聲器來作為視頻會議的揚聲器。但是對于回放發(fā)言者的語音信號來說,這些揚聲器并不是一個很好的選擇,而語音信號恰恰是視頻會議應用中重要的通信內(nèi)容。通常電視揚聲器的設計原則是要以最低的價格來實現(xiàn)全帶寬的音頻,結(jié)果導致其效果就像是簡單的、便攜式立體聲系統(tǒng),而對于視頻會議來說,清晰的語音質(zhì)量是揚聲器設計中最重要的因素。
因此可以說,配合Siren 14技術使用高質(zhì)量的麥克風和揚聲器將使你的視訊系統(tǒng)達到事半功倍的效果。
計算機世界網(wǎng)(www.ccw.com.cn)
相關鏈接: