技術背景
隨著視音頻編解碼技術的提高,各種基于互聯網絡的遠程音視頻交互迅速普及,音頻采集、編解碼、傳輸等技術得到較快的發(fā)展和進步,各種音頻編解碼標準和網絡傳輸糾錯技術也都有成熟的應用。但是,在現有技術中,網絡帶寬依然是大多數網絡流媒體交互應用的瓶頸。因為在許多應用場合中,網絡帶寬的實時穩(wěn)定性根本無法得到保證。由于網絡帶寬不足或者帶寬不穩(wěn)定,經過編解碼壓縮后的音頻信息可能無法完整的傳輸給接收方,或造成通信中斷,更有甚者,常會因為音頻傳遞質量差而導致信息的接收方誤判傳遞信息,從而造成更大損失。
基于上述問題,業(yè)界目前的做法是借助其他的手段,例如郵件傳遞、拷貝等,將音頻信息發(fā)送給接收方,這樣不但降低了工作效率,而且大大增加了信息交互的時間成本。鑒于以上所述現有技術的缺點,華平創(chuàng)造性的推出了一種音頻信息網絡數字化實時傳輸技術,以解決現有技術中存在的因網絡帶寬不足、不穩(wěn)定,丟包率比較高,致使接收方無法完整接收到音頻信息的問題。
技術介紹
音頻信息網絡數字化實時傳輸技術,應用于具有至少一個音頻信息發(fā)送端及一個音頻信息接收端的網絡架構中。該技術系統(tǒng)包括以下十個模塊:1、音頻信息輸入模塊,用于采集音頻信息;2、信息源緩存模塊,用于緩存接收到的音頻信息源;3、編碼模塊,用于將音頻信息源編碼為音頻包;4、網絡傳輸模塊,用于將音頻包通過網絡傳輸至音頻信息接收端,還用以將音頻識別模塊輸出的文字信息傳送至文字顯示模塊;5、檢測模塊,用于實時檢測網絡傳輸模塊,將音頻包傳輸給音頻信息接收端時的丟包率,當檢測到丟包率大于丟包率閥值時,發(fā)出音頻識別指令;6、音頻識別模塊,用于接收音頻識別指令,并將提取的音頻信息源識別為文字信息;7、文字轉音頻識別模塊,用于接收文字信息,并將該文字信息識別為音頻信息;8、音頻信息輸出模塊,用于輸出接收到的音頻信息;9、解碼模塊,用于將音頻包進行解碼為音頻信息;10、文字顯示模塊,用于將文字信息轉換為文字字幕予以顯示。
音頻信息網絡數字化實時傳輸過程圖
音頻信息傳輸過程:首先在音頻信息發(fā)送端設置一個丟包率閥值,使用音頻信息輸入模塊采集音頻信息,將采集的音頻信息作為信息源緩存到信息源緩存模塊,同時使用編碼模塊將信息源編碼為音頻包,通過網絡傳輸模塊傳輸至音頻信息接收端,在傳輸過程中由檢測模塊實時檢測傳輸時的丟包率,當丟包率大于預設的丟包率閥值時,發(fā)出音頻識別指令,音頻識別模塊根據接收到的音頻識別指令提取緩存的音頻信息源,并將音頻信息源識別為文字信息經由網絡傳輸至音頻信息接收端,音頻信息接收端再將該文字信息識別為音頻信息輸出(也可根據客戶需求,將音頻信息接收端接收到的文字信息直接轉換為文字字幕顯示);若實時檢測的丟包率不大于預設的丟包率閥值,音頻信息接收端會將接收到的音頻包直接解碼為音頻信息輸出。
技術特點
- 可保證音頻信息的完整傳輸:本技術主要是將音頻信息在發(fā)送端通過預設丟包率閥值來判斷網絡帶寬是否穩(wěn)定,能否滿足音頻傳輸需求,并根據實際情況設置音頻傳輸方式,保證在各種網絡情況下的音頻信息完整傳輸。
- 靈活的輸出方式:在某些特殊應用中,例如不便接收聲音的場合,或者接收信息的場合聲音過于嘈雜,可直接將語音轉成文字輸出。
技術應用
低帶寬、高丟包率的成功應用
本技術被廣泛應用于遠程視頻會議、遠程監(jiān)控指揮、視頻教學等應用場景中。解決了現有技術中存在的因網絡帶寬不足或不穩(wěn)定,丟包率高等原因,造成對方無法完整接收到音頻信息的問題,保證了音頻信息在各種復雜網絡情況下的完整傳輸。