英特爾推出新款語(yǔ)音識(shí)別軟件 加入面部識(shí)別功能
2003/05/02
英特爾公司最近發(fā)布新款的語(yǔ)音識(shí)別軟件,這款軟件在語(yǔ)音識(shí)別的基礎(chǔ)上,加入了類似識(shí)別人類嘴唇的功能。這一功能的加入大大地提高了單靠語(yǔ)音識(shí)別軟件的準(zhǔn)確性。
這款軟件的全名為可視音頻語(yǔ)音識(shí)別軟件(AVSR)。這款A(yù)VSR軟件可以提高語(yǔ)音識(shí)別軟件識(shí)別的準(zhǔn)確率。特別是在外界背景有噪音的情況下,這款軟件的作用就表現(xiàn)得更加明顯。
AVSR軟件是通過(guò)攝像頭捕捉用戶嘴唇動(dòng)作,與此同時(shí)對(duì)聲音同步識(shí)別。AVSR通過(guò)這兩種方式的結(jié)合,提高了語(yǔ)音識(shí)別的準(zhǔn)確性。這也是也普通語(yǔ)音識(shí)別軟件的不同。
AVSR是英特爾公司的OpenCV計(jì)算機(jī)可視庫(kù)的一個(gè)組成部分。AVSR在這個(gè)項(xiàng)目中的地位,是一個(gè)可視化的工具。OpenCV庫(kù)中包含了許多面部表情識(shí)別的算法。OpenCV是一個(gè)開放的源代碼庫(kù)。它的源代碼已經(jīng)被下載50萬(wàn)次。
英特爾公司稱,隨著處理器速度的飛速發(fā)展,數(shù)碼相機(jī)的價(jià)格下降以及USB 2高速接入的技術(shù)的普及,目前的主流個(gè)人計(jì)算機(jī)已經(jīng)完全可以運(yùn)行這樣復(fù)雜的算法了。
新浪科技(tech.sina.com.cn)
相關(guān)鏈接: