因應(yīng)語音辨識(shí)蔚為風(fēng)潮,Mozilla宣布啟動(dòng)第一個(gè)旨在訓(xùn)練語音辨識(shí)app的開源資料集的群眾募資計(jì)畫Common Voice。
這項(xiàng)專案在6月間釋出,目前已開始訓(xùn)練階段。Mozilla指出,現(xiàn)今許多軟件大廠,包括Google、蘋果及亞馬遜都各自推出了語音辨識(shí)服務(wù),喊了個(gè)指令就可以開始作業(yè),似乎很方便,但是這種大廠控制的語音辨識(shí)生態(tài)圈卻可能扼殺了創(chuàng)新者的進(jìn)入。
一來,大廠只會(huì)著重特定英文、中文、西文等等主流語言,而忽略了使用者較少的其他語言。二者,這些生態(tài)圈產(chǎn)生的資料集也為大廠控制,使得也有意開發(fā)語音控制裝置的學(xué)生、新創(chuàng)公司及研究人員能存取的資料相當(dāng)有限。
Common Voice專案現(xiàn)在開始到秋天,邀請開發(fā)人員大聲誦讀句子以協(xié)助語音辨識(shí)引擎的訓(xùn)練,貢獻(xiàn)量沒有上限,該計(jì)劃預(yù)計(jì)匯集1萬小時(shí)的語音錄音檔,也可協(xié)助聽取驗(yàn)證錄音檔的準(zhǔn)確性。
Mozilla表示,資料量足夠后,預(yù)計(jì)2017年下半可以將Common Voice資料庫開源釋出,用以支援語音辨識(shí)裝置、app及作業(yè)系統(tǒng)的開發(fā)。