Google上周開源了語音命令資料集( Speech Commands Dataset),可望加速開發(fā)人員打造支援語音命令的各種應(yīng)用。
此一語音命令資料集是由數(shù)千名不同的使用者念出30種命令文字,迄今總計采集了6.5萬個只有1秒的語音檔。這些文字涵蓋了Yes、No、Up、Down、Left、Right、On、Off、Stop、Go,以及數(shù)字等,方便開發(fā)人員用來訓(xùn)練應(yīng)用程式的基本語音介面。
迄今Google已開源多項人工智慧專案,包含機器學(xué)習(xí)技術(shù)TensorFlow、自造者AI專案—AIY,以及用來采集語音片段的Open Speech Recording網(wǎng)路程式。
此外語音命令資料集是由TensorFlow與AIY團隊共同建立,以用它來增加TensorFlow的訓(xùn)練與介面樣本程式,Google預(yù)期開源後的資料集數(shù)量將會持續(xù)成長,以帶來更多不同的口音。