中文字幕无码久久精品,13—14同岁无码A片,99热门精品一区二区三区无码,菠萝菠萝蜜在线观看视频高清1

您當(dāng)前的位置是:  首頁(yè) > 新聞 > 國(guó)內(nèi) >
 首頁(yè) > 新聞 > 國(guó)內(nèi) >

語(yǔ)音智能交互離我們還有多遠(yuǎn)?

2016-03-04 16:50:33   作者:陳孝良   來(lái)源:中國(guó)教育報(bào)   評(píng)論:0  點(diǎn)擊cti:


  隨著亞馬遜、京東、阿里先后發(fā)布智能音箱,10月份蘋(píng)果收購(gòu)VocalIQ和谷歌戰(zhàn)略入股出門(mén)問(wèn)問(wèn),盤(pán)點(diǎn)一下今年的語(yǔ)音交互市場(chǎng),真是異常的熱鬧。那么,語(yǔ)音交互技術(shù)真的就像市場(chǎng)上熱捧的那樣走入了智能時(shí)代嗎?
  實(shí)際上我想這個(gè)問(wèn)題大家都心知肚明,資本市場(chǎng)的熱鬧也不過(guò)是各個(gè)巨頭的布局,甚至是其他用意而已。不管是微軟的小冰、百度的小度,還是科大訊飛的語(yǔ)音識(shí)別、出門(mén)問(wèn)問(wèn)的語(yǔ)音助手,僅僅還都是停留在對(duì)簡(jiǎn)單問(wèn)題的理解和回答,而即便這些也是依靠大量數(shù)據(jù)訓(xùn)練而成的,這種訓(xùn)練有時(shí)候甚至是開(kāi)了玩笑,比如我們真的需要大量的“調(diào)戲”語(yǔ)言訓(xùn)練出來(lái)的結(jié)果嗎?深度神經(jīng)網(wǎng)絡(luò)曾經(jīng)極大促進(jìn)了語(yǔ)音識(shí)別的發(fā)展,但是目前來(lái)看,要想解決復(fù)雜問(wèn)題和邏輯推理還是存在極大的難度。
  另外還有重要的一點(diǎn),語(yǔ)音交互方面的用戶(hù)黏性還是非常差的,比如我們一天會(huì)用幾次Siri(蘋(píng)果手機(jī)語(yǔ)音控制軟件)或者出門(mén)問(wèn)問(wèn)呢?而提高用戶(hù)黏性的最大挑戰(zhàn)就是要找到一種既能滿(mǎn)足用戶(hù)需求又能保證技術(shù)實(shí)現(xiàn)的產(chǎn)品形態(tài)。用戶(hù)需求自然是很明顯的,我們希望的是讓我們能夠自然聊天的產(chǎn)品,但是現(xiàn)在技術(shù)上實(shí)現(xiàn)真是太難了,不僅是語(yǔ)音識(shí)別和情感合成的本身難度,而且還包括了噪聲干擾、方言混合以及遠(yuǎn)程拾音等等問(wèn)題。
  上面這些挑戰(zhàn),嚴(yán)重制約了語(yǔ)音交互在通用市場(chǎng)領(lǐng)域的應(yīng)用,而我們傳統(tǒng)思維上卻總想用戶(hù)都像技術(shù)人員那樣能夠理解這些技術(shù)并恰當(dāng)應(yīng)用,這反而才是制約技術(shù)發(fā)展最大的障礙。但是隨著巨頭的進(jìn)入和語(yǔ)音交互市場(chǎng)的繁榮,國(guó)內(nèi)的科大訊飛、百度、盛大、出門(mén)問(wèn)問(wèn)正在轉(zhuǎn)變思路,他們逐漸摒棄了盲目擴(kuò)張和宣傳,從通用市場(chǎng)領(lǐng)域逐步擴(kuò)展到垂直市場(chǎng)領(lǐng)域,扎扎實(shí)實(shí)根據(jù)用戶(hù)需求做好垂直細(xì)分的市場(chǎng)領(lǐng)域?拼笥嶏w重點(diǎn)打造教育和車(chē)載市場(chǎng),出門(mén)問(wèn)問(wèn)重點(diǎn)在可穿戴市場(chǎng),而客服市場(chǎng)現(xiàn)在也是各個(gè)巨頭極為看重的潛在市場(chǎng)。一想到語(yǔ)音交互機(jī)器人可能取代大量客服妹妹,這可能讓很多人覺(jué)得商機(jī)無(wú)限,其實(shí)完全取代人工現(xiàn)在看來(lái)還為時(shí)過(guò)早,但是篩選前端無(wú)效咨詢(xún)幫助減輕客服工作量,這才是目前語(yǔ)音交互最為重要的應(yīng)用領(lǐng)域。當(dāng)然,除了教育、導(dǎo)航、客服市場(chǎng),還有金融、醫(yī)療等垂直市場(chǎng)具有較好的應(yīng)用前景。
  談了這么多挑戰(zhàn),也展望了未來(lái)市場(chǎng)應(yīng)用,我們還是再看看技術(shù)發(fā)展。語(yǔ)音交互技術(shù)包括了語(yǔ)音識(shí)別、語(yǔ)音合成以及情感識(shí)別與合成等技術(shù)。從50年代美國(guó)貝爾實(shí)驗(yàn)室和國(guó)內(nèi)的中科院聲學(xué)所開(kāi)始研究語(yǔ)音技術(shù),到70年代小詞匯量的語(yǔ)音識(shí)別取得較大進(jìn)展,80年代非特定人連續(xù)語(yǔ)音識(shí)別技術(shù)快速發(fā)展,90年代大量聲學(xué)識(shí)別模型的出現(xiàn),直到21世紀(jì)語(yǔ)音識(shí)別才走進(jìn)我們的生活世界。其間語(yǔ)音交互的前端處理技術(shù)、聲學(xué)特征提取、聲學(xué)模型重構(gòu)等都取得了重大進(jìn)展,特別是機(jī)器深度學(xué)習(xí)技術(shù)的引入,極大提高了利用傳統(tǒng)聲學(xué)建模進(jìn)行語(yǔ)音識(shí)別的準(zhǔn)確率,微軟曾經(jīng)宣稱(chēng)利用DNN(深度神經(jīng)網(wǎng)絡(luò))算法可以降低語(yǔ)音識(shí)別錯(cuò)誤率30%。但是這還是不夠的,若能引入更多計(jì)算機(jī)技術(shù),例如有限狀態(tài)機(jī)等,將語(yǔ)音模型、聲學(xué)特征、語(yǔ)料音庫(kù)和情感預(yù)測(cè)等統(tǒng)一為整體的識(shí)別網(wǎng)絡(luò),相信我們距離電影《鋼鐵俠》中的自然語(yǔ)音交互應(yīng)用不是太過(guò)遙遠(yuǎn)。

相關(guān)閱讀:

專(zhuān)題