在剛剛結(jié)束的“Blizzard Challenge 2014”國(guó)際語(yǔ)音合成大賽上,科大訊飛通過(guò)承建的語(yǔ)音及語(yǔ)言信息處理國(guó)家工程實(shí)驗(yàn)室報(bào)送的參賽系統(tǒng)在25項(xiàng)測(cè)試指標(biāo)中的11項(xiàng)位列第一,取得了綜合排名第一的好成績(jī)。這是科大訊飛自2006年首次參賽即奪冠以來(lái),第九次蟬聯(lián)該項(xiàng)賽事桂冠,持續(xù)鞏固了訊飛智能語(yǔ)音技術(shù)的全球領(lǐng)先地位。
Blizzard Challenge是由美國(guó)和日本聯(lián)合發(fā)起的國(guó)際上規(guī)模最大、最具影響力的語(yǔ)音合成大賽,歷屆大賽吸引了美國(guó)卡耐基-梅隆大學(xué)、英國(guó)愛(ài)丁堡大學(xué)、日本名古屋工業(yè)大學(xué)、IBM研究院、微軟亞洲研究院等語(yǔ)音技術(shù)領(lǐng)域的世界一流研究機(jī)構(gòu)與企業(yè)參加。
與歷屆相比,本次大賽首次將主要測(cè)試語(yǔ)種由英語(yǔ)轉(zhuǎn)換到非英語(yǔ)語(yǔ)種,要求提交的語(yǔ)音合成系統(tǒng)包括印地語(yǔ)、阿薩姆語(yǔ)等六種印度語(yǔ)種,并增加了這些語(yǔ)種與英文混讀情況下的合成測(cè)試,進(jìn)一步增加比賽的難度。在評(píng)測(cè)過(guò)程中,組織方選擇了5個(gè)語(yǔ)種基于統(tǒng)一測(cè)試平臺(tái)進(jìn)行主觀測(cè)聽(tīng),每個(gè)語(yǔ)種的測(cè)試指標(biāo)包括相似度、自然度、可懂度、英文混讀相似度和英文混讀可懂度共5項(xiàng)指標(biāo)。
在不到兩個(gè)月的時(shí)間內(nèi),研究團(tuán)隊(duì)克服了時(shí)間緊、語(yǔ)種多、小語(yǔ)種資源受限等困難,充分發(fā)揮了科大訊飛的核心技術(shù)優(yōu)勢(shì),采用基于統(tǒng)計(jì)聲學(xué)模型的單元挑選與參數(shù)合成技術(shù)方案,并研發(fā)了基于深度神經(jīng)網(wǎng)絡(luò)的語(yǔ)音合成新方法,高質(zhì)量完成了所有語(yǔ)種語(yǔ)音合成系統(tǒng)的構(gòu)建。最終提交的參賽系統(tǒng)獲得了印地語(yǔ)合成語(yǔ)音相似度與可懂度、印地語(yǔ)英語(yǔ)混讀合成語(yǔ)音相似度與自然度等共計(jì)11個(gè)指標(biāo)的第一名。
一直以來(lái),科大訊飛的語(yǔ)音合成技術(shù)代表著世界最高水平,不僅中文語(yǔ)音合成技術(shù)超過(guò)了普通人說(shuō)話水平,而且在英語(yǔ)等多語(yǔ)種語(yǔ)音合成上牢牢樹(shù)立了國(guó)際領(lǐng)先地位。未來(lái)科大訊飛將積極開(kāi)展人機(jī)對(duì)話、小說(shuō)合成等熱點(diǎn)領(lǐng)域的研究,著力提升語(yǔ)音合成的表現(xiàn)力和真實(shí)感,通過(guò)多語(yǔ)種語(yǔ)音處理、個(gè)性化、定制化等技術(shù),進(jìn)一步擴(kuò)大應(yīng)用范圍,不斷提升核心效果。
此次榮獲國(guó)際語(yǔ)音合成大賽九連冠,進(jìn)一步擴(kuò)大了科大訊飛在多語(yǔ)種語(yǔ)音合成等關(guān)鍵技術(shù)領(lǐng)域的國(guó)際領(lǐng)先優(yōu)勢(shì),對(duì)推動(dòng)智能語(yǔ)音技術(shù)在社會(huì)各領(lǐng)域的深入應(yīng)用、贏取國(guó)際競(jìng)爭(zhēng)、開(kāi)拓國(guó)際市場(chǎng)等方面具有重大而深遠(yuǎn)的戰(zhàn)略意義。
。ㄕZ(yǔ)音及語(yǔ)言信息處理國(guó)家工程實(shí)驗(yàn)室是由國(guó)家發(fā)改委于2011年批復(fù)成立,由科大訊飛和中國(guó)科學(xué)技術(shù)大學(xué)聯(lián)合共建,是我國(guó)智能語(yǔ)音領(lǐng)域唯一的國(guó)家級(jí)研究平臺(tái)。)