科大訊飛語音技術(shù)產(chǎn)品ViviVoice2.0
2009/12/02
ViviVoice系列簡介
ViviVoice提供最豐富的音庫,且根據(jù)客戶需求不斷擴展,適應(yīng)多樣化的語音應(yīng)用業(yè)務(wù)需要;能夠自動準(zhǔn)確的進(jìn)行智能化文本分析和預(yù)處理;合成的語音清晰、流暢、自然,使用戶獲得最佳效果體驗;強大的參數(shù)設(shè)置和調(diào)整能力,容易對語音效果進(jìn)行各種靈活的調(diào)節(jié)。ViviVoice作為個性化語音服務(wù)的全新動力引擎,將為豐富多彩的語音應(yīng)用增添獨特的魅力。
豐富音色主導(dǎo)個性化語音服務(wù)潮流
ViviVoice主導(dǎo)個性化語音服務(wù)新潮流,采用業(yè)界領(lǐng)先的可訓(xùn)練語音合成技術(shù),能夠快速提供適應(yīng)語音應(yīng)用需要的豐富語言和多樣化音色選擇,并秉承科大訊飛語音技術(shù)一貫的最高質(zhì)量效果表現(xiàn),為用戶提供個性化語音服務(wù)體驗。
在ViviVoice 產(chǎn)品中,提供了以下音庫:
由于ViviVoice采用最先進(jìn)的中文文本、韻律分析算法和基于訓(xùn)練的參數(shù)合成方法,合成效果可達(dá)真人朗讀的水平,并且構(gòu)建一個高質(zhì)量音庫的周期相比以往可大幅度縮短,這就使得科大訊飛能夠更加快速的響應(yīng)個性化語音應(yīng)用的新需求,不斷提供更多更好的音庫。如需獲得ViviVoice當(dāng)前支持的最新音庫列表,請訪問科大訊飛網(wǎng)站。
ViviVoice提供豐富多樣、效果自然的音庫,在實際應(yīng)用中,可根據(jù)業(yè)務(wù)需要靈活進(jìn)行實時音庫切換。
高表現(xiàn)力的合成引擎
ViviVoice語音合成軟件支持疑問和感嘆語氣,支持高興和悲傷情感,充分體現(xiàn)產(chǎn)品的個性化和娛樂功能的特點,給您帶來不同的聽覺感受。
高準(zhǔn)確度的智能文本分析與預(yù)處理
ViviVoice語音合成軟件具有高準(zhǔn)確度智能文本分析與預(yù)處理技術(shù),有效保障最終合成語音準(zhǔn)確、清晰、流暢。得益于科大訊飛在語言學(xué)研究和實踐上的深厚積累,通過與中國社會科學(xué)院語言所等相關(guān)權(quán)威科研機構(gòu)的緊密合作,以及基于寬廣的應(yīng)用實踐平臺所積累的海量專業(yè)知識庫,經(jīng)過不斷訓(xùn)練和優(yōu)化,即使在面對針對語言分析處理的難點,如多音字、特殊符號、韻律短語、未登錄詞(如地名、人名)等等,也能保障得到高度準(zhǔn)確的自動處理結(jié)果。
流暢的效果與強大的音效調(diào)整能力
采用參數(shù)合成的方法,使ViviVoice產(chǎn)品可以非常方便的對各項影響合成效果的參數(shù)進(jìn)行控制,能夠更好的消除傳統(tǒng)語音拼接方式的頓挫等不連貫現(xiàn)象,合成語音更加流暢、自然。針對主流應(yīng)用環(huán)境的普遍需求,科大訊飛廣泛收集實際應(yīng)用的語料,
并用特定的模型對數(shù)字?jǐn)?shù)值、短語短句等進(jìn)行優(yōu)化,從而使得合成更加清晰、準(zhǔn)確、飽滿、節(jié)奏感更強。在保證高質(zhì)量語音合成效果的前提,能夠?qū)σ袅、音高、語速等眾多參數(shù)進(jìn)行調(diào)節(jié),配合豐富的特色音效,使語音服務(wù)更加生動活潑,充滿趣味。
全面完善的功能特性
- 合理的體系架構(gòu),滿足高穩(wěn)定性應(yīng)用要求
ViviVoice采用基于TCP/IP的高效網(wǎng)絡(luò)語音合成服務(wù)和集中式的資源管理機制,形成客戶端-資源管理器-服務(wù)器有機結(jié)合的體系架構(gòu),構(gòu)建可靈活伸縮的方案,科大訊飛這一業(yè)界領(lǐng)先的體系架構(gòu),其高可用性歷經(jīng)眾多重點行業(yè)大規(guī)模關(guān)鍵業(yè)務(wù)的應(yīng)用檢驗,確保提供值得信賴的7×24小時不間斷自動化語音服務(wù)。
- 豐富的參數(shù)設(shè)置與調(diào)節(jié)功能,適應(yīng)各種復(fù)雜應(yīng)用環(huán)境
在ViviVoice產(chǎn)品中提供了豐富完善的參數(shù)設(shè)置與調(diào)節(jié)功能和工具,幫助用戶對語音合成效果進(jìn)行靈活高效的控制與管理。提供對全局參數(shù)(如音量、語速、音高等)、用戶詞典、用戶規(guī)則、定制資源包統(tǒng)一進(jìn)行配置和管理的工具;數(shù)字、標(biāo)點符號、英文發(fā)音方式的設(shè)定;中英文加詞功能,可以指定每個字詞的拼音或音標(biāo)等等;提供統(tǒng)一的簡單易用圖形化用戶界面進(jìn)行操作設(shè)定,并可通過API參數(shù)進(jìn)行動態(tài)設(shè)置和調(diào)整,還支持以CSSML(中文語音合成標(biāo)記語言)進(jìn)行標(biāo)記、描述和控制。
- 靈活高效的開發(fā)接口,加速集成與應(yīng)用發(fā)布進(jìn)程
ViviVoice DK針對不同開發(fā)工具,不同集成要求和方案,提供多種形式的開發(fā)接口,包括:標(biāo)準(zhǔn)開發(fā)接口(動態(tài)鏈接庫DLL),Quick TTS接口、COM組件、Microsoft
SAPI開發(fā)接口和Java開發(fā)接口,新增了預(yù)錄音背景音開發(fā)接口,開發(fā)者可以根據(jù)實際需要靈活選擇。提供了豐富的開發(fā)例程和文檔,幫助加速語音應(yīng)用開發(fā)過程。
科大訊飛在長期集成開發(fā)和應(yīng)用實踐的支持過程中,總結(jié)了客戶使用語音合成的方式和應(yīng)用的特點,逐步開發(fā)了一系列便于用戶在不同環(huán)境中合理運用語音合成功能的工具。ViviVoice的增強工具集套件包括了各種使用便捷的高效組件,如離線語音應(yīng)用工具、CSSML可視化編輯工具、DOC/XLS文本格式轉(zhuǎn)換工具等等。用戶通過使用這些工具可以簡化開發(fā)工作、優(yōu)化合成效果、方便系統(tǒng)維護(hù)和技術(shù)支持。
全面支持GB2312、GBK、BIG5、GB18030、UTF-8和UNICODE編碼字符集,自動識別UNICODE文本;支持直接輸出多種采樣率的語音數(shù)據(jù)格式(包括6K/8K/11K/16K)的線性Wav、A/U率Wav和Vox等多種格式的語音數(shù)據(jù)。
高質(zhì)量的語音合成效果,加上超小的系統(tǒng)尺寸,降低了資源占用,進(jìn)一步降低特殊需求及桌面應(yīng)用門檻,更加符合各類語音應(yīng)用業(yè)務(wù)的需要。
科大訊飛的語音合成軟件具有最全面的平臺支持。幾乎所有主流的交互式語音應(yīng)答(IVR)平臺都支持科大訊飛的語音合成產(chǎn)品。如需了解進(jìn)一步信息,請與IVR提供商或科大訊飛聯(lián)系。ViViVoice支持主流的操作系統(tǒng)。在各種應(yīng)用環(huán)境下都很容易找到可供客戶借鑒的成功實施案例。
細(xì)致周到的優(yōu)化方案
- 優(yōu)化定制,高效的應(yīng)用效果方案
提供以定制資源包(加載于合成引擎之上,有效提升既定應(yīng)用領(lǐng)域語音效果的資源集合)和CSSML和虛擬不定長工具為代表的主流應(yīng)用環(huán)境進(jìn)行效果優(yōu)化的高效解決方案,顯著提升實際應(yīng)用效果?拼笥嶏w專業(yè)服務(wù)體系提供高效的定制與優(yōu)化方案,提升客戶體驗,幫助客戶獲得語音自助服務(wù)的持續(xù)成功。
CSSML(Chinese Speech Synthesis Markup Language,中文語音合成標(biāo)記語言)是由科大訊飛提出并牽頭制訂的中文語音數(shù)據(jù)描述規(guī)范。該標(biāo)準(zhǔn)得到了國家863專家組、國家信標(biāo)委和國家技術(shù)監(jiān)督局的大力關(guān)注與支持,2005年正式通過國家標(biāo)準(zhǔn)化組織的評審,成為中文語音合成技術(shù)標(biāo)準(zhǔn)與規(guī)范的重要內(nèi)容。CSSML針對中文語音應(yīng)用設(shè)計和擴展,可以對多種特性進(jìn)行靈活標(biāo)注與控制,并與開放式的標(biāo)準(zhǔn)SSML兼容。
ViviVoice采用了科大訊飛業(yè)界首創(chuàng)的預(yù)錄音統(tǒng)一管理功能,將預(yù)錄音作為語音合成系統(tǒng)的資源,并通過提示音智能匹配和合成模板等方式使預(yù)錄音與合成音匹配更加容易、銜接更加流暢,同時避免頻繁處理提示音播放與語音合成的切換與過渡問題,簡化應(yīng)用流程的復(fù)雜程度,進(jìn)一步提高服務(wù)效果與質(zhì)量。
ViviVoice采用了科大訊飛業(yè)界首創(chuàng)的背景音功能,通過系統(tǒng)提供的簡單易用工具,可以便捷高效的添加背景音樂,調(diào)整背景音樂和合成語音的音量對比,并可直接試聽實際效果,使語音服務(wù)更加親切自然。
ViviVoice采用了科大訊飛業(yè)界首創(chuàng)的特色音效功能,系統(tǒng)在合成語音的同時可以加入諸如回升、混響、金屬聲等各具特色的發(fā)音效果,非常適合用來制作一些科幻、娛樂、搞笑的聲音效果,可以帶給用戶帶來全新的體驗。
CTI論壇編輯
相關(guān)閱讀: