領先的專業(yè)語音技術提供商-科大訊飛日前宣布其新一代重量級語音合成系統(tǒng)InterPhonic 3.0將于2004年第一季度推出。
科大訊飛每一代語音合成系統(tǒng)的推出都標志著中文語音合成技術產(chǎn)品的一個全新里程碑,在效果表現(xiàn)和功能特性上的持續(xù)推進也得到了眾多客戶的充分肯定。InterPhonic 3.0延續(xù)了科大訊飛的技術產(chǎn)品基本路線與原則,即基于對語音合成技術發(fā)展的深入思考、穩(wěn)健把握和對用戶需求的廣泛收集與詳細分析,將以全新的面貌展現(xiàn)在合作伙伴與客戶面前。
現(xiàn)在我們已經(jīng)可以預覽InterPhonic 3.0的一些重要新特性:
1.全新風格的女聲音庫,并支持多音庫管理和運行時自由切換;
除支持全新風格的女聲音庫外,InterPhonic 3.0語音合成系統(tǒng)也同時支持原有的語調(diào)平穩(wěn),語氣正式的女聲音庫。InterPhonic 3.0允許客戶選擇安裝兩種音庫中的任意一個,或者是同時安裝兩個音庫。并且提供了這兩種音庫自由切換的功能?蛻艨梢栽谙到y(tǒng)運行的情況下,通過參數(shù)設置切換合成服務的發(fā)音人。這樣客戶可以根據(jù)業(yè)務的變化,選擇更加適合應用需要的發(fā)音人,而使整個語音應用能提供給用戶更加自然的感受。
2.中文合成技術和中英文混讀合成技術方面都有新的突破;
3.在中文文本分析和處理的多個方面都有顯著的改進;
在分析了不同應用領域的文本特征之后,采用了統(tǒng)計和規(guī)則相結合的方法來進行中文信息的分析處理。收集了大量與客戶的業(yè)務領域相關的文本和實際應用中需要合成的文本信息,在進行統(tǒng)計分析之后,進一步優(yōu)化了統(tǒng)計模型和數(shù)據(jù)庫,并且增加了大量的處理規(guī)則,提升了文本中詞組的識別和特殊符號的處理的準確性。通過統(tǒng)計和規(guī)則的結合,系統(tǒng)既保證了對大量文本分析處理的正確性,也保證在一些特殊語言環(huán)境下分析處理的正確性。
4.支持定制資源包和行業(yè)專用版;
5.背景音支持;
6.用戶提示音資源管理;
InterPhonic 3.0中具有對提示音的統(tǒng)一管理和處理的功能。用戶可以將提示音添加到系統(tǒng)中作為資源,并提供了自動或手動的方式調(diào)整提示音的語音特征,使提示音和合成語音合成更好的銜接?蛻羰褂肅SSML文本標記利用序號引用提示音,通過合成系統(tǒng)的開發(fā)接口得到的語音數(shù)據(jù)會自動處理提示音與合成語音的拼接問題?蛻舨恍枰念~外的開發(fā)工作就可以提升同時使用兩種語音的情況下播報的語音效果。如果結合InterPhonic 3.0新支持的背景音特性,兩段語音之間有背景音樂進行過渡,語音應用的效果將更加自然。
7.提供功能豐富、使用便捷的合成工具包。
以上只是InterPhonic 3.0部分新特性的預覽,InterPhonic 3.0同時還支持目前市場主流應用的InterPhonic CE 2.2的所有重要特性。我們相信,隨著InterPhonic 3.0的推出,將促使語音應用邁上更高的臺階。
科大訊飛公司供稿 CTI論壇編輯