首頁>>廠商>>語音識別與合成>>捷通華聲

捷通華聲推出OSR語音識別技術

2004/09/30

  北京捷通華聲語音技術有限公司與美國 ScanSoft 公司( Nasdaq :SSFT ),于2004 年5月20日,就雙方語音技術全面合作達成戰(zhàn)略聯(lián)盟,此國際合作聯(lián)盟旨在共同推動國際語音產(chǎn)業(yè)的發(fā)展,加速中國語音技術產(chǎn)業(yè)化發(fā)展進程。2004年9月,捷通華聲在國內(nèi)正式推出ScanSoft國際最高水平語音識別技術OSR(OpenSpeech Recognizer )

  之所以稱之為OSR,是因為此項語音識別技術是一種基于開放標準、可擴展、高性能和高識別率的識別引擎,提供大詞匯量、非特定人、連續(xù)的語音識別功能,尤其是在各種無限環(huán)境之中對于噪雜音的處理功能強大。OSR產(chǎn)品將以SDK的方式提供給集成商,可廣泛應用在呼叫中心、自動總機、語音電話本、旅行預定、信息檢索、語音門戶和客戶自助服務等系統(tǒng)中。

  捷通華聲與ScanSoft公司強強聯(lián)手,將捷通華聲中文語音合成技術與ScanSoft公司最新語音識別技術OSR全面整合,形成完整的語音技術解決方案以利于國內(nèi)、國際語音技術市場的廣泛應用,使產(chǎn)品更加貼近用戶需求,更好的滿足市場需要。

一、Scansoft公司介紹:

  美國 ScanSoft 公司 (Nasdaq: SSFT) 是一家全球知名的國際性企業(yè),是專業(yè)的語音和圖像解決方案供應商,特別是其語音識別引擎,在識別率、識別速度、系統(tǒng)穩(wěn)定性等方面都處于行業(yè)領先的地位,在通信、遠程信息處理、移動終端等諸多領域有著廣泛的應用,市場遍布全球。伴隨語音產(chǎn)業(yè)在全球的的快速發(fā)展,ScanSoft 公司高瞻遠矚,以雄厚的實力、果斷的行動在兩年之內(nèi)兼并了 L&H ( Dragon ), SpeechWorks 兩家歐洲與美國的實力雄厚的國際知名語音技術公司,并成功收購飛利浦語音實驗室,建立了其在國際語音識別技術最大的市場份額。

二、OSR主要特點:

1、高識別率
  OSR產(chǎn)品核心技術顯著提高,并且極大的提高置信得分的準確度,使實際應用中識別率均達到95%以上,對于小詞匯量的應用識別率更高。

2、強大的語法分析功能
  OSR產(chǎn)品支持百萬詞匯的復雜語法應用,利用SpeekFreely技術還可支持自然語言問答式的語法識別。利用OSR的先進語法處理能力,用戶可以利用ECMA腳本語言書寫更復雜的語法,可以創(chuàng)建動態(tài)的應用,并具支持共享語法,大幅度提高系統(tǒng)效率。

3、獨特的語音端點檢測技術
  OSR包括魯棒的端點檢測算法,可以依據(jù)振幅和頻譜特征來進行檢測,從而有效地區(qū)分背景噪音和通話者的語音。OSR端點檢測的"靈敏度"可以被手動調(diào)整,以適應安靜或喧鬧的不同環(huán)境,或在應用中微調(diào)性能。

4、適應性強
  通過ScanSoft具有專利技術的自動調(diào)節(jié)機制"LEARN"學習功能,系統(tǒng)可以自動調(diào)節(jié)識別參數(shù)和聲學模型,以適應呼叫人群的本地方言、區(qū)域口音和電話信道等特點。通過"LEARN"自動調(diào)節(jié)機制,識別錯誤率可以下降70%。

5、高性能、低資源消耗
  獨特的音頻分析方法及具有專利的有限狀態(tài)轉換技術,使OSR產(chǎn)品在實際應中,內(nèi)存占用和CPU的消耗極低。對于復雜的語法應用可以節(jié)約90%的資源。

6、高容量并發(fā)
  OSR產(chǎn)品支持高容量的并發(fā)呼叫,一個中等應用(2000詞匯以內(nèi)),至強單CPU 2.4G的配置環(huán)境下,可以支持60個并發(fā)的語音識別端口。

7、支持開放標準
  OSR產(chǎn)品是根據(jù)VoiceXML設計的,對SRGS(Speech Recognition Grammar Specification,語音識別語法規(guī)范)的支持等特點使VoiceXML 和 SALT 應用達到最優(yōu)狀態(tài)。

8、支持多語言,包括多語言混合識別
  OSR產(chǎn)品目前提供15種語言和方言,包括:普通話(中國大陸、臺灣)、粵語(香港地區(qū))、英語(澳大利亞、新西蘭、英國、美國、新加坡)、法語(法國、加拿大)、德語(德國)、日語(日本)、韓語(韓國)、西班牙語(美國、墨西哥)。

  OSR產(chǎn)品的WorldAware功能支持多語種的混合識別,甚至允許單個語句中的任意語言混合,可以用于構造更加復雜的語音解決方案。

9、多種體系結構選擇
  OSR產(chǎn)品提供多種體系結構組合方式:
  1)單機:用戶可以直接在運行IVR的機器上加載OSR。
  2)客戶端/服務器:用戶可以直接在服務器端加載OSR,客戶端通過網(wǎng)絡發(fā)送語音信號并獲取識別結果。
  3)VoIP:用戶也可以在一個基于VoIP的客戶端/服務器架構中配置OSR,在這種情況下,客戶端是一個VoIP媒體網(wǎng)關或媒體服務器,服務器是MRCP版本的OpenSpeech服務器,它提供了帶有標準的VoIP協(xié)議接口的OSR。

10、支持多種操作系統(tǒng)
  OSR可在下列操作系統(tǒng)下使用單機和客戶端/服務器配置:
  客戶端操作系統(tǒng):RedHat 7.2、RedHat AS 2.1、Windows 2000、Windows 2003。
  服務端操作系統(tǒng):RedHat 7.2、RedHat AS 2.1、Windows 2000、Windows 2003、Solaris。

三、配置要求:

詞匯量 運行系統(tǒng) 硬件環(huán)境 可支持端口數(shù)
2000以下 Windows 2000以上 至強雙CPU 2.4G;1G以上內(nèi)存,20G硬盤;100M以上網(wǎng)卡; 120線
40000以下 Windows 2000以上 至強雙CPU 2.4G;1G以上內(nèi)存,20G硬盤;100M以上網(wǎng)卡; 60線


四、OSR語音識別技術應用案例:

  美國聯(lián)合航空(United Airlines):客戶通過致電1(800)824-6200,應用OSR語音識別技術可方便查詢聯(lián)合航空公司每天2400個航班的狀態(tài),每天有8萬多人使用這一系統(tǒng)。

  AOL電話服務:采用Scansoft OSR等語音技術,為America Online的2400萬客戶開發(fā)和部署了語音門戶服務。

  Thrifty汽車租賃:Thrifty租車公司是全球最大的的租車公司之一,通過撥打Thrifty的1-800-THRIFTY預訂電話號碼,客戶在應用OSR語音識別技術獲得高效服務的同時,也獲得最優(yōu)惠的汽車租用費率。

捷通華聲公司供稿 CTI論壇編輯



相關鏈接:
捷通華聲發(fā)布jASR5.5 ASR價格面前將無怯步 2008-04-16
捷通華聲TTS成功登陸中國郵政儲蓄銀行 2008-04-03
捷通華聲 jTTS 5.5 全面支持 MRCPv2標準 2008-03-31
捷通華聲移動導航HCI解決方案廣受青睞 2008-03-26
身邊的“智能”生活 2007-12-28

分類信息:  語音合成TTS_與_語音識別ASR     新聞頻道   技術_語音應用_新聞   技術_語音應用_新聞