首頁>>廠商>>IVR系統(tǒng)平臺廠商>>Voxeo

VoiceXML論壇官方認證平臺

2008/12/10

VoiceXML背景簡介

  自從Web誕生以來,Web的每一步發(fā)展、技術成熟和應用領域的拓展,都離不開W3C(World Wide Web Consortium,W3C理事會或萬維網(wǎng)聯(lián)盟)[1]的努力。W3C于1994年10月在麻省理工學院計算機科學實驗室成立,創(chuàng)建者是萬維網(wǎng)的發(fā)明者Tim Berners-Lee。W3C組織是對網(wǎng)絡標準制定的一個非贏利組織,像HTML、XHTML、CSS、XML的標準就是由W3C來制定。W3C會員(大約500名)包括生產(chǎn)技術產(chǎn)品及服務的廠商、內容供應商、團體用戶、研究實驗室、標準制定機構和政府部門,一起協(xié)同工作,致力在萬維網(wǎng)發(fā)展方向上達成共識。W3C是專門致力于創(chuàng)建Web相關技術標準并促進Web向更深、更廣發(fā)展的國際組織。

  創(chuàng)建伊始,W3C就開始以引領Web技術的發(fā)展和促進為己任。其宗旨概括為7點:推進Web的普及、解決語義網(wǎng)絡(Semantic Web)問題、Web應該是可信任的網(wǎng)絡、協(xié)同工作、可持續(xù)發(fā)展問題、權利的分散問題和支持多媒體?傊,W3C以開發(fā)“Web事實標準”的各種技術規(guī)范作為其核心任務,目前已開發(fā)了超過50個技術規(guī)范。這些技術規(guī)范中大部分是由各個功能組開發(fā)的各種功能性規(guī)范,同時也包括WWW的核心體系結構。W3C的這些成果基本上已由企業(yè)和研究機構進行了實現(xiàn)。

  W3C的已有工作成果和工作框架如圖1所示,該圖展示了萬維網(wǎng)的基礎框架及W3C的工作重點。W3C技術架構圖描繪了一個兩層的模型:萬維網(wǎng)體系結構(被標注為“One Web”)建立在互聯(lián)網(wǎng)(Internet)體系結構之上。圖中豐富的Web層顯示了W3C關心的領域和發(fā)展的技術。在頂層包含著六個框,分別與W3C主要的活動組相對應:Web Applications、Mobile、Voice、Web Services、Semantic Web和Privacy Security。其中的“Voice”框中所羅列的VoiceXML、SRGS、SSML、CCXML和EMMA則標示著語音領域的重要工作。

  W3C正致力把萬維網(wǎng)從最初的設計(基本的HTML、URIs和HTTP)轉變?yōu)槲磥硭璧哪J。W3C的技術將幫助未來萬維網(wǎng)成為信息世界中有高穩(wěn)定性、可提升和強適應性的基礎框架。

  VoiceXML[2]最初由VoiceXML論壇[3]創(chuàng)建,現(xiàn)由W3C主持,是W3C開發(fā)的基于XML的語言,用來創(chuàng)建為電話應用刻畫合成語音、數(shù)字音頻、話音與DTMF鍵入識別和音頻錄制的語音會話。其宗旨在于為用戶定義一種新方法,運用基于Web的服務通過口頭指令和DTMF鍵盤實現(xiàn)交流,通過事先記錄的話音、合成話音或音樂流獲取信息。為了迎接這種挑戰(zhàn),W3C定義了一套在設計上與網(wǎng)頁編寫標準相類似的標記語言,以規(guī)范應用程序的語音問題,例如用戶對話流、自動語音識別與相關語法、語音合成與呼叫控制等。它將傳統(tǒng)的專用與密閉式IVR系統(tǒng)提升成開放式可編程體系結構,并且通過提供類似于HTML表單或CGI腳本的可編程會話把Web技術的優(yōu)點延伸到電話用戶。

為什么要用VoiceXML?

  VoiceXML的推出給電話語音系統(tǒng)帶來全新的應用和開發(fā)概念,使傳統(tǒng)的CTI技術從繁瑣、封閉的模式中走了出來,使廣大的語音系統(tǒng)開發(fā)人員可以用極其簡單的方法實現(xiàn)復雜系統(tǒng)的開發(fā)。

  完全替代傳統(tǒng)CTI:傳統(tǒng)的電話語音系統(tǒng)典型的工作方式是接受用戶的按鍵輸入和語音文件播放、跟據(jù)用戶的需求為用戶提供相應服務;赩oiceXML開發(fā)的電話語音系統(tǒng)完全可以替代傳統(tǒng)CTI系統(tǒng)所能提供的功能。

  語音識別功能:基于VoiceXML開發(fā)的電話語音系統(tǒng)除了接受用戶的按鍵輸入之外,還可以接受用戶的語音輸入。系統(tǒng)通過語音識別功能實現(xiàn)對用戶輸入語音到文本的轉換。這對于許多僅用按鍵輸入方式而無法解決或解決起來很繁瑣的應用領域很有實用意義。

  語音合成功能:基于VoiceXML開發(fā)的電話語音系統(tǒng)除了能夠播放預先錄制的語音文件之外,還可以將系統(tǒng)中的文本轉換成語音的方式播放給用戶。這對于那些需要播報即時消息和可變信息等的應用領域很有實用價值。

  與互聯(lián)網(wǎng)聯(lián)結:長期以來,公用電話網(wǎng)和互聯(lián)網(wǎng)是分離的。隨著互聯(lián)網(wǎng)技術的迅速發(fā)展,互聯(lián)網(wǎng)信息與日俱增,以及互聯(lián)網(wǎng)相關服務的日新月異,將互聯(lián)網(wǎng)與公用電話網(wǎng)整合為一體,使廣大的電話用戶也能享受到互聯(lián)網(wǎng)提供的信息和服務顯得越來越有吸引力。VoiceXML使公用電話網(wǎng)與互聯(lián)網(wǎng)有機地結合,使兩網(wǎng)的信息能夠相互流動。例如,電話語音留言可以通過互聯(lián)網(wǎng)以電子郵件的方式傳送到目的地;互聯(lián)網(wǎng)上的新聞可以通過電話播放給用戶等。

  靈活的數(shù)據(jù)庫接口:許多電話語音應用系統(tǒng)離不開數(shù)據(jù)庫訪問。VoiceXM通過腳本方式提供靈活的數(shù)據(jù)庫接口,使得應用系統(tǒng)可以方便地訪問各種數(shù)據(jù)庫,如:Microsoft SQL Server、Oracle、Sybase、Microsoft Access、MySQL等。

  簡化開發(fā)過程:用VoiceXML將電話語音應用系統(tǒng)開發(fā)人員從繁瑣的編碼細節(jié)中解脫了出來。開發(fā)人員不需要了解相關軟件(如語音識別和語音合成)和硬件(如語音卡)API的編程接口,只需要把精力放在應用領域的業(yè)務流程上。開發(fā)過程輕松快捷、開發(fā)周期大大縮短(7-10倍)。VoiceXML使開發(fā)人員得以用簡單的方法實現(xiàn)復雜的工作。

  除此之外,基于VoiceXML開發(fā)的語音應用系統(tǒng)具有很高的系統(tǒng)可擴展性、可維護性、可移植性、可重用性和開放性。

圖1. W3C技術架構圖

VoiceXML論壇認證計劃

  VoiceXML論壇已經(jīng)開展了對VoiceXML應用開發(fā)人員和平臺認證計劃,前者主要是檢驗VoiceXML的開發(fā)技能,而后者則是就廠商所實現(xiàn)的VoiceXML平臺對W3C VoiceXML 2.0規(guī)范的遵從進行認證,包括以下內容:

  該認證計劃由VoiceXML論壇會員管理和開發(fā),通過獨立的第三方測試實驗室保證其認證過程與結果的公正性。CT Labs [4]被選中作為首家獨立測試實驗室來進行一致性測試。

  VoiceXML平臺認證計劃[5]由測試套件、測試控制和獨立測試項目組成,目的是認證所實現(xiàn)的平臺能通過VoiceXML測試套件所需的所有測試。該測試套件基于W3C VoiceXML 2.0規(guī)范[6]和W3C VoiceXML 2.0執(zhí)行報告測試套件[7]。

  測試項目的主要目的是通過提供一種測試一致性和互操作性的程序,來促使并認可廠商和用戶充分利用VoiceXML論壇所創(chuàng)建的有價值的標準。帶有“通過VoiceXML認證”(VoiceXML Certified)字樣的應用是指的滿足一致性需求,并且通過VoiceXML認證計劃對其兼容性進行了認證的應用。整個認證計劃擁有一套嚴格而細致的流程,如圖2所示。


圖2. VoiceXML平臺認證過程

具體的認證政策和認證過程請參閱VoiceXML論壇提供的官方資料:

VoiceXML論壇官方認證平臺

  下面列出已經(jīng)通過了針對VoiceXML 2.0規(guī)范和VoiceXML Forum Test Suite v1.0測試套件的VoiceXML論壇平臺認證計劃的一些代表廠商,如表1所示。完整的列表請參閱VoiceXML論壇網(wǎng)站:http://www.voicexml.org/platform_certification/certified_platforms.html。

表1. 通過VoiceXML平臺認證計劃的代表廠商(按字母順序排列)

  [1]Voxeo公司是一個致力于IVR領域的產(chǎn)品開發(fā)商和服務提供商,自1999年成立以來,一直是VoiceXML標準核心制定者之一,同時還是CCXML標準制定的主席。

  [2]Prophecy是業(yè)界第一個(也是目前唯一的)100%通過VoiceXML 2.1標準全部官方測試的應用平臺,同時率先100%實現(xiàn)了CCXML規(guī)范。它不但自嵌TTS和ASR,同時支持標準的MRCP接口,可以和第三方語音引擎集成。

  [3]VoiceCenter(Evolution) 是一個免費的面向開發(fā)人員的互聯(lián)網(wǎng)社區(qū)門戶。通過基于Web頁面的圖形化的IVR應用設計和開發(fā)環(huán)境,提供類似工作流的開發(fā)方式,使得開發(fā)人員即使不了解VoiceXML和CCXML規(guī)范也能開發(fā)出高質量的IVR應用系統(tǒng)。Voxeo為開發(fā)人員提供免費的全天候的技術支持。

參考資料:
  [1]W3C: http://www.w3.org/
  [2]VoiceXML規(guī)范: http://www.w3c.org/voice/
  [3]VoiceXML論壇: http://www.voicexml.org/
  [4]CT Labs: http://www.ct-labs.com/
  [5]VoiceXML平臺認證計劃: http://www.voicexml.org/platform_certification/index.html
  [6]VoiceXML 2.0規(guī)范: http://www.w3.org/TR/voicexml20
  [7]VoiceXML 2.0執(zhí)行報告測試套件: http://www.w3.org/Voice/2004/vxml-ir/

CTI論壇編輯



相關鏈接:
Voxeo VoiceObjects 統(tǒng)一自服務提高滿意度 2009-09-23
Voxeo攜Prophecy10高度亮相SpeechTEK2009 2009-09-03
擁有中文TTS的Prophecy IVR語音平臺 2009-08-17
Voxeo發(fā)布開源的電話“云計算”服務平臺 2009-08-12
自助式語音平臺開發(fā)利器Prophecy Platform 2009-08-03

分類信息:  CTI平臺技術_與_交互語音技術  CTI平臺技術_與_voicexml技術  交互語音技術_與_voicexml技術