首頁(yè)>>廠(chǎng)商>>IVR系統平臺廠(chǎng)商>>Voxeo

Voxeo Prophecy平臺開(kāi)發(fā)VoiceXML應用

2008/11/20

一、簡(jiǎn)介

  人們已經(jīng)熟悉了用于語(yǔ)音郵件、撥入會(huì )議、電話(huà)客服和遠程銀行的傳統IVR系統。VoiceXML[1]是W3C開(kāi)發(fā)的基于XML的語(yǔ)言,用來(lái)創(chuàng )建為電話(huà)應用刻畫(huà)合成語(yǔ)音、數字音頻、話(huà)音與DTMF鍵入識別和音頻錄制的語(yǔ)音會(huì )話(huà)。它將傳統的專(zhuān)用與密閉式IVR系統提高成開(kāi)放式可編程體系結構,并且通過(guò)提供類(lèi)似于HTML表單或CGI腳本的可編程會(huì )話(huà)把Web技術(shù)的優(yōu)點(diǎn)帶給了電話(huà)用戶(hù)。

  SIP(會(huì )話(huà)啟動(dòng)協(xié)議)[2]是用于建立和終止因特網(wǎng)多媒體會(huì )話(huà)的因特網(wǎng)電話(huà)信令協(xié)議。基于SIP的VoiceXML瀏覽器(或稱(chēng)SIP-VoiceXML瀏覽器)允許SIP用戶(hù)參與專(zhuān)用IVR系統,比如語(yǔ)音郵件和遠程銀行。通過(guò)SIP-PSTN網(wǎng)關(guān),它還可以把VoiceXML技術(shù)的優(yōu)勢帶給傳統電話(huà)用戶(hù)。

  Voxeo Prophecy [3]是一個(gè)靈活可靠的完全開(kāi)放式IVR語(yǔ)音應用的開(kāi)發(fā)、部署和運行平臺。其核心的呼叫控制全部基于SIP,可以運行和部署任何基于VoiceXML、CCXML標準的電話(huà)應用。Prophecy不但自嵌TTS (Text To Speech, 語(yǔ)音合成輸出) 和 ASR (Automatic Speech Recognition, 自動(dòng)語(yǔ)音識別),同時(shí)支持標準的MRCP接口,可以和第三方語(yǔ)音引擎集成。Prophecy的以Web為中心的開(kāi)發(fā)模型很容易被Web和電話(huà)應用開(kāi)發(fā)者所理解,并且在開(kāi)放SIP的支持下,同您的后臺系統輕松快速地集成到一起。

二、VoiceXML應用的典型結構

  SIP-VoiceXML瀏覽器之于電話(huà),類(lèi)似于Web瀏覽器之于桌面PC。語(yǔ)音瀏覽器從Web服務(wù)器取得VoiceXML頁(yè)面或預先錄制的媒體文件,然后向電話(huà)用戶(hù)呈現交互式會(huì )話(huà)。圖1顯示了一個(gè)典型應用結構,其中VoiceXML瀏覽器可以被SIP電話(huà)或傳統電話(huà)所訪(fǎng)問(wèn)。

  VoiceXML頁(yè)面可以靜態(tài)地存儲在Web服務(wù)器上,或者由諸如HTTP-CGI(通用網(wǎng)關(guān)接口)、Java Servlet或JSP這樣的服務(wù)器側編程邏輯動(dòng)態(tài)生成。媒體文件可以存儲在Web服務(wù)器上,或者從RTSP媒體服務(wù)器產(chǎn)生實(shí)時(shí)流媒體,并通過(guò)RTP直接發(fā)給SIP主叫方。

圖1. 基于SIP的VoiceXML應用典型結構

  一個(gè)簡(jiǎn)單的VoiceXML頁(yè)面

  如下示例VoiceXML頁(yè)面首先用話(huà)音提示主叫方:“What zip code would you like to search?”,當用戶(hù)說(shuō)出“Three two eight zero one”或者按下一串數字(比如說(shuō)32801#),ZIP變量獲取數值“32801”,并傳遞給鏈接地址http://ws.cdyne.com/WeatherWS/Weather
.asmx/GetCityForecastByZIP?ZIP=32801
。最終由GetCityForecastByZIP腳本(實(shí)際上是一個(gè)Web Service接口)來(lái)處理輸入和生成進(jìn)一步的VoiceXML頁(yè)面。如果有錯誤或者用戶(hù)沒(méi)有按任何鍵,那么話(huà)音提示會(huì )一再重復。
<?xml version="1.0" encoding="UTF-8"?>
<vxml version="2.1">
<form>
<field name="ZIP">
<prompt> Welcome to the Weather Lookup Tool!
What zip code would you like to search? </prompt>
</field>
<catch event="noinput error help">
Please enter the 5-digit ZIP code followed by the pound key.
</catch>
<block>
<submit next="http://ws.cdyne.com/WeatherWS/Weather.asmx/GetCityForecastByZIP" namelist="ZIP"/>
</block>
</form>
</vxml>

三、語(yǔ)音瀏覽器中發(fā)生了什么?

圖2. VoiceXML語(yǔ)音瀏覽器操作

  圖2顯示了SIP-VoiceXML瀏覽器的組件和操作狀態(tài)變遷:

  1. 當瀏覽器接收到一個(gè)新進(jìn)來(lái)的SIP呼叫后,它創(chuàng )建三個(gè)不同線(xiàn)程:RTP接收線(xiàn)程、RTP發(fā)送線(xiàn)程和VoiceXML解釋器線(xiàn)程。RTP接收線(xiàn)程從主叫方接收媒體數據包并調用DTMF檢測模塊;RTP發(fā)送線(xiàn)程將媒體數據包以流的方式發(fā)送給主叫方。一個(gè)單獨的發(fā)送線(xiàn)程幫助維護外出數據報的固定帶寬(比如針對G.711音頻的64 kb/s),而不考慮語(yǔ)音合成速度。初始的VoiceXML頁(yè)面地址可以預先配置在瀏覽器中,或者編碼到SIP請求。例如,如果主叫方撥打sip:dialog.vxml.http%3a//dialogs.server.com/script32.vxml@vxmlservers.com,那么該呼叫將到達運行在vxmlservers.com上的瀏覽器,然后從script32.vxml取得初始VoiceXML頁(yè)面。

  另一方面,如果request-uri是sip:7137@cs.columbia.edu,那么將用缺省的預先配置的初始VoiceXML URL鏈接(比如會(huì )議服務(wù)的)去調用解釋器。

  2. 解釋器線(xiàn)程使用初始URL呼叫XML parser。

  3. XML parser從Web服務(wù)器或本地文件系統取得頁(yè)面(基于初始URL)。

  4. XML parser將返回的XML文檔表示成一個(gè)樹(shù)結構。

  5. 解釋器線(xiàn)程在來(lái)自VoiceXML文檔的選定表單上調用表單解釋算法(Form Interpretation Algorithm, FIA )。

  6. FIA基于VoiceXML文檔內容調用各種其它模塊。例如,它可以調用TTS SDK合成任何語(yǔ)音提示。

  7. FIA也可以調用HTTP fetcher模塊取得外部語(yǔ)法文件,或者用于語(yǔ)音提示的媒體文件。XML parser通過(guò)其內置HTTP客戶(hù)機取得VoiceXML頁(yè)面。

  8. HTTP fetcher通過(guò)HTTP GET/POST方法來(lái)檢索文檔。

  9. 使用HTTP fetcher從Web服務(wù)器檢索到的媒體文件被分段成交互式電話(huà)數據包,并且排隊等待發(fā)送線(xiàn)程以流的方式發(fā)送給主叫方。

  10. 語(yǔ)音合成器(Speech synthesizer)輸出也分段和排隊發(fā)送到主叫方。

  11. VoiceXML文檔可以在文檔的不同范圍指定語(yǔ)法規則。FIA可以基于VoiceXML頁(yè)面的當前執行范圍為匹配引擎設置活動(dòng)語(yǔ)法。

  12. RTP接收線(xiàn)程接收RTP媒體數據包,并且調用DTMF檢測器。

  13. 任何檢測到的DTMF數字被傳給語(yǔ)法匹配引擎。

  14. DTMF按鍵可以通過(guò)多種方式從主叫方傳送到瀏覽器。一種方法是并不把它們從話(huà)音中區別開(kāi)來(lái),而是使用相同的音頻編解碼器對它們進(jìn)行編碼。但是低帶寬音頻編解碼器可能扭曲了帶內DTMF按鍵的特性,導致它們難以檢測。第二種首選的方法是使用“電話(huà)事件”來(lái)攜帶數字碼而不是在RTP數據包中的編碼音頻。在第一種情形,瀏覽器必須做DTMF檢測,而第二種情況下,主叫方或網(wǎng)關(guān)必須做DTMF檢測。RTP接收模塊將電話(huà)事件直接轉發(fā)給語(yǔ)法匹配引擎。還有一種方法是在SIP INFO消息中傳輸DTMF。

  15. 語(yǔ)法匹配引擎嘗試把接收到的數字與任何活動(dòng)語(yǔ)法進(jìn)行匹配,并在找到匹配時(shí)通知FIA。

  16. RTP發(fā)送線(xiàn)程定期把媒體數據包發(fā)給主叫方。在靜默時(shí)不發(fā)送數據包。

四、使用Voxeo Prophecy簡(jiǎn)化VoiceXML應用開(kāi)發(fā)

  通過(guò)使用Voxeo公司提供的Prophecy開(kāi)放應用平臺,我們可以快速地創(chuàng )建、集成和部署VoIP應用,它所提供的可視化Web界面設計工具可以使我們不必寫(xiě)一行代碼,即可完成一個(gè)復雜而有趣的應用。

  首先要做的是花一些時(shí)間前往http://cn.voxeo.com/prophecy/,免費下載一個(gè)Prophecy 8.0。安裝完成后,會(huì )在系統托盤(pán)區生成一個(gè)Voxeo Prophecy v8.0.221.3圖標,選擇Prophecy Home,在打開(kāi)的Voxeo Prophecy網(wǎng)頁(yè)中點(diǎn)擊Prophecy Designer即開(kāi)始了我們創(chuàng )建VoiceXML項目的輕松之旅。該設計工具將整個(gè)VoiceXML應用以圖表或樹(shù)狀結構直觀(guān)地呈現給開(kāi)發(fā)者,可以方便地控制和修改其交互流程,如圖3所示。

圖3. Prophecy可視化設計工具

  項目設計完成后,我們需要發(fā)布它,只須簡(jiǎn)單地點(diǎn)擊左下角的Publish鏈接即可。每次發(fā)布項目后,都會(huì )生成一個(gè)新的版本,我們可以通過(guò)Project菜單的Project Settings查看所有版本。

  接下來(lái),我們可以把這個(gè)項目映射成一個(gè)IVR應用了。在先前打開(kāi)的Voxeo Prophecy網(wǎng)頁(yè)中,點(diǎn)擊Administration鏈接,打開(kāi)一個(gè)Management Console頁(yè)面,點(diǎn)擊Call Routing,為我們的應用選擇一條映射路徑,比如說(shuō)Route ID為“vxml”,在Route Type字段選擇“Designer”,App Name選擇項目名稱(chēng)(比如“Weather Lookup”),滾動(dòng)到頁(yè)面底部,點(diǎn)擊Save Changes按鈕保存。

  最后,交卷的時(shí)刻到了,我們的應用到底能不能用呢?讓我們來(lái)測試一下。打開(kāi)Prophecy自帶的SIP Phone,如圖4所示,給sip:vxml@127.0.0.1撥號。當我們聽(tīng)到揚聲器傳來(lái)“Welcome to the Weather Lookup Tool...”,Prophecy沒(méi)有令我們失望,我們已經(jīng)擁有一個(gè)免費的“天氣播音員”了,我們只要告訴它想查找的城市的五位郵政編碼(比如“10027”),就可以收聽(tīng)紐約市的天氣情況了。當然,本示例項目實(shí)現的是美國的城市天氣播報,讀者完全可以在其基礎上,實(shí)現中國的城市天氣預報。

圖4. Voxeo SIP Phone

  獨樂(lè )樂(lè )不如與眾樂(lè )樂(lè ),讀者是不是很想與自己的朋友分享這個(gè)成果呢?沒(méi)有問(wèn)題,Voxeo替您考慮到了,它提供了免費的開(kāi)發(fā)人員門(mén)戶(hù),您只要訪(fǎng)問(wèn)http://evolution.voxeo
.com/
,免費注冊一個(gè)帳號,就可以象使用Prophecy一樣,方便地將您的應用搬到該站點(diǎn)上,Voxeo自動(dòng)給您的應用映射開(kāi)通了各種通過(guò)Internet或傳統電話(huà)進(jìn)行訪(fǎng)問(wèn)的途徑。本文的美國城市天氣查找(Weather Lookup Tool)應用已經(jīng)部署在上面了,讀者可以通過(guò)以下幾種途徑來(lái)執行它:   

  1. 通過(guò)Skype客戶(hù)端免費撥打號碼 +99000936 9991424457

  2. 通過(guò)SIP終端(比如Voxeo SIP Phone或X-Lite)免費呼叫sip:9991424457@sip.voxeo.net

  3. 通過(guò)Gizmo5軟件免費撥打iNum號碼 +883510001800365

  4. 通過(guò)手機或者固定電話(huà)撥打號碼 +1 (800) 289-5570 或 +1 (407) 386-2174 (美國電話(huà)號碼,收費),然后鍵入PIN碼9991424457
  讀者還可以訪(fǎng)問(wèn)http://rapidshare.com/files/165209594/LoopWeather.vra下載Weather Lookup項目源代碼,并導入部署在自己的應用中。

五、結束語(yǔ)

  VoiceXML是允許用戶(hù)通過(guò)電話(huà)和語(yǔ)音方式訪(fǎng)問(wèn)因特網(wǎng)資源的強大技術(shù),它建立在SIP協(xié)議的基礎之上。本文介紹了VoiceXML應用的典型結構,解析了一款VoiceXML語(yǔ)音瀏覽器的工作原理,最后介紹了如何利用Voxeo Prophecy設計工具來(lái)輕松地完成一個(gè)應用的創(chuàng )建和部署。筆者希望通過(guò)這篇文章,您可以很快地開(kāi)發(fā)出自己的交互式語(yǔ)音應用。

參考資料

[1] VoiceXML 2.1: http://www.w3.org/TR/voicexml21/.
[2] J. Rosenberg, H. Schulzrinne, G. Camarillo, A. Johnston, J. Peterson, R. Sparks, M. Handley, and E. Schooler. SIP: session initiation protocol. RFC 3261, Internet Engineering Task Force, June 2002.
[3] Voxeo Prophecy: http://cn.voxeo.com/prophecy/

CTI論壇編輯



相關(guān)鏈接:
Voxeo VoiceObjects 統一自服務(wù)提高滿(mǎn)意度 2009-09-23
Voxeo攜Prophecy10高度亮相SpeechTEK2009 2009-09-03
擁有中文TTS的Prophecy IVR語(yǔ)音平臺 2009-08-17
Voxeo發(fā)布開(kāi)源的電話(huà)“云計算”服務(wù)平臺 2009-08-12
自助式語(yǔ)音平臺開(kāi)發(fā)利器Prophecy Platform 2009-08-03

分類(lèi)信息:  交互語(yǔ)音技術(shù)_與_voicexml技術(shù)     技術(shù)_交互語(yǔ)音_文摘   技術(shù)_voicexml_文摘      
              
亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 砚山县| 西青区| 夏邑县| 丰县| 凤城市| 安阳县| 右玉县| 郑州市| 海口市| 白沙| 衡东县| 岗巴县| 龙里县| 阳朔县| 巩义市| 彩票| 临泽县| 云安县| 搜索| 广元市| 建阳市| 吴忠市| 铜山县| 梅州市| 定襄县| 班玛县| 星子县| 紫阳县| 鄂托克旗| 沧州市| 漳平市| 光泽县| 灌南县| 江山市| 古丈县| 夹江县| 虞城县| 肇源县| 萝北县| 余姚市| 时尚| http://444 http://444 http://444 http://444 http://444 http://444