基于VoiceXML的語(yǔ)音應用系統開(kāi)發(fā)
2008/10/30
一、概述圖一、VoiceXML應用和WEB應用的比較
下圖(圖二)展示了基于VoiceXML的語(yǔ)音應用系統的基本架構:
文檔服務(wù)器(WEB Server):用于存放VoiceXML腳本文件(或者根據由VoiceXML
Server發(fā)過(guò)來(lái)了HTTP請求自動(dòng)生成VoiceXML腳本),和事先錄制好的音頻文件等一切有關(guān)的文檔。 VoiceXML
Server通過(guò)HTTP請求從該文檔服務(wù)器獲取各種需要的文件。
VoiceXML 服務(wù)器(VoiceXML Gateway):用于接收和識別用戶(hù)的輸入,解釋和執行VoiceXML腳本文件,并把結果轉換成語(yǔ)音輸出給用戶(hù)。它一般具備下列組件:VoiceXML解釋器組件(VoiceXML
Browser),呼叫控制組件(CCXML Browser),自動(dòng)語(yǔ)音識別組件(ASR),語(yǔ)音合成組件(TTS)等。這些組件共同組成了VoiceXML的解釋和執行平臺。
圖二、VoiceXML應用系統架構
和互聯(lián)網(wǎng)用戶(hù)通過(guò)鍵盤(pán)輸入某個(gè)WEB頁(yè)面的地址(URL)來(lái)訪(fǎng)問(wèn)WEB應用類(lèi)似,VoiceXML用戶(hù)通過(guò)電話(huà)或者VoIP終端撥打某個(gè)應用對應的電話(huà)號碼來(lái)訪(fǎng)問(wèn)該應用程序(圖中的步驟1)。VoiceXML服務(wù)器收到用戶(hù)的呼叫后,根據用戶(hù)撥打的號碼去文檔服務(wù)器查找對應的VoiceXML文件(圖中的步驟2),通過(guò)HTTP請求把文件下載到本機執行,根據特定應用的需要,VoiceXML服務(wù)器可能會(huì )發(fā)出多個(gè)HTTP請求獲取和應用有關(guān)的其他文件,比如需要播放的語(yǔ)言文件等(圖中的步驟3)。然后由
VoiceXML解釋器組件( VoiceXML Browser)解釋和執行VoiceXML腳本語(yǔ)言并把結果轉換成語(yǔ)音傳送給用戶(hù)(圖中的步驟4)。在執行過(guò)程中,用戶(hù)可能需要通過(guò)語(yǔ)音和VoiceXML服務(wù)器進(jìn)行交互,比如菜單選擇或者對查詢(xún)結果進(jìn)行過(guò)濾等。VoiceXML服務(wù)器通過(guò)呼叫控制組件(CCXML
Browser),自動(dòng)語(yǔ)音識別組件(ASR),語(yǔ)音合成組件(TTS)來(lái)實(shí)現這些交互。
在VoiceXML系統中有兩種形式語(yǔ)音的輸出: 機器合成語(yǔ)音(TTS)和事先錄制好的語(yǔ)音文件。
TTS ( Text-To-Speech) : 是由機器把文本轉換為數字語(yǔ)音格式,這種聲音聽(tīng)起來(lái)會(huì )感覺(jué)有些機械和不自然,但是輸出內容靈活,不受任何限制。
事先錄制好的語(yǔ)音文件: 和TTS相比聽(tīng)起來(lái)更自然,但是內容受限制。在實(shí)際應用中往往把二者結合起來(lái)。
VoiceXML系統中的輸入也有兩種形式: 自動(dòng)語(yǔ)音識別 (ASR) 和雙音多頻鍵盤(pán)音(DTMF)。
ASR (Automatic Speech Recognition) 是指計算機把用戶(hù)的語(yǔ)音自動(dòng)識別成文字信息,便于計算機的進(jìn)一步處理,從而使得用戶(hù)可以通過(guò)自然語(yǔ)言來(lái)控制計算機的執行。
DTMF (Dual Tone MultiFrequency) 則是用戶(hù)可以通過(guò)電話(huà)的按鍵進(jìn)行輸入。
三、VoiceXML開(kāi)發(fā)示例
本文中的信息查詢(xún)例子演示了一個(gè)簡(jiǎn)單的VoiceXML應用。該例子VoiceXML腳本中用到的所有的標簽如表1所示,表2是該例子的源代碼。圖四是該例子的呼叫流程。首先是用戶(hù)發(fā)起呼叫,應用程序通過(guò)計算機合成語(yǔ)音(TTS)告訴用戶(hù)所有的選擇項并等待用戶(hù)的響應。用戶(hù)的語(yǔ)音將由計算機根據語(yǔ)法標簽
圖四:信息查詢(xún)例子呼叫流程圖
表 2. 信息查詢(xún)例子源代碼
該示例程序已經(jīng)部署在http://evolution.voxeo.com。讀者可以下列幾個(gè)途徑來(lái)執行該示例程序:
CTI論壇編輯
Voxeo VoiceObjects 統一自服務(wù)提高滿(mǎn)意度 2009-09-23 |
Voxeo攜Prophecy10高度亮相SpeechTEK2009 2009-09-03 |
擁有中文TTS的Prophecy IVR語(yǔ)音平臺 2009-08-17 |
Voxeo發(fā)布開(kāi)源的電話(huà)“云計算”服務(wù)平臺 2009-08-12 |
自助式語(yǔ)音平臺開(kāi)發(fā)利器Prophecy Platform 2009-08-03 |