曾幾何時(shí),人們對XML已耳熟能詳,并將它用于描述圖像和結構復雜的其他數據。Web技術(shù)發(fā)展之快令人驚嘆!現在,業(yè)界又正在展開(kāi)一項XML的新的應用:VoiceXML(話(huà)音可擴展標記語(yǔ)言),其主要特點(diǎn)是通過(guò)語(yǔ)音輸入和音頻輸出支持人機對話(huà)。
VoiceXML的基本功能
VoiceXML是萬(wàn)維網(wǎng)集團(W3C)定義的可擴展標記語(yǔ)言(XML)的一種新的應用。或者說(shuō)它是一種域專(zhuān)用語(yǔ)言,根據所播放的音頻文件、要口述的文本、要記錄和識別的語(yǔ)言以及所收集的按鍵音輸入,定義人和計算機之間的對話(huà)。VoiceXML可以描述傳統的語(yǔ)音響應業(yè)務(wù)以及新的混合主動(dòng)式業(yè)務(wù)。
VoiceXML的主要特性
VoiceXML 1.0版的主要特性可以分為4個(gè)方面:對話(huà)、電話(huà)、平臺和性能。
VoiceXML分布式模型
Web為每個(gè)用戶(hù)提供全球范圍的信息,同時(shí)給每個(gè)信息和服務(wù)提供商提供全球范圍的用戶(hù)。因此,分布式應用模型是Web的基本模型;VoiceXML建立在與基于Web的相同的模型上。圖1表示通過(guò)電話(huà)訪(fǎng)問(wèn)的VoiceXML業(yè)務(wù)使用的基于Web的分布式應用模型。
青出于藍而勝于藍
盡管VoiceXML重用許多HTML的概念和設計,但由于可視和語(yǔ)音交互之間的區別,它在幾個(gè)方面具有不同的特點(diǎn)。例如,HTML文件是從統一資源識別符確定的網(wǎng)絡(luò )資源中讀出的單個(gè)元素,并同時(shí)將所有的元素提供給用戶(hù)。VoiceXML則不同,它包含若干對話(huà)元素(選單、表格),依次順序地將這些元素提供給用戶(hù)。這種區別歸因于可視媒介能夠同時(shí)顯示若干選項,而話(huà)音媒介本來(lái)就具有連續性特點(diǎn)。
話(huà)音媒介連續性的再一個(gè)不同特點(diǎn)是要求標記包含應用邏輯,以用于在對話(huà)元素之間排列程序。這一要求反映在順序邏輯元素的集成方面,VoiceXML比HTML更緊湊。例如,VoiceXML包含順序控制元素,而在HTML中,這種控制只能通過(guò)更麻煩的編寫(xiě)腳本的方法才能實(shí)現。
W3C語(yǔ)音瀏覽器工作組已將VoiceXML 1.0版確定為對話(huà)標記語(yǔ)言的基礎。VoiceXML客戶(hù)程序和VoiceXML應用業(yè)務(wù),目前已在許多公司中開(kāi)始實(shí)用。