首頁(yè)>>廠(chǎng)商>>語(yǔ)音識別與合成>> 北京無(wú)限商機

語(yǔ)音系統開(kāi)發(fā)的新平臺:VoiceXML瀏覽器

張欣 2001/10/19

VoiceXML將語(yǔ)音交互引入了數據瀏覽的世界,使電話(huà)等以語(yǔ)音為主要形式的設備成為新型的網(wǎng)絡(luò )終端,其自然、簡(jiǎn)單,具備了更為廣泛的普及性和友好性。本文對無(wú)限商機公司的VoiceXML語(yǔ)音瀏覽器的介紹,將幫助讀者進(jìn)一步了解它的功能和用途。

無(wú)限商機公司的VoiceXML語(yǔ)音瀏覽器是為解決用戶(hù)的多種需求而設計的,在實(shí)現過(guò)程中,分別設計了控制層、安全層、事務(wù)層、會(huì )話(huà)層和應用層,并開(kāi)放了除控制層之外的所有層的接口。

1.VoiceXML語(yǔ)音瀏覽器的組成部分

一個(gè)完整的VoiceXML語(yǔ)音瀏覽器,由VoiceXML 解析器、語(yǔ)音識別引擎、語(yǔ)音合成引擎、語(yǔ)音通道等幾個(gè)部分組成。

(1)VoiceXML 解析器

VoiceXML解析器是整個(gè)語(yǔ)音瀏覽器的核心部分,在語(yǔ)音瀏覽器中擔負控制中心的角色。VoiceXML解析器通過(guò)網(wǎng)絡(luò )協(xié)議,如HTTP協(xié)議等,獲取VoiceXML 腳本語(yǔ)言所描述的應用文檔;解析該應用文檔,解釋其中各個(gè)標志,生成相應的控制命令,控制其他部件進(jìn)行相應的動(dòng)作,并獲取結果;根據結果決定應用的執行方向和順序流。

(2)語(yǔ)音識別引擎

語(yǔ)音識別引擎是VoiceXML語(yǔ)音瀏覽器的生命力所在,它使計算機能理解用戶(hù)的語(yǔ)音命令,將產(chǎn)生的相應的文字結果送回VoiceXML解析器進(jìn)行處理。

在VoiceXML語(yǔ)音瀏覽器中,語(yǔ)音識別引擎為命令式的識別引擎,其根據有限的語(yǔ)法來(lái)識別用戶(hù)的語(yǔ)音信號,產(chǎn)生對應語(yǔ)法定義的識別結果。所以,語(yǔ)法便成為了VoiceXML語(yǔ)音瀏覽器中的重要概念。在VoiceXML語(yǔ)音瀏覽器中,語(yǔ)法決定了用戶(hù)能說(shuō)什么、如何說(shuō)。好的語(yǔ)法能帶給用戶(hù)良好的交互感覺(jué),也能從邏輯上提高語(yǔ)音識別引擎的識別率,使整個(gè)語(yǔ)音應用的瀏覽流暢而輕松。

在VoiceXML語(yǔ)音瀏覽器中,語(yǔ)音識別引擎不僅需要處理對用戶(hù)語(yǔ)音信號的識別,同時(shí)也需要處理對用戶(hù)按鍵的識別,按鍵和語(yǔ)音以同樣的機制被處理和傳遞。

(3)語(yǔ)音合成引擎

VoiceXML語(yǔ)音合成引擎可以將文字轉換成語(yǔ)音文件,也可以轉換成語(yǔ)音數據流,或者直接將事先錄制好的語(yǔ)音文件直接播放或以流的方式播放給語(yǔ)音通道。

語(yǔ)音合成引擎將文字轉化為聲音的品質(zhì),決定了用戶(hù)對系統的直接感覺(jué)。因此,如何提高語(yǔ)音合成引擎的合成品質(zhì),已成為影響語(yǔ)音應用效果的重要因素。

(4)語(yǔ)音通道

語(yǔ)音通道是在VoiceXML語(yǔ)音瀏覽器中傳輸用戶(hù)語(yǔ)音數據信號和由合成引擎所產(chǎn)生的聲音數據信號的傳遞通道,它在物理上連接語(yǔ)音采集和播放設備、語(yǔ)音識別引擎的語(yǔ)音輸入端和語(yǔ)音合成引擎的語(yǔ)音輸出端。

在基于電信平臺的語(yǔ)音應用系統中,語(yǔ)音通道的物理設備主要是語(yǔ)音卡、語(yǔ)音信道或是以數字編碼形式存在的虛擬通道,如IP的語(yǔ)音編碼數據包等;而在PC平臺上,聲卡則成為主要的語(yǔ)音通道。

對不同平臺的語(yǔ)音通道物理設備的支持,決定了VoiceXML語(yǔ)音瀏覽器是一個(gè)可實(shí)際應用的平臺。

2.VoiceXML語(yǔ)音瀏覽器各部分的協(xié)作

VoiceXML語(yǔ)音瀏覽器的協(xié)作核心是VoiceXML解析器,其通過(guò)建立應用和會(huì )話(huà),獲取包含控制命令的文檔,根據文檔中的標志建立對話(huà),從而解釋各個(gè)對話(huà),控制語(yǔ)音識別、語(yǔ)音合成引擎以及語(yǔ)音通道的觸發(fā)、開(kāi)啟關(guān)閉和掛起等,實(shí)現與用戶(hù)的會(huì )話(huà)式的交互,并根據對用戶(hù)反饋的識別結果進(jìn)行導向判斷,進(jìn)行文檔之間的轉移和應用之間的轉移。

3.VoiceXML語(yǔ)音瀏覽器的開(kāi)放機制

在無(wú)限商機公司的VoiceXML語(yǔ)音瀏覽器中,對識別引擎和合成引擎進(jìn)行了開(kāi)放性的接口設計,實(shí)現了與引擎無(wú)關(guān)的設計。根據此接口,開(kāi)發(fā)商可以開(kāi)發(fā)用于其他識別或合成引擎的封裝模塊,從而在無(wú)限商機的VoiceXML語(yǔ)音瀏覽器中使用其他的識別或合成引擎。其可建立于電話(huà)服務(wù)器、PC 、嵌入式設備中,支持國內外語(yǔ)音卡,支持IP等語(yǔ)音信道。

無(wú)限商機公司VoiceXML語(yǔ)音瀏覽器中,所有開(kāi)發(fā)接口是以CORBA規范設計的,開(kāi)發(fā)商可以用各種編程語(yǔ)言,如C、C++、Java等,在不同的平臺和操作系統上實(shí)現,從而實(shí)現對各種操作系統平臺的支持。并且,利用CORBA強大的分布式機制,整個(gè)VoiceXML語(yǔ)音瀏覽器可以建立于跨越各種物理平臺、操作系統之上的分布式網(wǎng)絡(luò )中。

4.在VoiceXML語(yǔ)音瀏覽器上開(kāi)發(fā)語(yǔ)音應用

在VoiceXML語(yǔ)音瀏覽器上開(kāi)發(fā)語(yǔ)音應用,如同開(kāi)發(fā)Web應用一樣輕松簡(jiǎn)單,只需要有XML的知識,就可以開(kāi)發(fā)VoiceXML應用。基于VoiceXML的語(yǔ)音應用系統,可以很好地與其他已有的Web 應用系統或數據應用系統實(shí)現良好結合。

在VoiceXML語(yǔ)音瀏覽器基礎上的應用開(kāi)發(fā),改變了傳統的CTI系統的開(kāi)發(fā)概念。開(kāi)發(fā)人員不必關(guān)心復雜的流程和模塊,不必為數據接口編寫(xiě)程序模塊,不必重新建立已有系統的邏輯實(shí)現,也不必一次次地重復某個(gè)模塊的開(kāi)發(fā)。

計算機世界網(wǎng) 2001/10/19



相關(guān)鏈接:
融合通訊還有多遠? 2003-04-15
我國語(yǔ)音互聯(lián)網(wǎng)產(chǎn)業(yè)的發(fā)展和統一標準規范VAP探討 2002-03-04
北京無(wú)限商機 2002-03-04
北郵UBO共建實(shí)驗室致力語(yǔ)音數據兩網(wǎng)融合 2002-01-23
企業(yè)服務(wù)新形象——UBO Tel-win智能總機 2001-12-20
亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 晋江市| 兴海县| 札达县| 桃园市| 自贡市| 深州市| 乌拉特后旗| 镇赉县| 客服| 通州区| 左云县| 化德县| 阳春市| 温泉县| 龙泉市| 恭城| 泰顺县| 金坛市| 托克逊县| 云安县| 墨竹工卡县| 华坪县| 吉水县| 佛冈县| 蒙自县| 和田市| 阿拉尔市| 吉木乃县| 奉化市| 保定市| 博客| 乐东| 潼南县| 荔波县| 洛宁县| 兰坪| 武宁县| 乃东县| 沙洋县| 焉耆| 靖州| http://444 http://444 http://444 http://444 http://444 http://444