關(guān)于制定中國移動(dòng)互聯(lián)網(wǎng)語(yǔ)音應用協(xié)議標準的建議
2001/03/11
一 引言
以互聯(lián)網(wǎng)為代表的信息產(chǎn)業(yè)為中國帶來(lái)了巨大的機會(huì )和挑戰,中國社會(huì )開(kāi)始進(jìn)入一個(gè)以信息為核心的時(shí)代。如何快速準確地獲取所關(guān)心的信息,對人們的日常工作和生活已經(jīng)具有越來(lái)越重要的影響。
計算機作為互聯(lián)網(wǎng)絡(luò )的一種重要信息終端,是目前人們從互聯(lián)網(wǎng)上獲取信息的主要工具。然而,在計算機普及率、互聯(lián)網(wǎng)普及率以及教育程度相對較低的中國,使用計算機上網(wǎng),獲取信息和進(jìn)行通訊對于廣大百姓來(lái)說(shuō),還是一個(gè)神秘的期望。
至今為止,Internet 的訪(fǎng)問(wèn)模式逐漸從單一的PC訪(fǎng)問(wèn)方式向多種用戶(hù)終端發(fā)展 ,出現了移動(dòng)電話(huà)、PDA、機頂盒等。
如何解決信息產(chǎn)業(yè)化和社會(huì )發(fā)展水平之間的矛盾,依據中國具體國情,盡可能的實(shí)現信息技術(shù)的普及,促進(jìn)中國信息社會(huì )進(jìn)步的發(fā)展,使信息技術(shù)這樣的高科技輕松的進(jìn)入中國大多數百姓家,在中國具有巨大的市場(chǎng)前景和社會(huì )效益。
而近年來(lái)語(yǔ)音技術(shù)的飛速發(fā)展和不斷成熟,以及中文語(yǔ)音應用技術(shù)的突破,為信息網(wǎng)絡(luò )帶來(lái)了一種極具誘惑的信息終端-----電話(huà)。
電話(huà)是中國百姓最為熟悉的通信工具,中國電話(huà)的普及率為全球第二,相對現今不到1000萬(wàn)的互聯(lián)網(wǎng)電腦終端用戶(hù)來(lái)說(shuō),高達2億的電話(huà)用戶(hù)具有更為重要的意義。而語(yǔ)音應用技術(shù),為中國百姓建立了一條輕松通達信息時(shí)代的高速公路,將信息科技以最為親切的方式帶到了人們身邊。
二 為何選擇語(yǔ)音應用技術(shù)
語(yǔ)音應用技術(shù),是連接互聯(lián)網(wǎng)的與電話(huà)用戶(hù)的紐帶,其使普通電話(huà)、手機等成為五花八門(mén)的網(wǎng)絡(luò )終端之一,并最大的擴展了互聯(lián)網(wǎng)用戶(hù)。
2.1.語(yǔ)音與計算機
語(yǔ)音,是人類(lèi)最為熟悉的交流方式。人有70%的信息獲取是通過(guò)聽(tīng),而90%的信息表達是通過(guò)說(shuō)。語(yǔ)音是人們詢(xún)問(wèn)問(wèn)題,交換觀(guān)念、分享經(jīng)驗和建立關(guān)系的最主要方式,人類(lèi)通過(guò)語(yǔ)音傳達著(zhù)大量的信息。
長(cháng)期以來(lái),人與計算機的交互主要是通過(guò)鍵盤(pán)、鼠標和屏幕。雖然隨著(zhù)圖形用戶(hù)界面(GUI)的日臻完善、各種輸入法的不斷出現和成熟,以及手寫(xiě)輸入的應用使人與計算機的交換越來(lái)越簡(jiǎn)單方便,但追求完美和卓越的網(wǎng)絡(luò )時(shí)代,人們也愈加強烈地渴求一種更方便更自然的人機界面。而語(yǔ)音必然成為人們最為熟悉和輕松的人機交互方式。
2.2.語(yǔ)音技術(shù)
作為智能計算機研究的主導方向和人機通信的關(guān)鍵技術(shù),語(yǔ)音技術(shù)對計算機發(fā)展和社會(huì )生活的重要性日益凸現出來(lái)。作為語(yǔ)音技術(shù)中最主要的兩大技術(shù):語(yǔ)音識別技術(shù)(ASR)和語(yǔ)音合成技術(shù)(TTS),隨著(zhù)近年來(lái)人們在數學(xué)算法和聲學(xué)模型取得的突破和飛速提高,語(yǔ)音識別和語(yǔ)音合成技術(shù)以及自然語(yǔ)言處理技術(shù)的成熟,使電腦能“說(shuō)”,能“聽(tīng)”,使人與機器的交流能象人與人之間對話(huà)一樣輕松和自然。
正如當初圖形用戶(hù)界面(GUI)改變了個(gè)人電腦一樣,以語(yǔ)音技術(shù)為核心的語(yǔ)音用戶(hù)界面(VUI)正在改變著(zhù)電腦和電話(huà)系統,以及各種智能設備。
2.3.語(yǔ)音應用技術(shù)
語(yǔ)音應用技術(shù)(Voice Application Technology ),是指人們可以使用有線(xiàn)電話(huà)或移動(dòng)電話(huà),以及PC、PDA和其它智能設備通過(guò)語(yǔ)音識別、語(yǔ)音合成的交互技術(shù),以及語(yǔ)音瀏覽、智能信息處理技術(shù)等實(shí)現人們訪(fǎng)問(wèn)互聯(lián)網(wǎng)絡(luò ),以及實(shí)現個(gè)人服務(wù)和商業(yè)服務(wù)的應用技術(shù)。
語(yǔ)音應用技術(shù),是語(yǔ)音技術(shù)(ASR和TTS TT)、語(yǔ)音瀏覽技術(shù)、智能文字信息處理技術(shù)等技術(shù)的集合,其形成一個(gè)完整的技術(shù)應用規范體系,建立于已有相關(guān)技術(shù)協(xié)議標準上,著(zhù)重于應用開(kāi)發(fā)。
語(yǔ)音應用技術(shù)是跨接以語(yǔ)音為核心的電話(huà)網(wǎng)絡(luò )和以數據為核心的互聯(lián)網(wǎng)絡(luò )的一座橋梁,使有線(xiàn)電話(huà)和移動(dòng)電話(huà)成為互聯(lián)網(wǎng)絡(luò )信息終端,為人們以自然語(yǔ)言交互的方式來(lái)遨游信息信息打開(kāi)了一扇自由的大門(mén)。語(yǔ)音應用技術(shù)覆蓋語(yǔ)音識別、語(yǔ)音合成、語(yǔ)音瀏覽、語(yǔ)音集成、語(yǔ)音交互、Web服務(wù)等技術(shù)領(lǐng)域,可以輕松介入現有的網(wǎng)絡(luò )信息系統,集成現有的各類(lèi)信息處理技術(shù),如Web 、WAP、GPRS等等。
2.4.語(yǔ)音應用技術(shù)的優(yōu)勢
為何語(yǔ)音應用技術(shù)對于互聯(lián)網(wǎng)絡(luò ),對于信息技術(shù)如此重要?首先,是因為電話(huà)的重要性。電話(huà)在的全球發(fā)達地區幾乎無(wú)所不在,時(shí)刻出現在人們身邊。電話(huà)的數量遠遠大于電腦的數量,更遠大于連接了互聯(lián)網(wǎng)的電腦數量。尤其是在中國,電話(huà)相對電腦在更大程度上更是人們生活中最平常的設備。
隨著(zhù)移動(dòng)電話(huà)越來(lái)越小,越來(lái)越輕,越來(lái)越便宜,以及移動(dòng)電話(huà)電池使用時(shí)間越來(lái)越長(cháng),其所具備的便攜性遠勝于電腦。而伴隨移動(dòng)通信技術(shù)的飛速發(fā)展,他們更具備了電腦不具備的優(yōu)勢,比如全球定位。你甚至可以在開(kāi)車(chē)時(shí)方便的使用移動(dòng)電話(huà)。
語(yǔ)音對于電話(huà)具有同樣的重要性,語(yǔ)音是電話(huà)的生命,是電信網(wǎng)絡(luò )的數據血液。雖然在移動(dòng)電話(huà)中出現了WAP這樣很有用的技術(shù),使移動(dòng)電話(huà)可以作為網(wǎng)絡(luò )終端,但WAP手機的屏幕太小而具有很大的局限性,在手機鍵盤(pán)上進(jìn)行輸入也相當麻煩。雖然I-Mode系統正引人關(guān)注,但它同樣具有類(lèi)似問(wèn)題。
語(yǔ)音具有其獨特的優(yōu)勢,而且語(yǔ)音比鍵盤(pán)和閱讀更具親切感。當然,圖象和文字依然很重要,我們相信,我們不久就可以見(jiàn)到“多模式”的設備,可以圖象和文字的方式進(jìn)行,或以語(yǔ)音的方式進(jìn)行,甚至可以混合語(yǔ)音和圖象。而這正是語(yǔ)音應用技術(shù)帶來(lái)的美好情景。
同樣,語(yǔ)音對于Internet也一樣重要。首先,基于語(yǔ)音瀏覽技術(shù)的語(yǔ)音應用系統的開(kāi)發(fā)很容易,應用應用技術(shù)可以輕松建立豐富的、廉價(jià)的和高效的Web應用,以及開(kāi)發(fā)工具。其次,語(yǔ)音應用系統很容易發(fā)布,不再需要建立一個(gè)指定的專(zhuān)用的語(yǔ)音服務(wù)器,基于語(yǔ)音瀏覽機制的語(yǔ)音應用可以放在Internet 上的任意一個(gè)地方,而用戶(hù)通過(guò)電話(huà),可以象使用IE這樣的瀏覽器一樣進(jìn)行查詢(xún)、書(shū)簽以及鏈接等其他Web的瀏覽方式。
而基于現有Web技術(shù)的語(yǔ)音Web服務(wù)技術(shù),具有現有Web技術(shù)的同樣優(yōu)勢,可以進(jìn)行安全交易、下載信息、收聽(tīng)mp3等服務(wù)。且更為快捷和自然。
語(yǔ)音自然交互更具有其它信息終端不具備的優(yōu)勢,利用自然語(yǔ)音交互技術(shù),用戶(hù)不再需要一項一項的填寫(xiě)Web的Form表單,不再需要痛苦的在小小的手機鍵盤(pán)上換著(zhù)數字輸入名字和E-mail地址。基于關(guān)鍵字捕捉和自然語(yǔ)言處理技術(shù),用戶(hù)可以輕松的說(shuō)一句:“我是注冊用戶(hù) 張三,請幫我查 深發(fā)展A 現在的股價(jià),發(fā)個(gè)短消息給我。”一切輕松自然。
2.5.語(yǔ)音應用技術(shù)和移動(dòng)互聯(lián)網(wǎng)絡(luò )
Internet和移動(dòng)通信,作為邁向信息社會(huì )的兩個(gè)重要標志分別對應著(zhù)對大量信息資源的有效訪(fǎng)問(wèn)和隨處漫游的個(gè)人通信。如何結合它們的技術(shù)優(yōu)勢,在不受信息源的限制和用戶(hù)訪(fǎng)問(wèn)時(shí)位置限制的同時(shí),以統一的標準向用戶(hù)提供無(wú)處不在的信息網(wǎng)絡(luò )服務(wù),已成為網(wǎng)絡(luò )界和電信界共同關(guān)注的一個(gè)焦點(diǎn)問(wèn)題。
現在出現的WAP、GPRS、Mobile IP、Mobile IP Phone等等技術(shù),使移動(dòng)互聯(lián)網(wǎng)帶來(lái)了全新的概念。而應用正是啟動(dòng)移動(dòng)互聯(lián)產(chǎn)業(yè)鏈的引擎,是連接移動(dòng)互聯(lián)與最終用戶(hù)的紐帶。而多種信息終端設備的出現和應用以及多種數據通信技術(shù)的發(fā)展和應用促進(jìn)了移動(dòng)互聯(lián)業(yè)務(wù)的普及與推廣,縮短了移動(dòng)互聯(lián)與最終用戶(hù)之間的距離,在個(gè)人定位、個(gè)人信用、人性化服務(wù)等方面開(kāi)辟了新的發(fā)展空間。
語(yǔ)音應用技術(shù)相比較WAP、GPRS等其它技術(shù),則更有利于移動(dòng)互聯(lián)網(wǎng)的普及和發(fā)展,體現了移動(dòng)互聯(lián)網(wǎng)絡(luò )的特性。語(yǔ)音應用技術(shù)可以介入移動(dòng)互聯(lián)網(wǎng)絡(luò )幾乎所有的信息終端,其基于語(yǔ)音服務(wù)器和語(yǔ)音網(wǎng)關(guān)的體系結構模型使得移動(dòng)新業(yè)務(wù)服務(wù)的開(kāi)發(fā)和發(fā)布輕松而簡(jiǎn)單,將原來(lái)基于Web的服務(wù)帶到了電話(huà)用戶(hù)和移動(dòng)用戶(hù)面前。
三 制定中國語(yǔ)音應用協(xié)議標準的建議
語(yǔ)音應用技術(shù)在中國,有著(zhù)廣闊的前景和市場(chǎng),對中國移動(dòng)互聯(lián)產(chǎn)業(yè)的建設和發(fā)展,促進(jìn)中國社會(huì )信息化,普及信息技術(shù)應用有著(zhù)重要的意義。
我們建議,制定我國有關(guān)于語(yǔ)音應用技術(shù)的標準協(xié)議,以促進(jìn)中國語(yǔ)音應用技術(shù)的發(fā)展,普及中國信息技術(shù)應用,加速移動(dòng)互聯(lián)和網(wǎng)絡(luò )信息服務(wù)的產(chǎn)業(yè)化。做為中國漢語(yǔ)語(yǔ)音應用技術(shù)的先行者和探索者,我們根據中國國情和漢語(yǔ)語(yǔ)音應用的特點(diǎn),參考國際行業(yè)技術(shù)規范和標準,綜合我們在長(cháng)期的探索中的經(jīng)驗,提出語(yǔ)音應用協(xié)議的規范建議。
3.1.定義
語(yǔ)音應用協(xié)議(Voice Application Protocol ),是在互聯(lián)網(wǎng)絡(luò )和通信網(wǎng)絡(luò )(有線(xiàn)電話(huà)網(wǎng)絡(luò )和無(wú)線(xiàn)通信網(wǎng)絡(luò ))基于語(yǔ)音技術(shù)開(kāi)發(fā)應用和服務(wù),以及相關(guān)設備的工業(yè)技術(shù)規范。語(yǔ)音應用協(xié)議(VAP VA)制定了語(yǔ)音應用的架構和網(wǎng)絡(luò )協(xié)議,詳細說(shuō)明語(yǔ)音終端設備(如電話(huà)、手機、內嵌語(yǔ)音瀏覽器的智能設備、PC等)與網(wǎng)絡(luò )的通信協(xié)議和技術(shù)規范。該協(xié)議擴展和協(xié)調了通信網(wǎng)絡(luò )技術(shù)(如移動(dòng)網(wǎng)絡(luò )數字通信標準和Internet技術(shù)(如XML、Web以及多種的信息內容格式等)。該協(xié)議可以幫助移動(dòng)互聯(lián)網(wǎng)絡(luò )的運營(yíng)商、設備廠(chǎng)商、應用開(kāi)發(fā)商等建立基于語(yǔ)音方式的靈活、快捷、高效的服務(wù)。
3.2.動(dòng)機
語(yǔ)音應用協(xié)議(VAP VA)定位于通信網(wǎng)絡(luò )和Internet的聚覺(jué)點(diǎn),制定以語(yǔ)音的方式提供兩者通訊和為龐大的電話(huà)用戶(hù)和飛速發(fā)展的互聯(lián)網(wǎng)絡(luò )用戶(hù)提供快捷、方便、自然的語(yǔ)音應用服務(wù)。
語(yǔ)音應用的特征是以非形象的信息方式-----聲音為信息表征,其終端設備局限于電話(huà)和手機等簡(jiǎn)單輸入設備。可以利用的人機對話(huà)工具只有話(huà)筒、聽(tīng)筒、數字鍵盤(pán),以及手機屏幕。由于人對語(yǔ)音信息較快的反應能力和弱的記憶力,決定了語(yǔ)音應用的信息呈現方式必須簡(jiǎn)短和簡(jiǎn)單。
利用語(yǔ)音應用協(xié)議的相關(guān)技術(shù),可以提供給客戶(hù)方便、輕松、自然的對話(huà)式的用戶(hù)界面,為簡(jiǎn)易終端(電話(huà)、手機)的用戶(hù)提供Internet上的信息和服務(wù),以及語(yǔ)音電子商務(wù)和個(gè)性化電信服務(wù)等等。
使用簡(jiǎn)易的語(yǔ)音終端設備,可以實(shí)現例如以下的語(yǔ)音應用:
3.3.需求
根據語(yǔ)音應用技術(shù)的特性和應用,語(yǔ)音應用協(xié)議(VAP)的需求如下:
為信息服務(wù)和集成提供可編程模型
3.4.體系結構
語(yǔ)音應用協(xié)議的體系結構類(lèi)似于WWW的體系結構和WAP的體系結構,圖一是WWW的體系結構:
而下圖(圖二)是WAP的體系結構模型:
類(lèi)似的,我們可以看到語(yǔ)音應用協(xié)議(VAP)的體系機構模型如下:
語(yǔ)音應用協(xié)議(VAP VA)定義了終端--?網(wǎng)關(guān)--?服務(wù)器的體系結構。語(yǔ)音服務(wù)器(Voice Server )是語(yǔ)音應用的服務(wù)器,其包含語(yǔ)音應用和數據、內容;與WAP體系結構不同的是,語(yǔ)音網(wǎng)關(guān)(Voice Gateway) 做為終端和語(yǔ)音應用服務(wù)器的橋梁,作為語(yǔ)音應用協(xié)議中的重要部分:語(yǔ)音瀏覽器(Voice Browser)建于語(yǔ)音網(wǎng)關(guān)(Voice Gateway)內,而不象WAP協(xié)議中,micro browser 建于終端中。這是因為語(yǔ)音終端過(guò)于簡(jiǎn)單以及語(yǔ)音數據可以通過(guò)電信網(wǎng)絡(luò )輕松與語(yǔ)音網(wǎng)關(guān)(Voice Gateway)交互。
語(yǔ)音應用協(xié)議(VAP)定義了:
3.5.組成部分
語(yǔ)音應用協(xié)議(VAP VA)也有一個(gè)類(lèi)似于TCP/IP和WAP的層次結構,如下圖(圖四)所示:
事務(wù)層,其中包括
語(yǔ)音應用協(xié)議不僅僅為實(shí)現語(yǔ)音應用技術(shù)而設計,它的設計中使語(yǔ)音應用可以操作多種不同的應用,如短消息、WAP等。其在每個(gè)層次上都提供擴展性的已定義好的接口,使其不僅僅限制于語(yǔ)音應用協(xié)議(VAP)所描述和定義的范圍內。
四 語(yǔ)音應用協(xié)議方案的好處
語(yǔ)音應用協(xié)議(VAP)用以實(shí)現互聯(lián)網(wǎng)絡(luò )與有線(xiàn)電話(huà)、移動(dòng)電話(huà)等簡(jiǎn)單終端進(jìn)行交互,將信息應用技術(shù)和服務(wù),以及移動(dòng)互聯(lián)服務(wù)最大限度的帶到用戶(hù)身邊。其關(guān)注于語(yǔ)音應用服務(wù)的開(kāi)發(fā)和實(shí)現,將為為移動(dòng)互聯(lián)和信息服務(wù)帶來(lái)巨大影響。
4.1.提供了良好的用戶(hù)界面模型
作為最為親切友好的人機界面交互方式,語(yǔ)音應用協(xié)議(VAP)為電話(huà)終端以及其它終端提供了遨游信息世界良好的擁護界面。傳統的鍵盤(pán)、鼠標和屏幕為自然對話(huà)的交互方式所代替。語(yǔ)音應用協(xié)議(VAP)不僅僅通過(guò)語(yǔ)音交互協(xié)議、語(yǔ)音標記語(yǔ)言、對話(huà)標記語(yǔ)言和語(yǔ)音瀏覽器規范等定義了“說(shuō)”和“聽(tīng)”的交互界面,而且語(yǔ)音應用協(xié)議(VAP)使用已有的Internet模型作為起點(diǎn),提供了和在傳統PC機的瀏覽器一樣熟悉的Web瀏覽習慣。
同時(shí)通過(guò)數據轉換協(xié)議、語(yǔ)音控制協(xié)議等協(xié)議,提供了兼容WAP的電話(huà)鍵盤(pán)輸入的界面。而可以?xún)惹队谥悄芙K端設備中的語(yǔ)音控制器和微型語(yǔ)音瀏覽器,可以使用戶(hù)不僅以對話(huà)方式獲取信息和服務(wù),而且可以用語(yǔ)音指揮終端設備,做到“聽(tīng)、說(shuō)、看”的全面交互。
4.2.提供了語(yǔ)音技術(shù)與信息技術(shù)的集成規范
語(yǔ)音應用協(xié)議(VAP)中,語(yǔ)音網(wǎng)關(guān)(Voice Gateway)中制定的語(yǔ)音瀏覽器規范,作為應用協(xié)議的語(yǔ)音標記語(yǔ)言的解釋器,語(yǔ)音瀏覽器解析 Voice XML 所描述的應用。而作為語(yǔ)音識別語(yǔ)法描述規范的JSGF規范和VAP語(yǔ)音識別引擎接口規范(基于JSAPI和SAPI)使人機間的交互以一種自然的,對話(huà)式的方式進(jìn)行。語(yǔ)音應用協(xié)議(VAP)的這些規范對于對話(huà)瀏覽和語(yǔ)音識別、合成引擎之間的工作和數據交換等集成電路工作提供了標準。而語(yǔ)音瀏覽器、語(yǔ)音合成、識別引擎、CTI平臺之間的集成開(kāi)發(fā)工作變得輕松而規范。
4.3.提供了安全的連接
語(yǔ)音應用協(xié)議(VAP)對語(yǔ)音認證、語(yǔ)音數字簽名等安全制定了協(xié)議,使語(yǔ)音應用和語(yǔ)音電子商務(wù)的交易和安全更有保障。在基于Web機制的Transport Layer Security (TLS)協(xié)議基礎上,語(yǔ)音引協(xié)議(VAP)增加了在電話(huà)網(wǎng)絡(luò )中基于語(yǔ)音數據的安全機制以及基于個(gè)人聲紋認證的安全驗證。在語(yǔ)音應用協(xié)議(VAP)中,語(yǔ)音網(wǎng)關(guān)(Voice Gateway)自動(dòng)的高度覺(jué)察性的管理數據安全。
4.4.提供了容易簡(jiǎn)單的應用開(kāi)發(fā)機制和工具
利用語(yǔ)音標記語(yǔ)言(Voice XML),用開(kāi)發(fā)HTML頁(yè)面和Web應用的方式就可以簡(jiǎn)單的開(kāi)發(fā)復雜的語(yǔ)音應用。Voice XML 是一種XML文檔語(yǔ)言,其與數據庫、HTML、WML以及其它文檔處理和發(fā)布系統的資料交換幾乎沒(méi)有障礙。而語(yǔ)音應用協(xié)議(VAP)中使用http協(xié)議作為語(yǔ)音網(wǎng)關(guān)(Voice Gateway)與語(yǔ)音服務(wù)器(Voice Server)之間的通訊協(xié)議,所以在Web所能使用的CGI、Perl、ASP等動(dòng)態(tài)數據機制同樣適用于語(yǔ)音應用。而語(yǔ)音應用交換方式基于java 的設計,使Jsp 這樣的動(dòng)態(tài)數據機制可以更容易的應用于語(yǔ)音應用。
五 獲益者
語(yǔ)音應用協(xié)議(VAP)不僅僅使廣大電話(huà)和手機用戶(hù)獲得輕松快捷享受信息服務(wù)和移動(dòng)互聯(lián)服務(wù),而且為整個(gè)社會(huì )和信息產(chǎn)業(yè)帶來(lái)更大的效益。
5.1.服務(wù)提供商的獲益
不僅僅信息服務(wù)的提供商可以為他們現有的信息服務(wù)系統增加語(yǔ)音應用服務(wù)和龐大的用戶(hù)群,而且電信運行商將從語(yǔ)音應用為他們帶來(lái)的增值服務(wù)中獲得巨大收益。語(yǔ)音應用的普及和推廣,必然使語(yǔ)音話(huà)務(wù)通訊的數量大大增加。而個(gè)性化的自然親切的語(yǔ)音應用,將為服務(wù)提供商帶來(lái)巨大的新的服務(wù)內容和語(yǔ)音電子商務(wù)行為。
而依靠Voice XML和對話(huà)標記語(yǔ)言(Dialog-ML),服務(wù)提供商可以用開(kāi)發(fā)Web服務(wù)一樣簡(jiǎn)單的方式開(kāi)發(fā)他們的語(yǔ)音應用,并可以輕松發(fā)布和維護。而語(yǔ)音應用協(xié)議(VAP)帶來(lái)電話(huà)服務(wù)語(yǔ)音應用(例如個(gè)人撥號服務(wù)、電話(huà)會(huì )議、電話(huà)遠程管理等)將為電信服務(wù)商帶來(lái)巨大商機。
5.2.設備廠(chǎng)商的獲益
集成語(yǔ)音應用協(xié)議(VAP)中語(yǔ)音控制器的智能終端,以及內嵌微型語(yǔ)音瀏覽器的信息終端設備,將為設備生產(chǎn)廠(chǎng)商帶來(lái)新的產(chǎn)品和收入。而智能語(yǔ)音家電設備、遠端控制設備等將更為廣大用戶(hù)所關(guān)注。語(yǔ)音應用協(xié)議(VAP)產(chǎn)生了大量新的語(yǔ)音應用的產(chǎn)品,將為設備廠(chǎng)商帶來(lái)廣闊的市場(chǎng)。
5.3.開(kāi)發(fā)商的收益
語(yǔ)音應用的開(kāi)發(fā)商也許將無(wú)法估計他們從語(yǔ)音應用中獲得的收益,以語(yǔ)音應用協(xié)議(VAP)為工業(yè)標準而進(jìn)行開(kāi)發(fā),他們將能輕松的開(kāi)發(fā)各種各樣的豐富的語(yǔ)音應用系統。而作為語(yǔ)音技術(shù)產(chǎn)品的開(kāi)發(fā)商,如語(yǔ)音識別、語(yǔ)音合成引擎的開(kāi)發(fā)商,語(yǔ)音瀏覽器開(kāi)發(fā)商,語(yǔ)音網(wǎng)關(guān)開(kāi)發(fā)商等等,他們將不再需要自己解決語(yǔ)音應用系統中的所有其它他們不關(guān)心的部分,統一的規范使他們可以自由的選擇其它部分配合自己的開(kāi)發(fā)。而語(yǔ)音應用協(xié)議(VAP)也為開(kāi)發(fā)商帶來(lái)了簡(jiǎn)單的開(kāi)發(fā)規范和工具。
六 未來(lái)展望
我們可以預見(jiàn),在不久的將來(lái)電話(huà)作為信息訪(fǎng)問(wèn)的終端將遠遠超過(guò)電腦的數量。語(yǔ)音應用技術(shù)將成為統一信息、統一網(wǎng)絡(luò )的移動(dòng)互聯(lián)中的重要技術(shù)成分。作為高科技的網(wǎng)絡(luò )信息對廣大的中國百姓將不在神秘,中國百姓將隨時(shí)隨地在對電話(huà)機或手機說(shuō)話(huà),享受語(yǔ)音應用技術(shù)為他們帶來(lái)的美好服務(wù)。
基于VoiceXML 的應用系統規范提綱(征求意見(jiàn)稿 2001-11-12 |
語(yǔ)音互聯(lián)再造Internet 2001-10-22 |
語(yǔ)音系統開(kāi)發(fā)的新平臺:VoiceXML瀏覽器 2001-10-19 |
TTS與語(yǔ)音識別軟件 2001-09-21 |
Office XP中文語(yǔ)音功能的開(kāi)發(fā) 2001-09-13 |