首頁(yè)>>廠(chǎng)商>>CTI系統平臺廠(chǎng)商>>易谷網(wǎng)絡(luò )

基于VoiceXML技術(shù)的可視化IVR系統設計和實(shí)現(一)

上海易谷網(wǎng)絡(luò )科技有限公司 查瑋 2009/09/22

摘要

  為了縮短交互式語(yǔ)音應答(IVR: Interaction Voice Response)系統流程開(kāi)發(fā)周期,克服傳統IVR系統業(yè)務(wù)流程編寫(xiě)復雜的困難,同時(shí)與VoiceXML技術(shù)相結合,本文設計并實(shí)現了基于VoiceXML技術(shù)的可視化IVR系統。

  本文設計的IVR系統,將整個(gè)系統分為流程編輯工具、含有VoiceXML標簽的Web頁(yè)面和執行引擎三個(gè)部分,完成了總體框架及其核心部分的設計與實(shí)現。本文研究了可視化技術(shù)的現狀和理論,并對傳統IVR系統流程編輯工具做了分析與對比,并在此基礎上,從靈活、方便以及友好的用戶(hù)界面的設計原則出發(fā),對IVR系統的流程工具進(jìn)行了詳細的設計與實(shí)現。然后,在分析當前Web技術(shù)發(fā)展的情況下,本文與企業(yè)數據業(yè)務(wù)緊密結合,提出了將業(yè)務(wù)流程類(lèi)比成企業(yè)門(mén)戶(hù)網(wǎng)站的解決方案。該方案結合OpenVXI開(kāi)源項目,使用VoiceXML技術(shù),設計并實(shí)現了IVR系統的執行引擎。

關(guān)鍵詞: 交互式語(yǔ)音應答 可視化系統 VoiceXML

第一章 緒論

  1.1 研究背景

  呼叫中心(Call Center,又稱(chēng)客戶(hù)服務(wù)中心)起源于發(fā)達國家對服務(wù)質(zhì)量的需求,其主旨是通過(guò)電話(huà)、傳真等形式為客戶(hù)提供迅速、準確的咨詢(xún)信息以及業(yè)務(wù)受理和投訴等服務(wù),通過(guò)程控交換機的智能呼叫分配、計算機電話(huà)集成、自動(dòng)應答系統等高效的手段和有經(jīng)驗的人工坐席,最大限度地提高客戶(hù)的滿(mǎn)意度,同時(shí)自然也使企業(yè)與客戶(hù)的關(guān)系更加緊密,是提高企業(yè)競爭力的重要手段[1]。

  IVR(Interaction Voice Response,交互式語(yǔ)音應答)系統是整個(gè)呼叫中心的系統的最前端,它的質(zhì)量直接影響到整個(gè)系統的穩定性。在整個(gè)呼叫中心運行過(guò)程中,IVR系統的業(yè)務(wù)流程也在隨著(zhù)客戶(hù)體驗和業(yè)務(wù)功能需求發(fā)生著(zhù)改變,因此,如何對業(yè)務(wù)流程方便快捷的修改成了IVR系統必不可少的功能顯得尤為重要。相對于傳統的腳本式的編輯方法顯然不能很好的適應這樣的變化,所以可視化的配置方式呼之欲出,應用可視化的業(yè)務(wù)流程編輯界面可以很好與用戶(hù)交互,減輕了用戶(hù)的工作量,同時(shí)達到方便快鍵的目的。

  同時(shí),隨著(zhù)IVR系統的發(fā)展,其與企業(yè)的數據業(yè)務(wù)結合的越來(lái)越緊密。而傳統的IVR系統相對于企業(yè)后臺數據業(yè)務(wù)服務(wù)相對隔離,而且大多數的IVR產(chǎn)品都不能很好的與企業(yè)的業(yè)務(wù)系統對接,或者是使用了比較繁冗復雜的方法,既浪費了資源,又影響了系統的穩定性。VoiceXML技術(shù)的出現,使語(yǔ)音業(yè)務(wù)與數據業(yè)務(wù)得到了統一,節省了資源,用戶(hù)在訪(fǎng)問(wèn)語(yǔ)音業(yè)務(wù)的時(shí)候也可以方便的訪(fǎng)問(wèn)到數據業(yè)務(wù)。

  1.2 國內外研究現狀與應用前景

  1.2.1 可視化技術(shù)的發(fā)展現狀和應用前景

  可視化語(yǔ)言技術(shù)比一維文本語(yǔ)言在描述軟件組成方面具有優(yōu)越性.由于圖表和圖形概念在系統建模中的廣泛使用,可視化語(yǔ)言可以應用于需求分析、設計、測試和維護等軟件開(kāi)發(fā)的各個(gè)階段[2]。

  可視化建模語(yǔ)言簡(jiǎn)稱(chēng)可視化語(yǔ)言,是采用圖形方式對系統/軟件進(jìn)行描述的語(yǔ)言,如目前廣為流行的統一建模語(yǔ)言UML、傳統的數據流語(yǔ)言和工作流建模語(yǔ)言等,它具有直觀(guān)、便于理解的優(yōu)點(diǎn)。可視化建模工具為可視化建模語(yǔ)言的使用提供了工具支持,目前可分為兩大類(lèi):自由編輯型和語(yǔ)法制導型。自由編輯型允許用戶(hù)隨意建模,相當也圖形編輯器,如Microsoft(微軟)公司的Visio;語(yǔ)法制導的可視化建模工具在編輯過(guò)程中自動(dòng)引導用戶(hù)建立語(yǔ)法正確的可視化模型,有利于用戶(hù)對可視化建模語(yǔ)言的掌握和使用,有著(zhù)廣泛的使用范圍。

  對于自由編輯型可視化建模工具,在國際市場(chǎng)上,Microsoft公司的Visio和Rational公司的Rose的產(chǎn)品比較有影響和代表性。

  Visio是當今最優(yōu)秀的辦公繪圖軟件之一,它將強大的功能和簡(jiǎn)單的操作完美地結合在一起。使用Visio,可以繪制業(yè)務(wù)流程圖、組織結構圖、項目管理圖、營(yíng)銷(xiāo)圖表、辦公室布局圖、網(wǎng)絡(luò )圖、電子線(xiàn)路圖、數據庫模型圖、工藝管道圖、因果圖、方向圖等,因而,Visio被廣泛地應用于軟件設計、辦公自動(dòng)化、項目管理、廣告、企業(yè)管理、建筑、電子、機械、通信、科研和日常生活等眾多領(lǐng)域。

  Rational Rose [3]是一個(gè)完全的,具有能滿(mǎn)足所有建模環(huán)境(Web開(kāi)發(fā),數據建模,Visual Studio 和 C++)需求能力和靈活性的一套解決方案。Rose 允許開(kāi)發(fā)人員,項目經(jīng)理,系統工程師和分析人員在軟件開(kāi)發(fā)周期內在將需求和系統的體系架構轉換成代碼,消除浪費的消耗,對需求和系統的體系架構進(jìn)行可視化,理解和精練。通過(guò)在軟件開(kāi)發(fā)周期內使用同一種建模工具可以確保更快更好的創(chuàng )建滿(mǎn)足客戶(hù)需求的可擴展的、靈活的并且可靠的應用系統。

  語(yǔ)法制導型的編輯器自動(dòng)生成技術(shù)的研究成果主要有GENGED[4]、PROGRES[5]、MetaEdit+[6];國內的研究相對較少,從目前所發(fā)表的研究成果看,只有北航軟件工程研究所研制的SGEG 系統[7]。以上研究主要基于自動(dòng)生成器的思想,由于在不同程度上缺乏對語(yǔ)言描述能力、語(yǔ)言解析效率、生成的目標編輯器的靈活性和可擴展性等方面的綜合考慮,所以實(shí)用性較弱。

  1.2.2 VoiceXML技術(shù)的發(fā)展現狀與應用前景

  VoiceXML(語(yǔ)音可擴展標記語(yǔ)言)的出現最早可以追溯到1995在A(yíng)T&T公司開(kāi)發(fā)的基于XML的電話(huà)標記語(yǔ)言(PML)。隨后,AT&T、Lucent Technologies以及Motorola公司分別各自著(zhù)手開(kāi)發(fā)自己的類(lèi)似于PML的語(yǔ)音標記語(yǔ)言。到了1998年,W3C(world wide web consortium)組織的“語(yǔ)音瀏覽器”會(huì )議上,AT&T和Lucent Technologies分別展現了他們各自的類(lèi)同PML的標記語(yǔ)言、Motorola和IBM公司分別推出VoxML[8]和SpeechML[9]、HP和PipeBeach公司也分別推出TalkML[10]和VoiceHTML[11]。AT&T、IBM、Lucent Technoglies、以及Motorola隨后成立了VoiceXML論壇,其目的是為了建立一個(gè)語(yǔ)音對話(huà)應用系統的國際標準。到了2000年,AT&T、IBM、Lucent Technologies、以及Motorola通過(guò)W3C協(xié)會(huì )聯(lián)合推出語(yǔ)音可擴展標記語(yǔ)言VoiceXML1.0。該標準一經(jīng)推出,便得到相關(guān)行業(yè)眾多公司的響應。經(jīng)過(guò)兩年多的論證和實(shí)際系統驗證,VoiceXML2.0最終草案在2003年推出。用VoiceXML開(kāi)發(fā)的語(yǔ)音應用系統,不僅可以完全代替傳統CTI(計算機電話(huà)集成) 系統所能提供的功能,而且還可以使應用系統開(kāi)發(fā)過(guò)程極其簡(jiǎn)單快捷、系統有極高的可擴展性、可維護性、可移植性、可重用性和開(kāi)放性。其定義了如何使用語(yǔ)音識別、語(yǔ)音合成、互聯(lián)網(wǎng)訪(fǎng)問(wèn)、數據庫訪(fǎng)問(wèn)、語(yǔ)音文件播放、DTMF輸入等功能開(kāi)發(fā)一個(gè)完整的語(yǔ)音應用系統。

  1.3 論文研究?jì)热?/b>

  隨著(zhù)現代呼叫中心的發(fā)展,IVR系統的業(yè)務(wù)流程也愈趨復雜,在設計過(guò)程定義工具的時(shí)候簡(jiǎn)化操作的復雜性,提高產(chǎn)品的易用性是首先應當考慮的。所以圖形化的過(guò)程定義工具顯得尤為必要。同時(shí),人們在呼叫中心業(yè)務(wù)中,對于語(yǔ)音和數據業(yè)務(wù)相結合有了強烈的愿望,VoiceXML很好的解決了這個(gè)難題,其技術(shù)也在這幾年有了長(cháng)足的發(fā)展,使得語(yǔ)音和數據業(yè)務(wù)有了一個(gè)良好的耦合。

  為了實(shí)現簡(jiǎn)單、易用能和數據業(yè)務(wù)良好整合的IVR系統,本課題圍繞以下幾項主要工作展開(kāi)研究:

  1.可視化的基本概念的研究。具體的研究?jì)热莅?可視化技術(shù)的定義,可視化建模語(yǔ)言的描述方法,閱讀并分析了大量有關(guān)可視化技術(shù)的資料及學(xué)術(shù)論文,對可視化技術(shù)的概念、特點(diǎn)進(jìn)行詳細的討論和分析;

  2.可視化的過(guò)程定義工具的研究。具體的研究?jì)热莅ǹ梢暬^(guò)程定義工具的體系結構和過(guò)程定義工具的詳細設計和實(shí)現;

  3.VoiceXML技術(shù)的基本概念的研究。具體的研究?jì)热莅ǎ篤oiceXML的概述,VoiceXML的基本體系結構和其在IVR系統中的簡(jiǎn)單應用;

  4.基于VoiceXML的執行引擎的研究。具體的研究?jì)热莅ǎ簣绦幸娴捏w系結構的總體分析以及基于OpenVXI開(kāi)源項目的執行引擎的設計和實(shí)現。

  1.4 本文結構

  本文共分六部分,具體的內容組織如下:

  第一章:緒論。給出課題的研究背景,提出論文的目標、意義和主要研究?jì)热荩?br />
  第二章:相關(guān)技術(shù)研究。第一部分,可視化技術(shù)概述。介紹了可視化技術(shù)的定義和建模語(yǔ)言描述方法等。第二部分,VoiceXML技術(shù)。介紹了VoiceXML技術(shù)的原理和在IVR系統的應用;

  第三章:基于VoiceXML技術(shù)的可視化IVR系統分析和設計。首先分析了IVR系統的具體需求,提出了系統總體架構,分別論述了流程定義工具和執行引擎的詳細設計;

  第四章:基于VoiceXML技術(shù)的可視化IVR系統實(shí)現。重點(diǎn)介紹了過(guò)程定義工具及執行引擎的實(shí)現;

  第五章:IVR系統的應用及測試。給出了本問(wèn)設計的系統的一個(gè)具體應用,并且給出了測試結果;
  
  第六章: 結束語(yǔ)。總結了本文工作所取得的成果,并對下一步工作提出了展望。

第二章 相關(guān)技術(shù)研究

  由于IVR系統在呼叫中心系統中的前置性和必要性地位,同時(shí)IVR系統相關(guān)技術(shù)也引起了很高的關(guān)注。近年來(lái),隨著(zhù)軟件開(kāi)發(fā)技術(shù)的日新月異,IVR系統相關(guān)技術(shù)也在不斷發(fā)展和完善,下面扼要的介紹一下IVR系統相關(guān)的可視化技術(shù)和VoiceXML技術(shù)的研究現狀和進(jìn)展。

  2.1 可視化技術(shù)綜述

  2.1.1 可視化技術(shù)的研究

  可視化建模工具的開(kāi)發(fā),其總體思路是利用模型驅動(dòng)的方法,通過(guò)模型到代碼、模型到語(yǔ)言配置文件的自動(dòng)映射,同時(shí)通過(guò)配置目標編輯器,實(shí)現可視化語(yǔ)言編輯器的自動(dòng)生成。自動(dòng)生成結合配置技術(shù)不僅使可視化語(yǔ)言編輯器的開(kāi)發(fā)效率更高,而且更具靈活性。

  總體框架分為三個(gè)部分(見(jiàn)圖2.1):

  1.模型,主要包括對目標語(yǔ)言(即可視化語(yǔ)言)的描述;

  2.轉化模塊,將模型描述的信息轉化為代碼和語(yǔ)言配置文件;

  3.目標編輯器的配置和自動(dòng)生成,其基本設計思想是將所有可視化語(yǔ)言編輯器都共有的部分和變化的部分分離,由基礎框架實(shí)現共有部分,而變化部分采用自動(dòng)生成和系統配置的方法實(shí)現。

  因此目標編輯器由“可視化語(yǔ)言編輯器框架+語(yǔ)言構件+編輯器配置項”構成。可視化語(yǔ)言編輯器框架是目標編輯器的核心驅動(dòng)部分,不涉及與任何目標可視化語(yǔ)言相關(guān)的代碼;語(yǔ)言構件包含了與目標可視化語(yǔ)言相關(guān)的目標代碼;配置項描述了對可視化語(yǔ)言和編輯器的定制。

圖2.1 可視化建模工具總體框架圖

  根據總體框架,可視化建模工具開(kāi)發(fā)環(huán)境主要包括以下兩個(gè)方面的研究:

  (1)可視化建模語(yǔ)言的描述方法;
  (2)目標編輯器的配置和實(shí)現。

  2.1.2 可視化建模語(yǔ)言描述方法

  可視化建模語(yǔ)言的描述方法是總體框架的基礎。分為三個(gè)部分:

  1.語(yǔ)素—語(yǔ)素是最小的語(yǔ)法單位,可視化語(yǔ)言的語(yǔ)素表現為圖元符號(本文中不再區分語(yǔ)素和圖元)。

  2.語(yǔ)法—語(yǔ)法定義了圖元符號之間的關(guān)系,包括兩個(gè)部分:抽象語(yǔ)法和具體語(yǔ)法。抽象語(yǔ)法定義圖元之間邏輯連接關(guān)系;具體語(yǔ)法定義圖元外觀(guān)的類(lèi)型以及圖元之間幾何位置關(guān)系。

  3.語(yǔ)義—語(yǔ)義表明了圖元符號和連接關(guān)系的含義,是模型的具體含義。

  目前,大多數可視化建模語(yǔ)言描述的研究主要是針對語(yǔ)法描述研究,描述方法主要有基于文法的形式化描述、基于邏輯的形式化描述 、基于代數的形式化描述和基于規則的半形式化描述方法[12]。一般分為兩大部分:基于規則的語(yǔ)法形式化描述和基于元模型技術(shù)的靜態(tài)語(yǔ)義描述。

  (1)基于規則的語(yǔ)法描述方法(RGVL,Rule-based Grammar Visual Language)

  基于規則的可視化建模語(yǔ)言描述方法(RGVL)具有如下優(yōu)點(diǎn):

  1. 規則的解析效率高;

  2. 規則容易理解和書(shū)寫(xiě);

  3. 描述能滿(mǎn)足當前大多數的可視化建模語(yǔ)言需求。


  RGVL采用一組規則來(lái)定義圖元與圖元之間的邏輯關(guān)系,并利用一組規則來(lái)描述圖元的位置關(guān)系等幾何信息。該描述方法形式上可以定義為一個(gè)三元組:
          
              G={p,AG,CG}           式(2-1)

  G 為可視化建模語(yǔ)言的語(yǔ)法,其中,
  p:為一個(gè)有窮的圖元集合。形式表示為:
  P={P/P為可視化建模語(yǔ)言中的基本圖元類(lèi)型} 例如,UML類(lèi)圖中的類(lèi)和關(guān)聯(lián)類(lèi)可以表示為:

             P{Class,Assiciaion}       式(2-2)

  AG:抽象語(yǔ)法規則集合。形式表示為:

         AG={r/r(p1,p2,n)p1€p,p2€p,n為自然數}   式(2-3)

  r 為圖元之間的連接關(guān)系, r 可以為Connection_from 和Connection_to 兩種類(lèi)型的關(guān)系, n表示連接的勢(多重性); *表示無(wú)窮; Connection_from表示從p2 連接到p1 ,p1為當前圖元;Connection_to 表示從p1 連接到p2 , p1為當前圖元。例如,在UML關(guān)聯(lián)關(guān)系的定義中,為了表示關(guān)聯(lián)關(guān)系與類(lèi)之間的抽象語(yǔ)法關(guān)系,可以書(shū)寫(xiě)如下的規則:

        AG={Connection_to(Class,Associalion,*),
        Connection_from(Class,Associalion,1)}     式(2-4)

  表示類(lèi)圖元可以連接多個(gè)關(guān)聯(lián)關(guān)系,每個(gè)關(guān)聯(lián)關(guān)系必須連接到一個(gè)類(lèi)圖元。

  CG:具體語(yǔ)法規則集合。形式表示為:

           CG={(p,render,lsyout)/p€P,render€R.layout€C}  式(2-5)

  R是圖元外觀(guān)類(lèi)型的集合,L是圖元位置關(guān)系的集合。例如,

           CG={Class.MutiTextViz,AtLocation Layout} 式(2-6)

  公式(2-6)表示類(lèi)圖元具有帶有多個(gè)文本框的外觀(guān)類(lèi)型和指定位置放置圖元的位置關(guān)系定義時(shí),為了增強可擴展行,定義了用戶(hù)自定義類(lèi)型(在實(shí)現時(shí),定義了相關(guān)的編程接口使得用戶(hù)可以自定義外觀(guān)和圖元位置關(guān)系)。

  (2)基于元模型的靜態(tài)語(yǔ)義描述方法(MSS)

  將傳統的語(yǔ)義分為兩個(gè)部分:靜態(tài)語(yǔ)義和動(dòng)態(tài)語(yǔ)義。靜態(tài)語(yǔ)義表示圖元符號的屬性信息,是可視化建模語(yǔ)言中一個(gè)重要組成部分。通過(guò)擴展元模型MOF(Meta Object Facility)技術(shù)對靜態(tài)語(yǔ)義進(jìn)行定義。MOF是對象管理組織定義的一個(gè)用于在平臺無(wú)關(guān)方式下,定義、使用和集成元數據以及數據的模型驅動(dòng)框架[13]。

  利用MOF元模型對可視化建模語(yǔ)言的靜態(tài)語(yǔ)義進(jìn)行描述時(shí),MOF的表達能力還不足以滿(mǎn)足完整地描述可視化建模語(yǔ)言的語(yǔ)素(圖元)的靜態(tài)關(guān)系和操作關(guān)系,擴展了MOF中的關(guān)聯(lián)關(guān)系,在關(guān)聯(lián)中增加標簽值來(lái)專(zhuān)門(mén)說(shuō)明該關(guān)聯(lián)與其它關(guān)聯(lián)之間的關(guān)系,提出了基于MOF的靜態(tài)語(yǔ)義描述方法稱(chēng)為MSS(MOF-based Static Sematic)。該方法可以定義為一個(gè)三元組:

               MSS={m,Rs,Rop}         式(2-7)

  MSS為可視化建模語(yǔ)言的靜態(tài)語(yǔ)義,其中,M:為擴展的MOF的靜態(tài)語(yǔ)義模型。可表示為

               M=CssURss           式(2-8)

  Css表示元類(lèi)的集合, Rss表示元類(lèi)之間的關(guān)系集合。在Rss 中使用的是擴展后的關(guān)聯(lián)關(guān)系,可以定義關(guān)聯(lián)之間的關(guān)系。

  Rs:為圖元與靜態(tài)語(yǔ)義模型中元類(lèi)的靜態(tài)關(guān)系。可表示為

               Rs={(p,c)/p€P,C€Css}      式(2-9)

  公式(2-9)中 p為語(yǔ)素集合, Css為元類(lèi)集合。

  對于目標編輯器的配置和實(shí)現,主要是對可視化建模語(yǔ)言研究和分析后,根據實(shí)現的需要,同時(shí)考慮了解析能力和描述能力,定義了一套支持語(yǔ)義定義的可視化建模語(yǔ)言描述方法。

  2.2 基于VoiceXML的交互式語(yǔ)音應答

  2.2.1 VoiceXML概述

  VoiceXML是W3C用來(lái)制定通過(guò)對話(huà)訪(fǎng)問(wèn)Web的內容及其交互語(yǔ)音應答的傳遞標準。VoiceXML使公共電話(huà)網(wǎng)、語(yǔ)音處理技術(shù)以及互聯(lián)網(wǎng)有機地結合為一體。它是一種域專(zhuān)用語(yǔ)言,定義了一系列的語(yǔ)音應用概念、元素及其對應的操作,能根據播放的音頻文件、輸出的文本語(yǔ)音、要錄制和識別的語(yǔ)音以及所接收的按鍵音,連定義人和計算機之間的語(yǔ)音交互過(guò)程。

  VoiceXML希望通過(guò)交互式語(yǔ)音界面應用Web上已經(jīng)存在的大量信息,同時(shí)希望能夠將開(kāi)發(fā)人員從最低級的編程和資源處理工作中解放出來(lái)。VoiceXML還能夠利用人們已經(jīng)非常熟悉的C/S,將語(yǔ)音服務(wù)和數據服務(wù)融合起來(lái)[14][15]。

  2.2.2 VoiceXML基本體系結構

  VoiceXML系統的基本結構如圖2.2所示[16]。其中,文檔服務(wù)器充當的是Web服務(wù)器的角色,他負責處理執行平臺發(fā)送的請求文檔,并與后臺數據庫進(jìn)行交互,組織VoiceXML文檔對該請求進(jìn)行響應。
VoiceXML解析器上下文和VoiceXML解釋器負責解析VoiceXML文件,控制執行平臺。執行平臺提供合成語(yǔ)音的輸出(text to speech,TTS)、音頻文件的輸出、話(huà)音輸入的識別(automated speech recognition,ASR)、DTMF輸入識別、語(yǔ)音輸入的錄音、電話(huà)功能等[17]。

圖2.2 VoiceXML的基本體系結構圖

  VoiceXML語(yǔ)言規范的層次結構如圖2.3[18]所示,層次從底向上依次升高。

圖2.3 VoiceXML層次結構

  (1)Session。用戶(hù)開(kāi)始和VoiceXML解析器進(jìn)行交互式標志一次會(huì )話(huà)(Session)開(kāi)始,繼續完成文檔獲取和處理,當用戶(hù)、文檔或者解釋器要求退出時(shí),這次Session結束。

  (2)Application。一個(gè)應用(Application)是指一系列文檔共享一個(gè)相同的應用文檔。當用戶(hù)和一個(gè)應用中的文檔交互時(shí),它的應用根文檔同時(shí)被加載;當文檔跳轉到的另一個(gè)文檔也存在于同一個(gè)應用中,這時(shí)根文檔不被釋放當根文檔被加載后它的變量可以被其他子文檔使用。

  (3)Dialog和SubDialog。每個(gè)VoiceXML 文檔都是一個(gè)交談的有限狀態(tài)自動(dòng)機用戶(hù)某時(shí)只能在一個(gè)會(huì )話(huà)狀態(tài)Dialog ,它決定了下一個(gè)要執行的Dialog 執行時(shí)就是在Dialog 之間跳轉。

  Dialog 分為兩種Form 和Menu。Form定義了一系列Field項目用于交互,每一個(gè)Field 可以使用Grammar 語(yǔ)法指定允許輸入的內容。Menu 提供給用戶(hù)選擇然后根據用戶(hù)的選擇跳轉到指定的Dialog 中。

  SubDialog 類(lèi)似于函數調用,它提供一種機制允許激活一個(gè)新的交互,等交互完成后返回到原先的交互中去。使用SubDialog 可以實(shí)現一個(gè)特定模塊以便重復使用。

  (4) Grammar。每個(gè)Dialog 都有至少一個(gè)語(yǔ)法(Grammar)。語(yǔ)法包括兩種:DTMF語(yǔ)法和語(yǔ)音語(yǔ)法。在機器導引方式中,只有當用戶(hù)處于這個(gè)Dialog 中,該Dialog 的Grammar 才是有效的;在混合方式中,有些Dialog可以標記為即使當前用戶(hù)不處于該Dialog 中,這個(gè)語(yǔ)法也是有效的。

  (5)Event。VoiceXML提供了一種Form-Filling機制來(lái)處理通常的輸入,另外還需要處理一些事件。在有些情況下平臺會(huì )拋出一些事件,例如用戶(hù)無(wú)響應、超時(shí)或沒(méi)有正確響應、請求幫助等。如果解釋器發(fā)現語(yǔ)義錯誤,也會(huì )拋出事件。事件由Catch 元素來(lái)捕獲并作相應的處理。

  2.2.3 在IVR系統中運用VoiceXML技術(shù)

  VoiceXML的推出給電話(huà)語(yǔ)音系統帶來(lái)全新的應用和開(kāi)發(fā)概念,使傳統的CTI技術(shù)從繁瑣、封閉的模式中走了出來(lái),使廣大的語(yǔ)音系統開(kāi)發(fā)人員可以用極其簡(jiǎn)單的方法實(shí)現復雜系統的開(kāi)發(fā)。同時(shí)VoiceXML技術(shù)突破地實(shí)現了互聯(lián)網(wǎng)與電話(huà)網(wǎng)的融合,在以語(yǔ)音為核心的電話(huà)網(wǎng)絡(luò )與以數據為核心的互聯(lián)網(wǎng)絡(luò )之間建立了良好的溝通“橋梁”。

  到目前為止,人們從Internet獲取各種資源時(shí),還只能是借助計算機來(lái)實(shí)現。而實(shí)際上,電話(huà)具有比計算機更高的普及率,如果允許人們通過(guò)電話(huà)來(lái)訪(fǎng)問(wèn)Internet的資源,那么這對于Internet的應用發(fā)展必將是一次質(zhì)的飛躍。在這類(lèi)應用前景的驅動(dòng)下,VoiceXML 1.0標準被提出來(lái)了,目前最新版本為2.1[19]。

  VoiceXML使得用戶(hù)可以通過(guò)電話(huà)按鍵或語(yǔ)音來(lái)訪(fǎng)問(wèn)Internet上的各種資源,它是語(yǔ)音瀏覽技術(shù)以及語(yǔ)音互聯(lián)網(wǎng)的核心。 VoiceXML為語(yǔ)音應用領(lǐng)域展現了一個(gè)廣闊的未來(lái),用VoiceXML開(kāi)發(fā)的語(yǔ)音應用系統,不僅可以完全代替傳統CTI(計算機電話(huà)集成) 系統所能提供的功能,而且還可以使應用系統開(kāi)發(fā)過(guò)程極其簡(jiǎn)單快捷、系統有極高的可擴展性、可維護性、可移植性、可重用性和開(kāi)放性,在語(yǔ)音門(mén)戶(hù)、語(yǔ)音呼叫中心(Call Center) 、語(yǔ)音信息服務(wù)、語(yǔ)音電子商務(wù)等領(lǐng)域有著(zhù)廣泛的應用。

  下面給出兩個(gè)簡(jiǎn)單的例子說(shuō)明VoiceXML在IVR系統的應用:

  第一個(gè)是“Hello world”:


  所有VoiceXML命令都封裝在……之間。VoiceXML對話(huà)框用戶(hù)描述腳本對用戶(hù)輸出的各種提示、定義和收集用戶(hù)的響應,并且描述程序控制的流程。對話(huà)框分兩種,分別是窗體(forms)和菜單(menus)。窗體輸出信息并且收集輸入,菜單提供下一步做什么選擇。這個(gè)例子有一個(gè)單一的窗體,它包括一個(gè)快(block),該塊合成并輸出“Hello World!”。由于這個(gè)窗體沒(méi)有后繼的對話(huà)框,所以輸出完“Hello World!”后,腳本結束。

  第二個(gè)例子要求用戶(hù)選擇一種飲料,并把用戶(hù)的選擇提交到服務(wù)器:


  域(field)用于輸入。用戶(hù)在處理窗體中下一個(gè)元素之前,必須為一個(gè)域提供相應的信息。以上腳本的一個(gè)交互例子如下:

C(computer):Would you like coffee, tea , milk, or nothing?
H(human) :Orange juice。
C:I did not understand what you said.
C:Would you like coffee, tea , milk, or nothing?
H:Tea
C:(continues in document drink2.jsp)

  通過(guò)這兩個(gè)例子可以看到,VoiceXML使用非常簡(jiǎn)單。哪怕只是看幾個(gè)例子,就可以掌握一些基本的使用方法;而且它的特點(diǎn)正好符合用戶(hù)通過(guò)語(yǔ)音交互的業(yè)務(wù)特性,對聲訊業(yè)務(wù)支持近乎完美。

  VoiceXML 2.0中共預定義了43個(gè)元素,按照功能可以分為文檔對話(huà)有關(guān)、資源功能類(lèi)、事件處理類(lèi)。文檔對話(huà)相關(guān)的元素主要實(shí)現信息表達、數據采集、變量賦值、條件控制、函數調用等功能;時(shí)間處理類(lèi)元素主要實(shí)現產(chǎn)生、捕獲時(shí)間的功能,可進(jìn)行錯誤處理、超時(shí)處理、幫助處理等;資源功能類(lèi)元素主要實(shí)現錄、放音,TTS,ASR等與語(yǔ)音資源控制相關(guān)的功能,是對語(yǔ)音資源能提供功能的描述。

  2.3 本章小結

  本章首先闡述了可視化建模語(yǔ)言的總體框架,論述了可視化建模語(yǔ)言的描述方法。其次,介紹了VoiceXML技術(shù)的概念和基本體系結構,隨后描述了在IVR系統中VoiceXML技術(shù)的簡(jiǎn)單應用。本章的內容將為基于VoiceXML的IVR系統圖形化開(kāi)發(fā)環(huán)境與執行引擎設計和實(shí)現提供理論基礎。

基于VoiceXML技術(shù)可視化IVR設計和實(shí)現(二)

基于VoiceXML技術(shù)可視化IVR設計和實(shí)現(三)

基于VoiceXML技術(shù)可視化IVR設計和實(shí)現(四)

作者獨家提供CTI論壇稿件,其它媒體謝絕轉載


CTI論壇編輯



相關(guān)鏈接:
上海易谷與Genesys達成大中華區長(cháng)期合作伙伴關(guān)系 2009-04-17
聯(lián)絡(luò )中心與3G應用 2009-04-09
亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 萝北县| 麦盖提县| 环江| 泰和县| 武陟县| 文成县| 河北省| 石棉县| 淮阳县| 清原| 珲春市| 潼关县| 潼南县| 安泽县| 抚州市| 孟津县| 驻马店市| 浠水县| 广丰县| 集安市| 白山市| 涿州市| 霸州市| 湾仔区| 泽普县| 吴堡县| 保靖县| 赣榆县| 汾西县| 江口县| 张家港市| 迁安市| 双牌县| 襄汾县| 沾益县| 开封市| 油尖旺区| 潜江市| 潞西市| 阳泉市| 万安县| http://444 http://444 http://444 http://444 http://444 http://444