CTI技術與現(xiàn)代電信網(wǎng)絡
敖旭光 2001/10/11
一 CTI技術的概念及發(fā)展概述
CTI(Computer Telephony Integration)是在電話網(wǎng)絡進入數(shù)字化時代,計算機技術廣泛應用于通訊領域后逐漸發(fā)展起來的一門綜合技術。從早期數(shù)字通信技術替代模擬通訊技術以來,計算機已經(jīng)不只是簡單作為電信交換和傳輸網(wǎng)絡的控制部分而存在,而是逐漸演變成語音通信的一部分,將智能化的語音延伸到通信網(wǎng)絡的每一個角落。這種計算機電話集成技術的發(fā)展從簡單的語音信箱應用開始,很快發(fā)展起來了智能網(wǎng)業(yè)務、IP電話技術、ATM語音技術、統(tǒng)一消息技術、交互式會話系統(tǒng)等,其中IP電話和交互語音(IVR Interactive Voice Respond)是目前發(fā)展最快和應用前景最為廣泛的兩種技術,并且已經(jīng)逐步滲透到無線通信網(wǎng)絡和多媒體網(wǎng)絡中。
CTI技術應用范圍的不斷擴展,特別是在與電信網(wǎng)絡融合的過程中,協(xié)議標準化問題顯尤為重要。CTI技術標準大部分由ECTF(Enterprise Computer Telephony Forum)定義。
二 CTI關鍵技術以及遵循的協(xié)議和國際標準
CTI在對語音的處理上流行的幾項技術主要包括:語音編碼技術、語音識別技術、語音合成技術等幾方面。
同電話系統(tǒng)相似,語音編碼技術最常用的是脈沖編碼調(diào)制(G.711 64K PCM標準),自適應差分脈沖編碼調(diào)制(G.721 ,G.722 ADPCM標準),和增量調(diào)制(DM)。語音編碼方案一向以追求低碼率、短延時、高質量為目標,目前的G。728標準采用的優(yōu)化后的短延時激勵碼(LD-CELP)速率可達到16K/S,算法延時小于2ms;1995年 ITU推出的G.729標準再度將速率降到8K/S。日本數(shù)字移動通信采用的矢量和線性預測編碼(VSELP)已將語音編碼標準定為6.7K/S。高效的編碼方案將是語音在IP、ATM網(wǎng)上高速傳輸保證。
語音識別技術和語音合成技術是近幾年發(fā)展起來的計算機語言學(Computer Phonetics)的主要研究方向。語音識別早期主要采用的技術包括:線性預測分析技術(LPC),動態(tài)時間規(guī)劃算法(DTW),矢量量化技術(VQ)等。80年代以來對隱馬爾可夫模型(HMM)的研究推動了語音識別的迅速發(fā)展。這類方法的特點是,設計人員根據(jù)人工神經(jīng)網(wǎng)絡技術,設計出一種可訓練的模型,并用大量已經(jīng)存在的數(shù)據(jù)去訓練,得到大量非特定人連續(xù)語音識別模型。
語音合成技術又稱作文語轉換系統(tǒng)(TTS),包括文本分析、韻律建模和語音合成三部分。文本分析目前主要以統(tǒng)計學方法以及人工神經(jīng)網(wǎng)絡技術應用為主,具有代表性的有:二元文法(Di Grammar Method)、三元文法(Tri Grammar Method)等;韻律特征包括的聲學參數(shù)包括頻率、時長、音強、停頓等;語音合成技術中比較著名的有Klatt的共振峰(Formant)合成系統(tǒng),和最近發(fā)展起來的波形拼接(PSOLA) 語音合成技術。
由于CTI技術是伴隨計算機通信發(fā)展起來的,CTI應用初期的關鍵技術就是計算機與電話交換機之間的接口技術,1988年歐洲計算機制造協(xié)會ECMA(Eoupean Computer Manufacture Association)首先提出了計算機與交換機之間的標準協(xié)議:CSTA(Computer Supported Telecommunications Applications),是OSI應用層協(xié)議,其主要對象是基于交換機特別是專網(wǎng)電話交換機的中繼線和排隊機,主要技術包括連接、應答、轉移、會議等呼叫控制服務;話機性能、音量控制等設備服務;消息的收發(fā)、事件管理和計費等內(nèi)容。目前CSTA-III(98)版本仍廣泛應用于PBX等領域。
美國國家標準學會(ANSI)于1989年制定了應用于程控交換機中虛擬交換網(wǎng)(Centrex) 方面的標準:SCAI(Switching Computer Application Interface)實現(xiàn)了計算機和電話交換的集成。
目前隨著計算機硬件技術的迅速發(fā)展,特別是板卡和接口軟件技術的進步,CTI領域最廣泛采用的還是各類應用程序接口(API)技術和相關標準。
1.TAPI技術標準:Microsoft公司提出的,其目標是為了促進開發(fā)電話語音應用和呼叫控制的Windows 電話 API。在TAPI 3.0的白皮書中,允許用Java、C/C++和VB等任何語言寫TAPI的應用程序,實現(xiàn)用Windows應用程序控制通信設備。TAPI是Windows 95和Windows NT的標準組件,支持USB和ActiveX控件,側重與計算機與電話的集成應用。其結構示意如下:
2、TSAPI技術標準:由Novell公司開發(fā)。它將程控交換機或中央電話系統(tǒng)與Netware網(wǎng)絡集成在一起。可以實現(xiàn)呼叫轉移,交互式語音(IVR)和自動呼叫分配(ACD)等功能。支持包括Windows各種版本、OS/2和Unix等目前主要操作系統(tǒng)。不同于TAPI ,TSAPI在計算機和桌面之間建立一個邏輯的連接,通過這些連接在任一端的TSAPI應用就可以完成呼叫控制。由于TSAPI主要為Netware網(wǎng)操作系統(tǒng)增加電話服務,不在每個電話和PC之間建立直接的連接,而是由一個電話服務器Netware可加載模塊(NLM)、一個電話服務器API(TSAPI)、一個電話服務器庫和一個電話客戶庫組組成在服務器電話系統(tǒng)間建立的連接,因此這個連接也稱為PBX-To-Server連接。電話服務器 NLM是負責 PBX和 Netware服務器間傳送信息的。電話服務器 API是為運行于服務器上的應用提供電話服務器API。三方連接在客戶--服務器組網(wǎng)中比單方連接有更大的靈活性。網(wǎng)上的每個用戶都可迅速地通過現(xiàn)有的LAN基礎結構撥入PBX。對其他服務的接入,如主機或終端仿真、傳真、E-mail等,都可以通過CTI接口獲得,只要這些業(yè)務已經(jīng)存在于網(wǎng)上。結構如圖:
TAPI和TSAPI強調(diào)對電話的控制。1995年成立的企業(yè)計算機電話論壇(ECTF)對媒體控制的信號處理系統(tǒng)架構(SCSA)進行研究并發(fā)展成為一種媒體控制API標準-S.100,并于1996年發(fā)布。媒體控制API的主要應用領域是建立基于PC機的媒體處理系統(tǒng)及基于PC機的語音處理系統(tǒng)的開發(fā),稱為媒體和交換服務界面,提供了包括語音信箱、傳真和其他媒體的轉換,是定義CTI應用于交互操作的技術基礎。在此基礎上又推出了不同應用之間進行S.100業(yè)務通信的協(xié)議標準—S.200和對系統(tǒng)資源的控制的協(xié)議標準--S.300。
三 CTI技術在現(xiàn)代電信網(wǎng)上的應用
CTI技術的發(fā)展既依賴于電信網(wǎng)絡又對現(xiàn)代電信網(wǎng)絡提出了更高的要求。由于計算機技術的迅猛發(fā)展,傳統(tǒng)的電信業(yè)務已經(jīng)遠不能滿足人們信息交流的需求,九十年代以來,以數(shù)字交換與傳輸網(wǎng)絡為基礎的,結合計算機技術應用而發(fā)展起來的ISDN業(yè)務、IP語音業(yè)務(VoIP)、交互式語音(IVR)、智能業(yè)務(IN)以及即將出現(xiàn)的INTERNET語音門戶Voice Portal、擴展語音標記語言(Voice XML)技術和統(tǒng)一消息業(yè)務給等將計算機與語音通信技術結合構成一個全新概念的現(xiàn)代電信網(wǎng)絡。
1.IP語音技術(VoIP):IP語音不同于傳統(tǒng)的基于電路交換的語音業(yè)務,而是以分組數(shù)據(jù)報的形式傳遞話音。自從95年以色列VocalTec公司研制出可以通過Internet打長途電話的軟件產(chǎn)品"Internet Phone"以來。IP電話發(fā)展到現(xiàn)在,已經(jīng)融合了分組語音技術、語音編碼和壓縮技術、IVR等技術成份。并且隨著QoS不斷提高,成本不斷降低,現(xiàn)在已經(jīng)開始分流傳統(tǒng)長話業(yè)務。目前IP電話關鍵信令技術由ITU-T H.323 和IETF會話初始化協(xié)議SIP(Session Initation Protocol)兩套標準體系構成,SIP和H.323都是使用RTP作為媒體傳輸協(xié)議。SIP側重于將IP 電話作為Internet上的一個應用,借鑒了其他Internet標準和協(xié)議的設計思想,比如FTP,SMTP等,增加了信令和QoS功能。相比之下H.323協(xié)議采用的是傳統(tǒng)的實現(xiàn)電話信令的模式,定義了4個主要的組件:終端(Terminal )、網(wǎng)關(Gateway)、網(wǎng)守(Gatekeeper)和多點控制單元(MCU)便于與現(xiàn)有的電話網(wǎng)互通。由于H.323發(fā)展得比較成熟。我國目前的IP電話網(wǎng)也普遍采用了這種方式。
2.呼叫中心:是CTI技術應用的一個主要領域,一般的呼叫中心由智能分配中心(Auto Call Distribution簡稱ACD)、CTI服務器、自動語音應答設備(IVR)、自動傳真服務器、外撥服務器以及人工座席等幾部分構成。排隊機通過CTI-Link與CTI服務器相連,根據(jù)話務量、客戶代表的要求或用戶呼叫歷史記錄分配資源。CTI服務器與前置交換機相聯(lián),并屏蔽了交換機與計算機之間復雜的通信協(xié)議,向上提供統(tǒng)一的編程接口,使開發(fā)人員能方便地開發(fā)呼叫中心的各類應用。CTI服務器一般由電話服務單元、安全數(shù)據(jù)庫和電話服務庫等組成,實現(xiàn)同步語音與數(shù)據(jù)的傳送、協(xié)調(diào)語音與數(shù)據(jù)的轉移、智能路由等功能。交互式語音應答系統(tǒng)(IVR)。能識別用戶通過雙音頻話機數(shù)字鍵盤輸入的有關信息,并向用戶播放預先錄制好或通過TTS(Text-To-Speech)生成的語音。 用戶可以通過電話鍵盤與自動語音應答設備進行對話,并選擇自己所需的服務。
3.智能網(wǎng)技術:智能網(wǎng)(IN)是通信網(wǎng)發(fā)展的一個主要方向也是CTI在電信網(wǎng)絡上的另一個重要應用。根據(jù)AT&T公司Bellcore制定的智能網(wǎng)標準(IN-1,IN-2),以及后期的AIN(Advanced Intelligent Network)標準,ITU-T 1993年提出了智能網(wǎng)第一組功能集(CS-1)的建議,即Q.1200系列建議,并于1995對CS-1功能完善經(jīng)歷了CS-2、 CS-3階段。現(xiàn)在智能網(wǎng)對CS-4的研究將包括智能網(wǎng)B-ISDN綜合、智能網(wǎng)支持寬帶移動業(yè)務,及通用個人通信、虛擬專用網(wǎng)、被叫集中付費等業(yè)務;實現(xiàn)虛擬歸屬環(huán)境(VHE)的所有功能;支持IMT-2000;增加了認證管理功能(AMF)或位置管理功能(LMF)。我國于1995年頒布了以ITU-T CS-1智能網(wǎng)標準為基礎的中國智能網(wǎng)標準,近幾年國內(nèi)智能網(wǎng)建設發(fā)展很快。現(xiàn)在我國除流行的七種標準智能業(yè)務(ACC記帳卡、FPH被叫付費、VPN虛擬專網(wǎng)、UPT通用個人通信、WAC廣域Centrex、VOT電話投票、MAS大眾呼叫)外,各地方運營公司根據(jù)本地市場需求又推出了AD廣告、NP流動號碼、TP電話付費業(yè)務等。
4.Internet呼叫中心:也是CTI技術最激動人心的應用之一。Internet呼叫中心是呼叫中心技術與因特網(wǎng)技術相結合,設想一下:當客戶在瀏覽網(wǎng)頁同時,如果希望就某一問題與客戶服務代表進行討論,此時客戶不必呼叫中心的電話號碼,而是通過點擊網(wǎng)頁上的“呼叫”鏈接按鈕,顧客便可和業(yè)務代表進行語音或文字的交流。Internet的呼叫中心提供以下幾種聯(lián)系客戶的方式:電子郵件(E-mail):發(fā)送的電子郵件通過智能路由選擇功能分配到最適合的客服代表進行處理;文字交談(Chat);客戶與客服代表之間無需語音通信而是通過實時的文字形式進行交交流;互聯(lián)網(wǎng)電話(Voice Over IP):客戶可以使用VOIP功能,通過計算機呼叫呼叫中心。客戶的互聯(lián)網(wǎng)電話呼叫經(jīng)過呼叫中心的智能路由選擇后,被轉接到適合的客服代表; 電子商務:盡管電子商務發(fā)展迅速,并已經(jīng)形成一個相對獨立的網(wǎng)絡應用分支。但是電子商務平臺和應用軟件都離不開CTI技術。
四、CTI帶動語音通信技術的發(fā)展
——伴隨技術的進步,下一代電信網(wǎng)絡將是以寬帶IP/ATM、寬帶無線網(wǎng)絡、全光網(wǎng)絡、軟交換的為技術支撐,廣泛結合CTI應用,原有的電信網(wǎng)絡開放化,接口協(xié)議標準化,并實現(xiàn)業(yè)務應用與承載的分離。用戶可以自行配置和定義自己的業(yè)務特征,不必關心承載業(yè)務的網(wǎng)絡形式以及終端類型。多協(xié)議標記交換(MPLS)協(xié)議將成為通信網(wǎng)絡采用的主流技術。而實時話音處理操作系統(tǒng)(VPOS)是下一代CTI系統(tǒng)的核心。
1.統(tǒng)一消息(Unified Messaging):任何人、任何地方、任何時刻、使用任何一種消息設備都能處理任何一種消息是未來信息技術的發(fā)展目標。它不但要求具有實時性、準確性可移動性還要能夠廣泛兼容各種通訊媒體。理論上統(tǒng)一消息將所有的消息類型,如語音、電子郵件、傳真和數(shù)據(jù)等,以不同的形式集中存儲在一個設備中。這樣,用戶可在任何時候采用方便的方式訪問該設備中的任何消息。統(tǒng)一消息服務系統(tǒng)實現(xiàn)的關鍵是解決各種不同的消息表現(xiàn)格式間的兼容問題,實現(xiàn)語音、傳真、電子郵件等不同信息格式間的相互轉換,其主要采用的技術之一是語音合成技術(Text to Speech)。語音合成技術就是把可視的文本信息轉化為可聽的聲音信息。具體到統(tǒng)一消息服務中,就是將電子郵件、傳真等文字信息轉化成可聽的電話語音。
2.多協(xié)議標記交換(MPLS)技術:盡管IP已經(jīng)得到各類平臺廣泛支持,但是由于其面向無連接,QOS不完善, ISP面對各種新興的增值業(yè)務,實施流量工程和計費管理措施還存在一定困難,Cisco提出的基于Tag-Switching技術的MPLS很快就被推崇為下一代Internet寬帶網(wǎng)絡技術的發(fā)展方向。由于采用標記分配信令協(xié)議(LDP)用于實現(xiàn)標簽的分配與轉發(fā),通過TCP層保證信令消息可靠傳輸,采用基于標記化的VPI/VCI及DLCI轉發(fā)機制,因此可以在ATM層上直接承載IP業(yè)務,解決了Internet擴展和QoS傳輸?shù)膯栴},并能夠提供IP無法保證的流量控制業(yè)務,平衡負荷保證某些業(yè)務的必要帶寬。路由、尋址與控制等功能集成使控制過程簡化。
3、軟交換(Softswitch)技術:現(xiàn)在電信網(wǎng)絡核心仍是基于電路交換的現(xiàn)在正逐漸向IP交換技術過度。預計在未來網(wǎng)絡中的語音消息將通過由軟交換機控制的媒體網(wǎng)關和語音網(wǎng)絡之間傳送。軟交換機有時候也稱為呼叫代理(Call Agent)、呼叫服務器或媒體網(wǎng)關控制器,它主要提供連接控制、翻譯和選路、網(wǎng)關管理、呼叫控制、帶寬管理、信令和呼叫計費信息生成等功能。軟交換是一個基于軟件的分布式交換機 ,為下一代網(wǎng)絡(NGN)提供具有實時性要求的呼叫控制和連接控制功能,是下一代網(wǎng)絡呼叫與控制的核心。軟交換的主要功能有:連接各種媒體網(wǎng)關,如PSTN、IP、ATM媒體網(wǎng)關等; 執(zhí)行呼叫控制功能,包括呼叫的建立、保持和釋放;提供多種業(yè)務, 包括PSTN/ISDN、IN、ATM交換等業(yè)務并實現(xiàn)各種網(wǎng)絡信令互通。各種網(wǎng)絡組件,通過使用交換協(xié)議,如媒體網(wǎng)絡控制(Megaco)、媒體網(wǎng)關控制協(xié)議(MGCP)、SCTP/M3UA和會話初始協(xié)議(SIP)相互通信。
4、語音門戶(Voice Portal)與Voice XML語言(eXtensible Markup Language):當人們使用電話設備實現(xiàn)信息交流同時,也希望通過電話語音接入網(wǎng)絡并以交互方式訪問INTERNET得到信息或進行電子交易。交談式語言是人類最易掌握的交流方式,通過語音瀏覽和接入互聯(lián)網(wǎng),促進了語音門戶(Voice Portal)的出現(xiàn)。語音門戶是自動語音識別(ASR)技術、文語轉換(TTS)技術和CTI技術、Web技術、電信技術、計算機及網(wǎng)絡迅速發(fā)展的結果。從早期的交互式語音應答系統(tǒng)IVR到最近出現(xiàn)的Voice XML語言都為語音門戶的發(fā)展提供了有力技術支持,Voice XML 讓Web“聽”懂了人類語言,以AT&T,LUCENT,IBM,MOTOROLA幾家公司聯(lián)合發(fā)起的Voice XML 論壇確立了Voice XML1.0標準,對其語法結構給了詳細定義。
綜觀CTI技術與現(xiàn)代電信網(wǎng)絡的演進,語音從電路交換到分組交換,承載業(yè)務從單一話音到各種媒體,廣泛采用軟交換技術將傳統(tǒng)交換機的功能模塊化、部件化接口協(xié)議標準化使電信網(wǎng)絡逐全面,與計算機技術進一步融合真正實現(xiàn)三網(wǎng)合一,以全光波分復用(DWDM)和無線通信技術為主的傳輸網(wǎng)絡為語音通信業(yè)務發(fā)展成為交互式多媒體通信提供更高的數(shù)據(jù)傳輸速率。而隨著統(tǒng)一消息、語音識別等技術成熟,語音門戶將成為INTERNET的又一重要形式。
本文由作者向CTI論壇提供
作者簡介:敖旭光 1990年畢業(yè)于長春郵電學院,長春電信分公司交換中心副主任,現(xiàn)就讀于北京科技大學計算機碩士專業(yè)。
作者聯(lián)系方法:aoxg@sohu.com
基于GSM模塊的移動購物系統(tǒng)設計 2009-09-28 |
基于VoiceXML的可視化IVR系統(tǒng)設計和實現(xiàn)(一) 2009-09-22 |
IP化下的“響一聲”監(jiān)管 2009-09-16 |
毅航通信:多媒體交換機進入“魔盒”時代 2009-09-15 |
分析三種非接觸式移動支付技術標準 2009-09-09 |