重慶巨佳科技語(yǔ)音網(wǎng)關(guān)(VoiceGateway)
2005/08/25
VoiceGateway是TTS與ASR的集成產(chǎn)品,完成TTS、ASR的集成與功能擴展,系統的TTS核心可以支持多個(gè)廠(chǎng)家的產(chǎn)品,包括清華、科大、IBM、捷通等廠(chǎng)商的產(chǎn)品。ASR可以采用InfoTalk、Nuance、IBM的產(chǎn)品。VoiceGateway最主要的功能是完成TTS與ASR的集成,將底層變化封裝,不管采用那一家的的TTS與ASR產(chǎn)品,都與IVR服務(wù)器(VoxServer)無(wú)關(guān)。其次,VoiceGateway可以多機運行,支持負載均衡控制,可以把TTS,ASR的處理能力提高到成百上千線(xiàn)。各種不同的TTS產(chǎn)生的Voice編碼文件還可能由VoiceGateway統一處理、重要編碼,然后送到IVR服務(wù)器。
語(yǔ)音合成網(wǎng)關(guān)
語(yǔ)音合成網(wǎng)關(guān)是新一代的語(yǔ)音處理中間系統。其核心技術(shù)TTS(Text to Speech)系統采用了國內外最新的第二代文語(yǔ)轉換技術(shù),支持多語(yǔ)言的語(yǔ)音合成,音速、音質(zhì)及韻律均可靈活調整,合成質(zhì)量貼近自然話(huà)務(wù)播音員。
系統接收其他系統模塊(如IVR系統)的文字信息,通過(guò)TTS合成對應的語(yǔ)音文件,然后傳送到相應的系統模塊。
系統可以與其他網(wǎng)關(guān)進(jìn)行接口,成為系統中的中間件模塊。
系統支持內建排隊功能,支持多模塊調用。
系統采用中心控制管理,可以擴展到多臺主機運行,支持負載平衡技術(shù)。
語(yǔ)音合成網(wǎng)關(guān)將TTS包裝成一個(gè)開(kāi)放的系統功能模塊,用戶(hù)不需要了解TTS的具體技術(shù)細節,通過(guò)語(yǔ)音網(wǎng)關(guān)提供的開(kāi)發(fā)工具就可以在自己的程序里實(shí)現TTS的功能。語(yǔ)音網(wǎng)關(guān)支持多種平臺,底層通信建立在TCP/IP協(xié)議上,可以運行在復雜的網(wǎng)絡(luò )環(huán)境中。
可擴展性:語(yǔ)音合成網(wǎng)關(guān)可以運行在任意一臺主機上,單主機支持32個(gè)并發(fā)請求,通過(guò)系統的負載平衡控制,可以在網(wǎng)絡(luò )中加入任意數量的語(yǔ)音網(wǎng)關(guān)系統,通過(guò)主系統中的中央調度模塊,可以根據當前各網(wǎng)關(guān)的工作量,把數據處理分配到最佳的語(yǔ)音網(wǎng)關(guān)中處理。通過(guò)這種系統模式,理論上可以支持任意數量的系統擴展,甚至可以將語(yǔ)音網(wǎng)關(guān)擴展到Internet的任意地方。
移植性:語(yǔ)音合成網(wǎng)關(guān)可以運行在多種系統環(huán)境,包括Windows NT/2000、Linux、SCO OpenServer、及Solaris,可以根據用戶(hù)需求選用。
實(shí)用性:實(shí)際開(kāi)發(fā)過(guò)程中,可以采用語(yǔ)音網(wǎng)關(guān)的軟件開(kāi)發(fā)包(SDK),也可以采用TCP/IP數據包方式調用系統功能。
高可靠性:
采用多種容錯機制,具有自動(dòng)恢復功能。
結構說(shuō)明:
在系統應用中,語(yǔ)音網(wǎng)關(guān)與其他應用程序處在一個(gè)網(wǎng)絡(luò )中。
其他應用程序可以是IVR(交互式語(yǔ)音應答系統)、Email網(wǎng)關(guān),以及其他的各種應用程序。只要采用語(yǔ)音網(wǎng)關(guān)的SDK(應用程序開(kāi)發(fā)包)或者符合語(yǔ)音網(wǎng)關(guān)底層的SOCKET通信協(xié)議,都可以向網(wǎng)關(guān)發(fā)送中英文語(yǔ)音合成請求。
對于任意一個(gè)應用程序,當需要語(yǔ)音合成時(shí),只要把文字信息發(fā)送到語(yǔ)音網(wǎng)關(guān),語(yǔ)音網(wǎng)關(guān)就可以將合成后的語(yǔ)音信息發(fā)送回相應的應用程序。在負載平衡的系統中,有時(shí)主語(yǔ)音網(wǎng)關(guān)需要將合成的數據發(fā)送到其他網(wǎng)關(guān)進(jìn)行處理,但對于應用程序而言,不需要知道其中的處理細節,主語(yǔ)音網(wǎng)關(guān)會(huì )進(jìn)行相應的控制,當從語(yǔ)音網(wǎng)關(guān)把數據處理完成后,會(huì )直接把合成的語(yǔ)音數據發(fā)送回相應的應用程序。
語(yǔ)音識別網(wǎng)關(guān)
語(yǔ)音識別正逐步成為信息技術(shù)中人機接口的關(guān)鍵技術(shù),語(yǔ)音識別技術(shù)與語(yǔ)音合成技術(shù)結合使人們能夠甩掉鍵盤(pán),通過(guò)語(yǔ)音命令進(jìn)行操作。語(yǔ)音技術(shù)的應用已經(jīng)成為一個(gè)具有競爭性的新興高技術(shù)產(chǎn)業(yè)。
識別網(wǎng)關(guān)系統集成了中科院自動(dòng)化所的語(yǔ)音識別引擎,支持非特定人語(yǔ)音,采用有限詞匯模式,識別率高達98%以上,達到國內外領(lǐng)先的技術(shù)水平。
ASR支持自己定義的語(yǔ)法規則,語(yǔ)音識別所需要用到的語(yǔ)法規則,遵循ABNF范式(Augmented BNF),兼容W3C語(yǔ)法定義。
語(yǔ)音識別網(wǎng)關(guān)系統把ASR進(jìn)行封裝處理,以網(wǎng)關(guān)中間件的方式把功能開(kāi)放給其他服務(wù)系統。封裝后的網(wǎng)關(guān)系統簡(jiǎn)化了ASR系統的應用,并對CTI系統做了大量工作,如語(yǔ)音編碼處理,語(yǔ)音分析處理。
語(yǔ)音識別網(wǎng)關(guān)采用合成網(wǎng)關(guān)相同的結構,所有在很多特性上與合成網(wǎng)關(guān)相似:
系統支持內建排隊功能,支持多模塊調用。
系統采用中心控制管理,可以擴展到多臺主機運行,支持負載平衡技術(shù)。
系統支持多種平臺,底層通信建立在TCP/IP協(xié)議上,可以運行在復雜的網(wǎng)絡(luò )環(huán)境中。
可擴展性:語(yǔ)音合成網(wǎng)關(guān)可以運行在任意一臺主機上,單主機支持32個(gè)并發(fā)請求,通過(guò)系統的負載平衡控制,可以在網(wǎng)絡(luò )中加入任意數量的語(yǔ)音網(wǎng)關(guān)系統,通過(guò)主系統中的中央調度模塊,可以根據當前各網(wǎng)關(guān)的工作量,把數據處理分配到最佳的語(yǔ)音網(wǎng)關(guān)中處理。通過(guò)這種系統模式,理論上可以支持任意數量的系統擴展,甚至可以將語(yǔ)音網(wǎng)關(guān)擴展到Internet的任意地方。
移植性:語(yǔ)音合成網(wǎng)關(guān)可以運行在多種系統環(huán)境,包括Windows NT/2000、Linux、SCO OpenServer、及Solaris,可以根據用戶(hù)需求選用。
實(shí)用性:實(shí)際開(kāi)發(fā)過(guò)程中,可以采用語(yǔ)音網(wǎng)關(guān)的軟件開(kāi)發(fā)包(SDK),也可以采用TCP/IP數據包方式調用系統功能。
高可靠性:采用多種容錯機制,具有自動(dòng)恢復功能。
重慶巨佳公司供稿 CTI論壇編輯
相關(guān)鏈接:
亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩
巴马|
武川县|
益阳市|
汾阳市|
柞水县|
樟树市|
日喀则市|
大丰市|
桂平市|
运城市|
盐山县|
如皋市|
齐河县|
枝江市|
公安县|
科技|
邢台县|
大宁县|
酉阳|
溆浦县|
寿光市|
凌海市|
盐池县|
嵩明县|
张家界市|
兰西县|
玛曲县|
内黄县|
河东区|
湖南省|
佛学|
东阳市|
雷波县|
巴林左旗|
平武县|
阳高县|
峡江县|
巫山县|
靖西县|
汨罗市|
启东市|
http://444
http://444
http://444
http://444
http://444
http://444