新太TTS/ASR系統介紹
人類(lèi) 花了近30年的時(shí)間才使語(yǔ)音識別技術(shù)得以實(shí)用化,人們可以與計算機自由地交談和溝通,實(shí)現"動(dòng)口不動(dòng)手"的美好愿望。尤其是近年來(lái) Internet 的高速發(fā)展,讓語(yǔ)音識別技術(shù)有了更廣闊的應用前景和實(shí)用意義。
網(wǎng)絡(luò )時(shí)代,電話(huà)訪(fǎng)問(wèn)WEB站 點(diǎn)和E-MAIL信息是一 個(gè)面向大眾提供企(事)業(yè)單位基本信息的大型資料庫,其內容十分豐富,用戶(hù)可以通過(guò)多種方式查詢(xún)到感興趣單位的信息,是企業(yè)面向市場(chǎng)、面向大眾提供優(yōu)質(zhì)服務(wù)的增值服務(wù)。
傳統的電話(huà)查詢(xún)WEB信息和E -MAIL信息只能通過(guò)168臺進(jìn)行,所以對大部分企業(yè)用戶(hù)來(lái)講,文本資料要首先錄制成語(yǔ)音 文件,然后才能提供服務(wù),效率低 、存儲空間大,維護十分復雜,擴充困難。特別是對于一些如天氣查詢(xún)、股票行情的查詢(xún)等,對用戶(hù)來(lái)說(shuō),每查詢(xún)一個(gè)信息都要根據語(yǔ)音提示進(jìn)行大量的按鍵操作,而且容易出錯。
而新太集團作為一個(gè)在信息 行業(yè)研究多年的服務(wù)提供 商,一直跟蹤市場(chǎng)、關(guān)注用戶(hù)最新需求,并敏銳地洞察到了這種信息交互的低效性后,隨組織人力進(jìn)行跟蹤開(kāi)發(fā)。于今年初推出了新太又一成熟的新產(chǎn)品TTS/ASR(文語(yǔ)轉換 TEXT TO SPEECH /自動(dòng)語(yǔ)音識別 AUTOMATIC SPEECH RECOGNITION )系統。
文語(yǔ) 轉化系統提供了實(shí)時(shí)語(yǔ)音文本互相轉化的功能。通過(guò)TTS不僅節省了語(yǔ)音文件的空間1000 多 倍,而且解決了一些無(wú)法進(jìn)行實(shí)時(shí)錄音的功能,減輕了工作量,提高了實(shí)時(shí)性(信息的時(shí)效性)。通過(guò)ASR使用戶(hù)不需進(jìn)行煩瑣的按鍵操作就可快捷的查找到自己感興趣的信息。
一、系統總體設計
TTS是一 個(gè)專(zhuān)業(yè)級的中文文語(yǔ)轉換系統 ,所處理的資料以中文文本文件的資料為主。新太TTS是新太根據中國人自己的語(yǔ)音特色和規律開(kāi)發(fā)出來(lái)的,其發(fā)音語(yǔ)調的準確率和多音字及詞組的處理已經(jīng)達到商業(yè)化的級別。
ASR 語(yǔ)音識別是一個(gè)較新興的技術(shù),具有極大的發(fā)展潛力和應用市場(chǎng)。目前新太科技利用Philips最先進(jìn)的自然語(yǔ)音識別平臺Speech Pearl 開(kāi)發(fā)出一 套適合電信業(yè)務(wù)和一般企業(yè)具有完整語(yǔ)音識別功能的系統。目前已出的版本提供英語(yǔ),普通話(huà)的識別,可根據用戶(hù)具體需求,在以后的版本中還可提供粵語(yǔ)及其它地方方言的識別。
新太科技將這套系統集成到 新太的NAP2000,IVSP聲訊平臺中, 以拓展信息交互的應用領(lǐng)域。應用領(lǐng)域包括:160/168聲訊服務(wù)系統、客戶(hù)服務(wù)中心系統、航班時(shí)刻信息查詢(xún)及股票查詢(xún)系統、無(wú)線(xiàn)尋呼、號碼查詢(xún)系統、天氣預報系統等。
1、 系統結構
TTS服務(wù)器
TTS網(wǎng) 關(guān)建立在新太NAP2000、IVSP、聲訊平臺上,是由數據庫查詢(xún)、數據組織、文語(yǔ)轉化、語(yǔ) 音文件生成等服務(wù) 構成的原型系統。運行系統包括上述4個(gè)組成部分。在實(shí)際工作中,可以在一臺NT上運行。一臺NT可以同時(shí)服務(wù)16個(gè)用戶(hù)的文語(yǔ)轉化,以一個(gè)聲訊系統同時(shí)20%的通道使用 TTS的功能,則可以服務(wù)3個(gè)E1(90線(xiàn))規模的系統。
其功能包括:
ASR服務(wù)器
目前新太集團利用Philips最先進(jìn)的自然語(yǔ)音識別平臺SpeechPearl 開(kāi)發(fā)出一套適合 電信業(yè)務(wù)和一般企業(yè)具有完整語(yǔ)音識別功能的系統。新太集團將這套系統集成到新太的NA P2000,IVSP聲訊平臺中,以拓 展語(yǔ)音識別技術(shù)的應用領(lǐng)域。應用領(lǐng)域包括:160,168聲訊服務(wù)系統、客戶(hù)服務(wù)中心系統、航班時(shí)刻信息查詢(xún)及股票查詢(xún)系統、無(wú)線(xiàn)尋呼、號碼查詢(xún)系統、天氣預報系統等。
平臺IVR節點(diǎn)將用戶(hù)的語(yǔ)音 錄下來(lái),將其保存在網(wǎng)絡(luò )文件系統中的一個(gè)文件中,并將該文件的絕對路徑傳給ASR網(wǎng)關(guān) ,ASR網(wǎng)關(guān)根據其配置文件,找到其網(wǎng)關(guān)對應的網(wǎng)絡(luò )路徑,然后將該文件的 語(yǔ)音數據傳給ASR網(wǎng)關(guān)的后臺引擎,后臺引擎根據給定的語(yǔ)法規定將語(yǔ)音識別出來(lái),識別結果返回給ASR網(wǎng)關(guān)存儲在網(wǎng)絡(luò )文件中,同時(shí)將識別結果的相關(guān)信息傳給IVR節點(diǎn)。
網(wǎng)關(guān)服務(wù)器
網(wǎng)關(guān) 服務(wù)器實(shí)現與其他異構網(wǎng)絡(luò )、專(zhuān)業(yè)數據庫連 接時(shí)數據的傳輸及通信。網(wǎng)關(guān)服務(wù)器可視業(yè)務(wù)及系統、數據庫的不同而采用不同的數據通訊協(xié)議轉換模塊。各網(wǎng)關(guān)通過(guò)在網(wǎng)關(guān)服務(wù)器內注冊就可接入系統,通過(guò)網(wǎng)關(guān)服務(wù)器可方便地 實(shí)現與第三方數據源如氣象局、民航、銀行、證券等的數據交互。
2、新太TTS/ASR系統工作流程
根據用戶(hù)的具體要求目前有兩種實(shí)現流程:
適于文件比較長(cháng)且文語(yǔ)較復雜的語(yǔ)音合成。
用戶(hù)打電話(huà)進(jìn)入系統,IVR 節點(diǎn)將用戶(hù)的語(yǔ)音信息錄制成語(yǔ)音文件存儲在網(wǎng)絡(luò )文件系統的一個(gè)文件中,并將該文件的 絕對路徑傳給ASR網(wǎng)關(guān),ASR網(wǎng)關(guān)根據其配置文件,找到其網(wǎng)關(guān)對應的網(wǎng)絡(luò )路徑,然后將該 文件的語(yǔ)音數據傳給ASR網(wǎng)關(guān)后臺引擎,后臺引擎根據給定的語(yǔ)法規定將語(yǔ)音識別出來(lái), 將識別結果返回給ASR網(wǎng)關(guān),將其存儲在網(wǎng)絡(luò )文件系統中,同時(shí)將識別完成信息傳給IVR節 點(diǎn)。IVR節點(diǎn)根據用戶(hù)請求啟 動(dòng)相應流程調用TTS網(wǎng)關(guān),TTS網(wǎng)關(guān)根據取得的請求,向指定的數據庫進(jìn)行訪(fǎng)問(wèn),將取得的相關(guān)信息轉化為文本信息,調用文語(yǔ)轉化模塊將文本信息合成語(yǔ)音信息播放給用戶(hù)。
適于一些簡(jiǎn)單的文本信息及數據信息,可由系統調用流程自動(dòng)合成。
系統 預先將一些 簡(jiǎn)單信息錄制成語(yǔ)音文件存放在語(yǔ)音文件中,ASR直接將識別的用戶(hù)語(yǔ)音信息轉化為文本信息存儲在文件系統中,IVR節點(diǎn)根據識別結果將語(yǔ)音信息進(jìn)行合成,再播放給用戶(hù)。
二、業(yè)務(wù)功能舉例
新太TTS/ASR系統是一個(gè)完 整的平臺,根據新太自身業(yè)務(wù)功能特點(diǎn),我們將其建立在NAP2000、IVSP平臺上,主要是 針對原來(lái)平臺上業(yè)務(wù)的新的應用,可以支持多種數據庫和文本文件的同時(shí)訪(fǎng)問(wèn)。系統能提 供集中式的文語(yǔ)轉 換功能、自動(dòng)語(yǔ)音識別功能、全文檢索功能、格式轉化功能,數據庫訪(fǎng)問(wèn)功能、以及二次開(kāi)發(fā)功能等。在此系統平臺上可開(kāi)通多種業(yè)務(wù),目前已實(shí)現的業(yè)務(wù)如:電話(huà)聽(tīng)E-MAIL 、語(yǔ)音查詢(xún)天氣、股票行情查詢(xún)、航班查詢(xún)等多種通過(guò)語(yǔ)音取代按鍵操作的自動(dòng)語(yǔ)音播放信息查詢(xún)業(yè)務(wù)。
1、天氣查詢(xún)
與傳統的天氣查詢(xún) 不同的是,用戶(hù)通過(guò)撥打一特服號接入到系統后,不用在系統語(yǔ)音提示下進(jìn)行多次按鍵選 擇,只需在系統語(yǔ)音提示下對著(zhù)電話(huà)說(shuō)出自己所要查詢(xún)的城市名即可查到自己所要的信息 。這種方式對用戶(hù)來(lái)說(shuō)快捷方便,適于要查找多個(gè)地方的天氣情況 ,每查找完一個(gè)信息不用退出系統重新選擇,只需根據系統語(yǔ)音提示報出你所另外要查找的地名即可。因為每天的天氣是動(dòng)態(tài)變化的,所以平臺要通過(guò)網(wǎng)關(guān)到氣象局實(shí)時(shí)取得數據。
2、股票行情查詢(xún)
證券交 易市場(chǎng)的發(fā)展伴隨著(zhù)經(jīng)濟的發(fā)展而發(fā)展,股市的動(dòng)態(tài)牽動(dòng)著(zhù)千萬(wàn)股民的心,為了方便股民 及時(shí)快捷的查找股市行情,提供一種實(shí)時(shí)語(yǔ)音交互的信息查詢(xún)是市場(chǎng)與客戶(hù)所迫切需要的 。股民只需對著(zhù)電話(huà)簡(jiǎn)單的說(shuō)出所要查找的股票代 碼即可獲得所需的信息。股市是隨時(shí)動(dòng)態(tài)變化的,對用戶(hù)的查詢(xún)信息通過(guò)網(wǎng)關(guān)實(shí)時(shí)到證券所數據庫取得相關(guān)信息,送往TTS文語(yǔ)轉換模塊轉換為語(yǔ)音文件通過(guò)IVR播放給用戶(hù)。
3、航班查詢(xún)
隨著(zhù) 社會(huì )的發(fā)展,人們出差旅游的機會(huì )越來(lái)越多,對各地航班的查詢(xún)訪(fǎng)問(wèn)量也更頻繁。傳統航 班查詢(xún)都是通過(guò)話(huà)務(wù)員或航班公司售票處座席提供服務(wù),利用新太TTS/ASR系統,用戶(hù)直 接對著(zhù)電話(huà)說(shuō) 出所要查詢(xún)的航班,平臺通過(guò)網(wǎng)關(guān)到航空公司數據庫查找,查找到的信息送至TTS文語(yǔ)合成模塊,根據ASR識別的用戶(hù)語(yǔ)音請求,將相應用戶(hù)信息通過(guò)IVR節點(diǎn)播放給用戶(hù)。
4、電話(huà)收發(fā)E-mail
用電話(huà)接收E-mail的方法可 以有兩種,傳統的方法是由話(huà)務(wù)員把E- mail的內容直接念給用戶(hù)聽(tīng)。另一種即利用TTS技術(shù),平臺讀取E-mail的內容,然后把文本內容送往文語(yǔ)轉換模塊將其轉化為語(yǔ)音信息,通過(guò)IVR節點(diǎn)播放給用戶(hù)。
用電話(huà)發(fā)E-mail業(yè)務(wù)是指用 戶(hù)通過(guò)電話(huà)接入系統,用戶(hù)打電話(huà)告知系統所要發(fā)信的目的電 子郵件地址,由ASR自動(dòng)識別系統內已定義好的IP地址,通過(guò)IVR節點(diǎn)錄音的語(yǔ)音文件以附件的方式生成Email通過(guò)Internet發(fā)送到對方的Email信箱中。
通過(guò)電話(huà)收發(fā)E-mail大大的方便了那些上網(wǎng)不方便,但又需要通過(guò)E-mail與外界聯(lián)系的朋友。
2001/03/30
亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 深泽县| 全椒县| 仪陇县| 鲁山县| 金平| 西平县| 清苑县| 景德镇市| 阿勒泰市| 五寨县| 普兰县| 施秉县| 石嘴山市| 兴和县| 太仆寺旗| 盱眙县| 晋中市| 扶风县| 平南县| 浮梁县| 邯郸市| 景洪市| 高安市| 娱乐| 深圳市| 建昌县| 壤塘县| 弥渡县| 永清县| 米易县| 丰宁| 浙江省| 烟台市| 巴东县| 高阳县| 曲周县| 阿合奇县| 沙田区| 天等县| 松原市| 奇台县| http://444 http://444 http://444 http://444 http://444 http://444