捷通華聲語(yǔ)音網(wǎng)站解決方案
2001/11/16
1.1 背景和現狀
隨著(zhù)互聯(lián)網(wǎng)的發(fā)展,網(wǎng)絡(luò )的硬件設備的容量和技術(shù)水平在不斷提高,網(wǎng)絡(luò )帶寬正在持續快速增長(cháng)和放大;在軟件方面,流媒體、語(yǔ)音合成等技術(shù)也日臻成熟。互聯(lián)網(wǎng)硬件水平和軟件技術(shù)的相互作用,為語(yǔ)音、圖形圖象、動(dòng)態(tài)影像等大容量數據在互聯(lián)網(wǎng)上的傳送提供了可能。
近年來(lái),一些語(yǔ)音網(wǎng)站紛紛開(kāi)通,其中比較著(zhù)名是2000年4月18日在英國誕生的全球首位互聯(lián)網(wǎng)虛擬主持人:安娜諾娃(Ananova,www.ananova.com)。從技術(shù)角度分析,安娜諾娃的實(shí)現,基于三項主要的技術(shù),即數字動(dòng)畫(huà)技術(shù)、語(yǔ)音合成技術(shù)和流媒體技術(shù)。數字動(dòng)畫(huà)技術(shù)可以為安娜諾娃創(chuàng )建人類(lèi)的表情,語(yǔ)音合成技術(shù)可以將新聞的內容合成為人類(lèi)的語(yǔ)言,流媒體技術(shù)可以使用戶(hù)在線(xiàn)收看、收聽(tīng)安娜諾娃所播報的新聞。
在中國,也先后出現了類(lèi)似的網(wǎng)站,諸如香港一家電視臺的“Icy”, 51Go網(wǎng)站的“GoGirl”和天津電視臺的“言東方”等等。
但是,以上這些以漢語(yǔ)為信息載體的虛擬主持人(語(yǔ)音網(wǎng)站)或者沒(méi)有實(shí)現語(yǔ)音方式,或者聲音全部是用人工提前錄音的方式錄制的,沒(méi)有實(shí)現用計算機進(jìn)行實(shí)時(shí)動(dòng)態(tài)合成。
1.2 捷通華聲語(yǔ)音網(wǎng)站方案解決的技術(shù)問(wèn)題
1.3解決方案之一:jTTS—Service語(yǔ)音服務(wù)器方案
語(yǔ)音服務(wù)器-IIS服務(wù)器-瀏覽器
語(yǔ)音服務(wù)器方案是指利用捷通華聲在CTI領(lǐng)域成熟應用的jTTS Service語(yǔ)音服務(wù)器,增加一臺或多臺語(yǔ)音服務(wù)器到現有的IIS服務(wù)系統的網(wǎng)絡(luò )環(huán)境中;在IIS服務(wù)器中,增加訪(fǎng)問(wèn)語(yǔ)音服務(wù)器的功能。當IIS服務(wù)器需要流媒體輸出時(shí),向語(yǔ)音服務(wù)器發(fā)出請求,語(yǔ)音服務(wù)器接受IIS服務(wù)器的請求,并對請求的數據進(jìn)行合成、格式轉換,得到流媒體后返回給IIS服務(wù)器,IIS服務(wù)器再將此流媒體傳輸給用戶(hù)。
(1) jTTS Service
(2)ASP(用于響應Web頁(yè)面請求、播放的腳本程序、ASP程序)
在本方案中,語(yǔ)音服務(wù)器是構建語(yǔ)音網(wǎng)站的后臺。jTTS Service將處于監聽(tīng)某一TCP/IP端口狀態(tài),響應來(lái)自IIS服務(wù)器的多用戶(hù)請求。而IIS服務(wù)器則增加通過(guò)TCP/IP請求服務(wù)器和接受服務(wù)器返回數據的程序,來(lái)完成流媒體獲得的功能。
瀏覽器端(Explorer)發(fā)出瀏覽請求,網(wǎng)站服務(wù)器(IIS)根據請求查找流媒體(音頻流)文件,如有,則將流媒體返回客戶(hù)端,并啟動(dòng)客戶(hù)端的MS media player播放流媒體。若沒(méi)有,則向語(yǔ)音服務(wù)器(jTTS Service)發(fā)出合成請求,并將所需合成的文本通過(guò)Socket接口傳送至語(yǔ)音服務(wù)器;語(yǔ)音服務(wù)器響應網(wǎng)站服務(wù)器的合成請求后,將調用jTTS合成技術(shù)進(jìn)行語(yǔ)音合成,并調用WMF SDK將生成的音頻文件轉換成流媒體格式ASF;通過(guò)Socket接口返回IIS服務(wù)器端后,將此流媒體文件存儲到指定的Web目錄,同時(shí)將流媒體返回瀏覽器端,啟動(dòng)MS media player播放。其流程如下:
(1)可實(shí)現語(yǔ)音服務(wù)器的分布式工作方式,對客戶(hù)端的請求自動(dòng)調度,平衡負載,以達到更高的性能。
(2)適用于訪(fǎng)問(wèn)量大(同時(shí)60線(xiàn)程及以上并發(fā)合成)的門(mén)戶(hù)網(wǎng)站或提供虛擬主機的IDC、ASP。
(3) 對現有的IIS服務(wù)系統不產(chǎn)生影響,也無(wú)需硬件升級,只需在IIS服務(wù)器上安裝客戶(hù)端軟件。
(4)投入少、實(shí)現簡(jiǎn)單,只需增加一臺或多臺語(yǔ)音服務(wù)器(視服務(wù)量大小,建議配置:PIII550 128M 10G以上)到現有的IIS服務(wù)系統的網(wǎng)絡(luò )環(huán)境中。
1.服務(wù)器端
語(yǔ)音服務(wù)器:
(1)一臺或多臺語(yǔ)音服務(wù)器(視服務(wù)量大小建議配置:PIII550 128M 10G以上)。
(2)NT4.0、SP4及以上、WMF SDK4.0及以上或Windows 2000、WMF SDK4.0及以上。
(3)jTTS Service(捷通華聲TTS服務(wù)器)服務(wù)器端軟件。
IIS服務(wù)器:
(1)jTTS Service (捷通華聲TTS服務(wù)器)客戶(hù)端軟件。
2.Web頁(yè)面端
(1)加入傳播參數的腳本,加入調用播放器的腳本文件(mediaplayer.asp)。
(2)加入播放參數(播放文件標志、播放引擎)。
1.4解決方案之二:jTTS-Web Service Pack語(yǔ)音網(wǎng)站服務(wù)包方案
語(yǔ)音網(wǎng)站服務(wù)包+IIS服務(wù)器-瀏覽器
與語(yǔ)音服務(wù)器方案不同的是,語(yǔ)音網(wǎng)站服務(wù)包方案不添加語(yǔ)音服務(wù)器,而是在IIS服務(wù)器中安裝捷通華聲語(yǔ)音網(wǎng)站服務(wù)包,從而構成集網(wǎng)站服務(wù)器(IIS)、語(yǔ)音服務(wù)器(TTS)于一身的語(yǔ)音網(wǎng)站服務(wù)器。其工作方式與語(yǔ)音服務(wù)器方案大致相同。當IIS服務(wù)器響應瀏覽器請求需要流媒體輸出時(shí),通過(guò)內部COM控件向底層的jTTS發(fā)出請求,jTTS依據COM所傳遞的參數,對請求的數據進(jìn)行合成、格式轉換后,直接將此流媒體傳輸給客戶(hù)端的瀏覽器。
(1)COM控件(TTSPlayer.dll,用于鏈接Web腳本和TTS合成引擎jTTS_ma.dll的動(dòng)態(tài)鏈接程序)
(2)jTTS SDK
在語(yǔ)音網(wǎng)站服務(wù)器中,語(yǔ)音服務(wù)器位于系統的底層,其作用是響應來(lái)自IIS服務(wù)器的請求服務(wù),來(lái)完成流媒體的生成。
瀏覽器端(Explorer)發(fā)出瀏覽請求時(shí),加在Web頁(yè)面的服務(wù)器端ASP程序和腳本程序自動(dòng)響應,根據請求查找流媒體(音頻流)文件,如有,則將流媒體返回客戶(hù)端,并啟動(dòng)客戶(hù)端的MS media player播放流媒體。若沒(méi)有,則向通過(guò)COM控件(TTSPlayer.dll)的傳遞函數向COM傳遞參數,并發(fā)送合成請求;COM控件根據參數和請求調用捷通華聲語(yǔ)音合成系統jTTS(jTTS_ma.dll)生成Wave格式的音頻文件,并返回給COM控件;COM控件得到之后再調用WMF SDK將所生成的音頻文件轉換成流媒體格式ASF,在保存到指定目錄后開(kāi)始將此流媒體返回客戶(hù)端,啟動(dòng)MS media player播放。其流程如下:
(1)投入少,實(shí)現簡(jiǎn)單,不需增加任何硬件設備,性?xún)r(jià)比高。
(2)適用于訪(fǎng)問(wèn)量不大(同時(shí)60線(xiàn)程左右并發(fā)合成)的企業(yè)、機關(guān)及各類(lèi)網(wǎng)站或提供虛擬主機服務(wù)的IDC、ASP。
(3)對現有的IIS服務(wù)系統影響小,需在IIS服務(wù)器上安裝jTTS-Web Service Pack軟件。
1.服務(wù)器端
對IIS服務(wù)器的要求是SP4及以上,增加以下組件
jTTS SDK2.1、添加并注冊COM控件(TTSPlayer.dll)、WMF SDK4.0及以上。
2.Web頁(yè)面端
(1)加入傳播參數的腳本,加入調用播放器的腳本文件(mediaplayer.asp)。
(2) 加入播放參數(播放文件標志、播放引擎)。
捷通華聲供稿 CTI論壇編輯
捷通華聲發(fā)布jASR5.5 ASR價(jià)格面前將無(wú)怯步 2008-04-16 |
捷通華聲TTS成功登陸中國郵政儲蓄銀行 2008-04-03 |
捷通華聲 jTTS 5.5 全面支持 MRCPv2標準 2008-03-31 |
捷通華聲移動(dòng)導航HCI解決方案廣受青睞 2008-03-26 |
身邊的“智能”生活 2007-12-28 |