• <strike id="fdgpu"><input id="fdgpu"></input></strike>
    <label id="fdgpu"></label>
    <s id="fdgpu"><code id="fdgpu"></code></s>

  • <label id="fdgpu"></label>
  • <span id="fdgpu"><u id="fdgpu"></u></span>

    <s id="fdgpu"><sub id="fdgpu"></sub></s>
     首頁 > 技術(shù) > 解決方案 > 捷通華聲TTS在聲訊領(lǐng)域的應(yīng)用

    捷通華聲TTS在聲訊領(lǐng)域的應(yīng)用

    2001-11-08 00:00:00   作者:   來源:   評論:0 點擊:


    1.1市場背景

    隨著信息平臺的多樣化,傳統(tǒng)的聲訊服務(wù)正在經(jīng)受著越來越嚴峻的考驗。伴隨著互聯(lián)網(wǎng)的迅速普及,人們對信息更新速度的要求也越來越高。同時,傳統(tǒng)的人工聲訊以及用人工錄音實方式現(xiàn)的自動聲訊服務(wù)需要很高的日常維護費用,這使得聲訊臺的運營者不堪重負。而恰恰在此時,北京捷通華聲軟件技術(shù)有限公司的語音合成(Text To Speech)技術(shù)實現(xiàn)了飛躍性的突破,從而使真正意義上的自動聲訊得以實現(xiàn)。

    TTS(Text To Speech)技術(shù)就是將計算機中的文本轉(zhuǎn)換為語音的過程,它可以輕而易舉地將傳統(tǒng)的人工聲訊系統(tǒng)轉(zhuǎn)換為自動聲訊系統(tǒng)。信息的提供者只需要更新數(shù)據(jù)庫中的文本內(nèi)容,利用TTS技術(shù),信息的需求者就可以通過電話隨時獲取最新的信息。與傳統(tǒng)的聲訊服務(wù)相比,自動聲訊系統(tǒng)無論是在信息的更新速度、維護成本、操作靈活性上,還是在服務(wù)的質(zhì)量、管理、規(guī)范上都有著絕對的優(yōu)勢。因此,隨著新一代TTS技術(shù)的誕生,自動聲訊系統(tǒng)正在以無法阻擋的速度,占領(lǐng)著原有的聲訊市場。

    1.2技術(shù)背景

    要想實現(xiàn)真正的自動聲訊系統(tǒng),需要在幾個關(guān)鍵部分實現(xiàn)技術(shù)突破,只有關(guān)鍵技術(shù)達到了產(chǎn)品化的要求,市場運作才成為可能。

    第一:任意文本合成

    為了使各種各樣的文本信息能夠及時的轉(zhuǎn)化為語音,TTS技術(shù)必須能夠做到任意文本合成,也就是說它的音庫必須能夠適應(yīng)各個行業(yè)語言習(xí)慣,只有這樣,信息的提供者才能不受局限地為用戶提供各種信息。

    第二:即時合成

    如果事先把文本合成為語音,再存放到服務(wù)器中播放給用戶,那無疑又回到了原有聲訊服務(wù)的模式,更新速度及工作量都不能滿足要求。因此,TTS技術(shù)必須能夠做到即時合成,即:當用戶向聲訊服務(wù)器發(fā)出信息請求時,聲訊服務(wù)器做出分析判斷,并從內(nèi)容數(shù)據(jù)庫中提取相應(yīng)文本,然后發(fā)送給語音合成服務(wù)器。語音服務(wù)器邊合成邊回傳給聲訊服務(wù)器,進而再傳送給用戶。整個的合成過程是在用戶收聽的同時進行的,不能有明顯的延遲,也不能在播放的過程中停頓,這就要求TTS技術(shù)有相當?shù)姆(wěn)定性以及非常快的合成速度。

    第三:自然語調(diào)合成

    為什么TTS技術(shù)經(jīng)過數(shù)十年地研究,一直都沒有得到大規(guī)模的實際應(yīng)用?其主要原因就在于早期的合成語音效果一直沒有達到真正自然的階段,僅達到“可以聽懂”的水平。因此,傳統(tǒng)的聲訊服務(wù)系統(tǒng)寧愿花大力氣去進行人工錄音,也不愿意給用戶聽一些磕磕絆絆的合成效果,這也正是長期以來制約自動聲訊系統(tǒng)發(fā)展的一個重要因素。

    捷通華聲公司2001年7月份推出的TTS核心在合成語音的質(zhì)量上實現(xiàn)了飛躍,成功地實現(xiàn)了自然語調(diào)合成,字詞間平滑過度。這標志著自動聲訊系統(tǒng)的又一技術(shù)壁壘被打破了。

    第四:“集群式并發(fā)”處理

    眾所周知,聲訊服務(wù)的用戶數(shù)量是相當巨大的,當大量的用戶同時向聲訊服務(wù)器發(fā)出信息請求時,我們稱之為“集群式并發(fā)”。

    每臺服務(wù)器的負載能力是有限的,因此,通常中型以上的聲訊系統(tǒng)中都會采用多臺聲訊服務(wù)器及多臺語音合成服務(wù)器。那么,如何解決好多臺服務(wù)器之間的負載平衡問題就顯得尤為重要。如果不能解決負載問題,在系統(tǒng)實際運行中就會造成某些服務(wù)器滿負荷運轉(zhuǎn),而某些服務(wù)器則長期空閑,不僅是對資源的浪費,而且會直接影響到整個聲訊服務(wù)系統(tǒng)的暢通。

    捷通華聲公司針對這一現(xiàn)象做了專門的研究,并開發(fā)出了“動態(tài)負載平衡機制”。通過捷通華聲的動態(tài)負載平衡機制,語音服務(wù)器可以動態(tài)地分配語音合成請求,使多臺服務(wù)器的負載相對比較均衡,以確保整個聲訊系統(tǒng)保持最佳的運行效果。

    捷通華聲動態(tài)負載平衡機制的成功研制,為大規(guī)模自動聲訊服務(wù)的實現(xiàn)奠定了穩(wěn)固的技術(shù)基礎(chǔ)。

    1.3技術(shù)流程

    當用戶通過電話向聲訊服務(wù)器發(fā)出請求時,聲訊服務(wù)器會首先作出分析判斷,然后從內(nèi)容數(shù)據(jù)庫中提取相應(yīng)的文本信息,經(jīng)過負載平衡機制發(fā)送給語音合成服務(wù)器。語音合成服務(wù)器在接收到文本后立刻開始合成,同時將合成好的語音發(fā)送回語音服務(wù)器,再由語音服務(wù)器回傳給用戶。其中內(nèi)容數(shù)據(jù)庫中的信息可以由系統(tǒng)管理員定期進行維護管理。(系統(tǒng)連接結(jié)構(gòu)見流程圖)

    1.4配置要求

    1.語音服務(wù)器配置:單CPU——PIII 800;內(nèi)存256M或更高(具體數(shù)量根據(jù)聲訊系統(tǒng)規(guī)模而定)
    2.軟件需求:操作系統(tǒng)、jTTS系統(tǒng)、捷通華聲動態(tài)負載平衡機制

     捷通華聲TTS在聲訊領(lǐng)域的應(yīng)用(流程圖)

    捷通華聲供稿 CTI論壇編輯

    相關(guān)閱讀:

    分享到: 收藏

    專題

    亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 嘉黎县| 平阴县| 会宁县| 黄冈市| 绥阳县| 巫溪县| 绥芬河市| 牡丹江市| 上思县| 江城| 乐安县| 康乐县| 淮安市| 石棉县| 藁城市| 三明市| 清镇市| 桃园市| 临猗县| 滕州市| 松滋市| 眉山市| 米林县| 商洛市| 丁青县| 八宿县| 清流县| 大港区| 新和县| 甘孜县| 政和县| 武安市| 兴义市| 政和县| 定安县| 建平县| 班戈县| 沿河| 焦作市| 永清县| 抚远县| http://444 http://444 http://444 http://444 http://444 http://444