• <strike id="fdgpu"><input id="fdgpu"></input></strike>
    <label id="fdgpu"></label>
    <s id="fdgpu"><code id="fdgpu"></code></s>

  • <label id="fdgpu"></label>
  • <span id="fdgpu"><u id="fdgpu"></u></span>

    <s id="fdgpu"><sub id="fdgpu"></sub></s>
     首頁 > 技術(shù) > 解決方案 > InterPhonic中英文混讀TTS(2.2版本)新增特性介紹

    InterPhonic中英文混讀TTS(2.2版本)新增特性介紹

    2003-09-30 00:00:00   作者:   來源:   評論:0 點擊:


      InterPhonic語音合成系統(tǒng)是面向中、高端應(yīng)用的語音合成系統(tǒng),以先進(jìn)的大語料語音合成技術(shù)和語音韻律描述體系為基礎(chǔ),提供面向任意文本、任意篇章的連續(xù)語音合成功能,合成音質(zhì)可媲美真人發(fā)音。目前,InterPhonic系列產(chǎn)品已經(jīng)成為市場上的主流語音合成系統(tǒng),在電信客服、語音門戶、證券客服等領(lǐng)域都有了廣泛的應(yīng)用,不論是效果還是系統(tǒng)穩(wěn)定性都得到用戶的肯定。
       科大訊飛以人為本,致力于創(chuàng)造人類信息時代信息獲取和溝通的最佳方式。InterPhonic CE 2.2作為其InterPhonic系列的最新產(chǎn)品,在合成效果方面,除了繼續(xù)提高中文與英文的合成效果之外,還在兩者之間如何更加流暢的銜接,以及如何更加方便快捷的實現(xiàn)效果定制方面取得了顯著的改進(jìn)。除此之外,在系統(tǒng)的實用性、易用性等方面又有了進(jìn)一步的提高,在此基礎(chǔ)上,InterPhonic C&E2.2還新增了很多新的特性,如推出功能更加強(qiáng)大和完善的TTS Server Express語音合成服務(wù)器軟件,并且首次加入了CSSML編輯器和TTS Doctor技術(shù)支持工具。
    一、 技術(shù)改進(jìn)
      為了體現(xiàn)訊飛以人為本的宗旨,為了使用戶感受到專業(yè)語音科技給他們帶來的便利。InterPhonic CE v2.2在合成效果方面,主要增加了CE2.1系統(tǒng)中缺少的語氣詞合成、改進(jìn)了短語、短句效果,同時改進(jìn)了前端文本處理過程:
    ·語氣詞處理
      語氣的應(yīng)用,例如“是嗎?”“為什么呢?”“啊!”等。
      在InterPhonic CE2.2以前的合成系統(tǒng)中不包含語氣詞的合成,對這些語氣的處理都按照陳述語在一些語音應(yīng)用中存在者一些非陳述氣進(jìn)行,這種處理影響了語音應(yīng)用的效果。InterPhonic CE 2.2引進(jìn)了語氣詞合成的處理,能夠處理疑問、感嘆等語氣效果。這樣使得這些生活中常用的語句真正做到人性化,讓用戶體驗到親切感。
    ·短語合成效果改進(jìn)
      InterPhonic CE 2.2在音庫中補(bǔ)充了一定的短句語料,擴(kuò)大短句語料的覆蓋面,同時在前端文本分析中加入了短語語境的判斷和處理。改進(jìn)之后的系統(tǒng)在合成一些包含大量短句、短語的文本時效果上有比較明顯的提升,例如人名、地名、短語合成。這種特性讓系統(tǒng)的使用范圍得到進(jìn)一步加強(qiáng)。
    ·前端韻律算法改進(jìn)
      InterPhonic CE v2.2中通過對詞類調(diào)整和未登錄詞算法的改進(jìn),提高了韻律樹生成準(zhǔn)確率,改進(jìn)了合成自然度。可以使合成的聲音更加和諧,愉悅聽眾的耳朵。
    ·多音字處理改進(jìn)
      新的多音字處理算法提高了多音字識別的準(zhǔn)確率。減少了系統(tǒng)的誤讀率,更容易讓用戶接受。
    2. 產(chǎn)品架構(gòu)方面
    ·桌面版
      InterPhonic CE 2.2系統(tǒng)提供了全新意義的桌面版,這種桌面版系統(tǒng)在保證與企業(yè)版相同的合成效果以外,有以下特點:
    1. 系統(tǒng)尺寸小
      系統(tǒng)占用硬盤空間小,減少資源消耗,用戶可以靈活安裝,安裝后占用硬盤空間比以往版本更小;
    2. 系統(tǒng)響應(yīng)時間
      桌面版合成系統(tǒng)能夠快速啟動,而且合成時也不會出現(xiàn)停頓,可以達(dá)到桌面軟件應(yīng)用要求;

       提供與企業(yè)版相同的開發(fā)接口,改進(jìn)后的TTS COM控件可以提供多個應(yīng)用的并發(fā)使用。
    · TTS COM v1.1
      TTS COM組件是TTS SDK中一個重要的組成部分,提供該組件的目的是適應(yīng)多種開發(fā)環(huán)境、簡化開發(fā)過程。不少用戶傾向于使用TTS COM組件開發(fā)TTS應(yīng)用程序,支持的開發(fā)工具非常廣泛、語言類型多種多樣。改進(jìn)的TTS COM組件已經(jīng)能夠?qū)崿F(xiàn)幾乎所有的TTS功能,滿足一般的開發(fā)需要,并在可用性、易用性方面得到進(jìn)一步完善。
    ·TTS Server Express v1.2
      TTS Server Express提供了對基于網(wǎng)絡(luò)的TTS服務(wù)支持,是企業(yè)版合成系統(tǒng)的重要組成部分,TTS網(wǎng)絡(luò)應(yīng)用的核心。TTS Server Express v1.2在功能、易用性等各方面進(jìn)行了一次全面的提升。
    ·CSSML Editor v1.0
      通常情況下,TTS系統(tǒng)會根據(jù)上下文語法、語義來自動確定文本的合成方式,但由于文本的復(fù)雜性和多樣性,這種自動處理難以避免會出現(xiàn)錯誤,造成合成錯誤,效果不理想的情況。CSSML(中文語音合成標(biāo)記語言)集成了XML的優(yōu)秀特性,與VoiceXML中包含的SSML兼容,可以用來指定文本合成方式,是通過標(biāo)記方式改進(jìn)合成效果的最佳途徑。
      從InterPhonic CE v2.1版本以后,CSSML規(guī)范已經(jīng)成為科大訊飛合成系統(tǒng)的一個重要部分,后期系統(tǒng)還將不斷擴(kuò)大CSSML規(guī)范的支持范圍。CSSM具有兼容VoiceXML的嚴(yán)謹(jǐn)語法格式,并提供了功能豐富的標(biāo)記。CSSML Editor提供了簡單易用的CSSML可視化編輯環(huán)境,使得用戶可以快速高效地生成CSSML標(biāo)記文本。
    ·數(shù)字規(guī)則
      CE22系統(tǒng)在數(shù)字策略定制方面將進(jìn)一步改進(jìn),允許用戶設(shè)置數(shù)字策略匹配規(guī)則,設(shè)置對數(shù)字串如何處理的規(guī)則。這些設(shè)置都將提供在資源管理中心界面中,增加一種全新的資源類型,這種資源從屬于資源包,在資源管理中心新建“數(shù)字規(guī)則”頁集中對該資源包的數(shù)字規(guī)則進(jìn)行設(shè)置。使得用戶可以按照自己的要求設(shè)置,進(jìn)一步滿足個性化的需求。
      例如,可以設(shè)置這樣的一條手機(jī)號碼處理規(guī)則。
      規(guī)則描述:手機(jī)號碼的處理規(guī)則
      匹配條件:數(shù)字串長度為11,前三位數(shù)字為130/133/135/136/137/138/139;
      處理策略:“1”讀“幺”,韻律為335。
    ·CSSML支持的改進(jìn)
    CE22繼續(xù)增強(qiáng)合成系統(tǒng)對CSSML規(guī)范的支持:
     1. 支持UTF-8、UTF16格式的CSSML文本,自動識別具有文件頭簽名的Unicode(UTF-16 LE)文本和Utf-8文本;
     2. mark標(biāo)記,支持命名事件和未命名事件,這個特性同時體現(xiàn)在TTS SDK中;
     3. audio標(biāo)記支持所有合成系統(tǒng)能夠識別的音頻格式;
     4.
     5. sayas標(biāo)記增加對人名地名的支持;
     6. meta標(biāo)記的支持;
    ·字符集轉(zhuǎn)化的增強(qiáng)
     InterPhonic CE2.2系統(tǒng)在字符集轉(zhuǎn)化方面進(jìn)行了增強(qiáng):
     1. 增加了對目前比較流行的編碼方式UTF-8的支持;
     2. 改進(jìn)后的合成系統(tǒng)可以自動識別UNICODE文本,并且自動轉(zhuǎn)化合成。支持  UTF-8、UTF16格式的文本,自動識別具有文件頭簽名的Unicode(UTF-16 LE) 文本和Utf-8文本;
      合成系統(tǒng)的技術(shù)支持工作存在著非常雷同而繁雜的步驟——確定用戶的應(yīng)用環(huán)境:合成系統(tǒng)名稱版本、操作系統(tǒng)名稱版本、加密鎖路數(shù)、資源狀況等等。借助產(chǎn)品中提供的TTS Doctor技術(shù)支持工具,可以在便于進(jìn)行遠(yuǎn)程的信息搜集和支持,更加快速的定位問題發(fā)生的可能原因,提供專業(yè)的技術(shù)支持和服務(wù)。
    二、 接口改進(jìn)
    ·增強(qiáng)對CSSML文本的支持
      XML因其優(yōu)秀的的可擴(kuò)展性和強(qiáng)大的數(shù)據(jù)表達(dá)能力已經(jīng)成為未來Internet上數(shù)據(jù)表達(dá)和傳輸?shù)臉?biāo)準(zhǔn)技術(shù),基于XML和VXML技術(shù)的CSMML規(guī)范也將成為中文語音合成的標(biāo)準(zhǔn)。CSSML規(guī)范是一套完備的中文語音合成標(biāo)記規(guī)范,用戶可以通過CSSML標(biāo)記文本來指定文本的合成方式,這種方法能夠解決一些語音合成系統(tǒng)難以處理的問題。
      InterPhonic CE 2.2系統(tǒng)保持處理CSSML格式的文本的特性。在后續(xù)的版本,訊飛依然會加強(qiáng)對CSMML規(guī)范的支持力度。用戶可以對需要合成的文本進(jìn)行編輯,將其編輯為CSSML格式的文本,對一些特殊用法、發(fā)音習(xí)慣進(jìn)行單獨標(biāo)記,用以指導(dǎo)合成系統(tǒng)的合成,就可以提高合成效果、解決合成系統(tǒng)無法正確合成的多種問題。
    ·網(wǎng)絡(luò)接口的改進(jìn)
      相應(yīng)于TTS Server的升級,CE2.2對TTS SDK中的網(wǎng)絡(luò)版標(biāo)準(zhǔn)接口進(jìn)行了改進(jìn),改進(jìn)之后的網(wǎng)絡(luò)接口:
     1. 支持目前本地運行庫的所有參數(shù);
     2. 在連接的時侯可以指定超時時間、指定使用的網(wǎng)絡(luò)端口;
     3. 支持運行日志,便于問題解決和調(diào)試;
    ·TTS SDK改進(jìn)
     除了TTS COM v1.1、網(wǎng)絡(luò)接口,CE2.2還對TTS SDK做了以下改進(jìn):
     1.新的接口支持進(jìn)程內(nèi)的多次初始化;
     2.SAPI接口增加了日志功能;
     3.增加了多個示例程序;
     4.增加了對其他開發(fā)語言的支持,如C#、ASP.NET。
      以上無論是對合成效果的提升還是對系統(tǒng)架構(gòu)和產(chǎn)品性能的優(yōu)化,乃至對接口的改進(jìn),文檔的修正,訊飛始終以專業(yè)的態(tài)度和高度的責(zé)任感去面對每一個問題,盡可能的考慮到實際應(yīng)用的每一個細(xì)節(jié)。想得更多,做得更多,我們將繼續(xù)盡心盡力,提供最優(yōu)秀的產(chǎn)品和最完善的服務(wù)。

    科大訊飛公司供稿 CTI論壇編輯

    相關(guān)閱讀:

    分享到: 收藏

    專題

    亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 泸州市| 鹤庆县| 黑河市| 高密市| 来宾市| 夹江县| 马鞍山市| 克什克腾旗| 长寿区| 丰台区| 隆昌县| 琼中| 荥阳市| 尉犁县| 苏州市| 汕头市| 乌鲁木齐市| 常德市| 咸阳市| 鄂托克旗| 江陵县| 贡山| 咸阳市| 洛南县| 巍山| 华阴市| 镇宁| 双柏县| 昌都县| 工布江达县| 和政县| 本溪| 炎陵县| 泊头市| 林口县| 宁南县| 丰台区| 康乐县| 鲁甸县| 西充县| 呼伦贝尔市| http://444 http://444 http://444 http://444 http://444 http://444