• <strike id="fdgpu"><input id="fdgpu"></input></strike>
    <label id="fdgpu"></label>
    <s id="fdgpu"><code id="fdgpu"></code></s>

  • <label id="fdgpu"></label>
  • <span id="fdgpu"><u id="fdgpu"></u></span>

    <s id="fdgpu"><sub id="fdgpu"></sub></s>
     首頁 > 技術 > 技術文摘 > CSSML(中文語音合成標記語言)的發(fā)展與應用

    CSSML(中文語音合成標記語言)的發(fā)展與應用

    2003-12-17 00:00:00   作者:   來源:   評論:0 點擊:


      近年來,隨著中文語音技術的迅速發(fā)展和應用的逐步深入,語音產(chǎn)業(yè)的廣闊市場及其所凸現(xiàn)的強大的產(chǎn)業(yè)帶動效應已經(jīng)初步顯示出來。為促進中文語音產(chǎn)業(yè)的蓬勃發(fā)展,國家863專家組、國家信標委和技術監(jiān)督局聯(lián)合決定由科大訊飛作為唯一的企業(yè)代表牽頭制訂中文語音技術接口標準與規(guī)范。2003年10月15日,由國家信息產(chǎn)業(yè)部主辦、安徽中科大訊飛信息科技有限公司承辦的"語音標準研討會"在合肥順利召開。來自國家信標委、863專家組、相關科研院校的語音技術專家、學者和語音技術的關鍵應用廠商共40余人參加了此次會議。會上確定了由科大訊飛牽頭制定語音標準。
      CSSML(Chinese Speech Synthesis Markup Language),即中文語音合成標記語言,正是在上述背景下由科大訊飛起草,經(jīng)歷數(shù)次中文語音技術標準研討會討論后形成的。
      CSSML標記語言針對中文合成領域內(nèi)的特殊要求,對W3C定義的SSML規(guī)范中的標記進行擴展,并與SSML完全兼容。SSML(語音合成標記語言)是由W3C制定并在VoiceXML中使用,作為電話語音流程中語音合成控制的標準。SSML的基本任務就是在不同的應用平臺上為合成文本提供一個標準的控制語音輸出的方法,例如發(fā)音、音量、音調、語速等參數(shù)。而VoiceXML作為人與電話應用交互的流程描述語言,在當今的語音門戶、統(tǒng)一消息平臺等以語音驅動的應用中正發(fā)揮著越來越重要的作用。
      CSSML在交互式語音應用中前景廣闊。通常,語音合成(Text-To-Speech)系統(tǒng)會根據(jù)當前的語流環(huán)境確定文本的具體合成方式,例如,數(shù)字按數(shù)值發(fā)音還是按數(shù)字串發(fā)音、人名地名的識別、分句、英文按單詞發(fā)音或者按字母發(fā)音等等。
      隨著語音技術的迅速進步,目前這種自動處理在一般的語料中已經(jīng)可以達到很好的效果,但用戶可能使用到一些專業(yè)性較強的、不符合常規(guī)的文本,特定文本集合的發(fā)音本身固有的不確定性往往是現(xiàn)有語音合成系統(tǒng)需要面對的一個難題,合成系統(tǒng)在處理這些文本時可能會出現(xiàn)一些錯誤,而使用加詞、特殊規(guī)則等手段難以解決,這時用戶可以通過CSSML標記文本來指定文本的合成方式,靈活解決一些語音合成系統(tǒng)難以自動處理的問題。再如,隨著信息服務的不斷豐富與深入,運營服務商常常需要面臨在同一語音平臺上需要提供不同的應用的情況。通過CSSML可以為同一平臺上的不同應用指定相應的合成風格與方式,從而滿足不同客戶的個性化要求。
      CSSML中使用基礎元素指定文本的格式。例如CSSML語言提供了一個段落元素、句子元素和詞語元素。通過像指定段落一樣指定句子、詞語的地址,包括起始地址和終止地址,根據(jù)制定的格式,語音合成系統(tǒng)就能更準確的生成語音。
      CSSML語言提供的Break元素,可以讓用戶調整詞語間停頓的時長,以逼近最真實的發(fā)音風格。用戶也可以通過文本替換"sub"元素,將合成文本中的特定文字替換為指定的文字,這在面向一些縮寫詞或者特殊用語的語音合成中非常實用。
      CSSML還提供指定某個預定的詞語或者詞語集合發(fā)音的標記。這個功能由"say-as"元素來實現(xiàn)。它是SSML中一個非常有用的組件。它能讓你指定一個模板,這個模板描述如何發(fā)音某個單詞或者單詞集合。通過"say-as",我們可以為縮寫的單詞指定如何發(fā)音,也可以為拼寫與發(fā)音不同的單詞指定發(fā)音。我們還可以列出數(shù)字和日期之間的區(qū)別。"say-as"元素包含了對email地址、貨幣和電話號碼等的支持。
      CSSML語言高級特性之一還體現(xiàn)在它的"prosody"元素上。通過它我們可以以某種指定地方式生成某個確定的文本集合的語音。我們可以指定聲音的語調、范圍、語速(單詞每分鐘)。通過指定一個文本集合的"prosody"元素值,我們可以更精確的定義如何生成語音。
      隨著中文語音技術的迅速發(fā)展以及市場應用的不斷深入,其前景日益受到來自社會各方面的重視,國家相關管理部門為了規(guī)范中文語音合成的良性發(fā)展而委托科大訊飛制定的CSSML,必然在今后的中文語音合成領域中發(fā)揮著至為重要的規(guī)范作用。作為中文語音技術與市場領導者的科大訊飛公司,從其InterPhonic CE 2.1產(chǎn)品開始已全面支持CSSML。為了便于用戶實際應用,在InterPhonic CE 2.2產(chǎn)品中,科大訊飛提供了CSSML Editor-一個可視化的CSSML編輯工具,幫助用戶直觀快速的生成、試聽和發(fā)布CSSML文本。
      我們有理由相信,隨著CSSML的發(fā)展和應用,將有助于中文語音合成技術邁向更加成熟和規(guī)范的明天。

    科大訊飛公司供稿 CTI論壇編輯

    相關閱讀:

    分享到: 收藏

    專題

    亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 虹口区| 巧家县| 西吉县| 紫云| 嘉峪关市| 禹州市| 扎囊县| 潮州市| 手游| 土默特左旗| 怀柔区| 尼玛县| 安多县| 舒城县| 鸡东县| 昌黎县| 台江县| 嘉荫县| 蒲城县| 寻乌县| 台江县| 新绛县| 长宁县| 福海县| 凤阳县| 开阳县| 堆龙德庆县| 蓝山县| 三江| 临海市| 安乡县| 砚山县| 乐都县| 永胜县| 新津县| 安顺市| 南乐县| 奉化市| 延寿县| 屯留县| 绥德县| http://444 http://444 http://444 http://444 http://444 http://444