• <strike id="fdgpu"><input id="fdgpu"></input></strike>
    <label id="fdgpu"></label>
    <s id="fdgpu"><code id="fdgpu"></code></s>

  • <label id="fdgpu"></label>
  • <span id="fdgpu"><u id="fdgpu"></u></span>

    <s id="fdgpu"><sub id="fdgpu"></sub></s>
     首頁 > 技術(shù) > 技術(shù)文摘 > 合成語音走向商用化

    合成語音走向商用化

    2001-08-02 00:00:00   作者:   來源:   評(píng)論:0 點(diǎn)擊:939


      7月18日,對(duì)于捷通華聲來說,是一個(gè)特別的日子。在這天,公司發(fā)布了最新的、語音質(zhì)量自然的TTS(文本轉(zhuǎn)語音技術(shù)),吸引了CTI和相關(guān)應(yīng)用領(lǐng)域的眾多廠商代表。

      在介紹捷通華聲的TTS技術(shù)之前,公司總經(jīng)理張連毅先生不止一次談到當(dāng)年北京市長(zhǎng)熱線的建設(shè)情況。在當(dāng)時(shí),系統(tǒng)集成商考慮到市長(zhǎng)熱線的內(nèi)容會(huì)經(jīng)常變化,如果采用錄音播放,可能在時(shí)間緊急時(shí)來不及重新錄音;如果采用TTS技術(shù),只需改變文本內(nèi)容,就簡(jiǎn)單得多了。所以,集成商采用了TTS技術(shù)。未曾想,在系統(tǒng)驗(yàn)收時(shí),由于合成語音的質(zhì)量差被否定,只好連夜找人重新錄音。張總說出了長(zhǎng)期阻礙TTS技術(shù)商用的一個(gè)原因,就是合成的語音質(zhì)量太差,不能為人們所接受。也因?yàn)榇耍萃ㄈA聲為自己的新品推出組織了一個(gè)大型發(fā)布會(huì),因?yàn)樗麄兿嘈殴镜腡TS合成的語音質(zhì)量自然、流利。而事實(shí)上,會(huì)前采用TTS技術(shù)播放的新聞,就被不少人誤認(rèn)為是錄音播放。


      看到語音技術(shù)的前景,眾多IT巨頭和公司加入市場(chǎng)的逐角。僅僅在漢語識(shí)別和合成領(lǐng)域,就聚集了微軟、Intel、Motorola、IBM、PHILIPS、松下等公司。而作為一家民營(yíng)企業(yè),捷通執(zhí)著地認(rèn)為,漢語語音技術(shù)應(yīng)該掌握在中國(guó)人自己手中,特別是在得知國(guó)內(nèi)某家大型通信公司采用由以色列一家公司開發(fā)完成的中文語音合成技術(shù),進(jìn)行電話查詢及聲訊業(yè)務(wù),而每一條電話線的技術(shù)使用費(fèi)需要1萬元/年之后,他更是這樣認(rèn)為。

      捷通為了加強(qiáng)在語音技術(shù)方面的研發(fā)實(shí)力,于去年聯(lián)合著名語音技術(shù)專家呂士楠先生,共同投資創(chuàng)辦了專門從事漢語語音技術(shù)研究和應(yīng)用的捷通華聲語音公司。由呂先生親自主持捷通華聲語音研發(fā)中心,并在TTS技術(shù)上不斷創(chuàng)新。去年2月,捷通的TTS實(shí)現(xiàn)了中英文混讀的功能;去年5月,實(shí)現(xiàn)語音合成技術(shù)在嵌入式操作系統(tǒng)中的移植;今年7月,推出語音質(zhì)量自然的語音合成系統(tǒng)。


      作為提供語音產(chǎn)品和平臺(tái)的廠商,捷通主要專注在三個(gè)領(lǐng)域:CTI領(lǐng)域、獨(dú)立軟件產(chǎn)品和嵌入式操作系統(tǒng)。由于公司TTS音庫大小可調(diào)節(jié),可應(yīng)用于不同的系統(tǒng)。對(duì)于CTI等大型應(yīng)用系統(tǒng),其語音庫約為2G 大小,語音質(zhì)量較高,而且自然;對(duì)于PC應(yīng)用,語音庫壓縮為1.5~2M,但語音質(zhì)量沒有太大損傷,為PC個(gè)人用戶服務(wù);對(duì)于嵌入式操作系統(tǒng)以及掌上終端應(yīng)用,語音庫大小為1M。

      捷通TTS在CTI行業(yè)中的應(yīng)用提供四種解決方案:電話智能語音中心、語音服務(wù)器方案、本地接口調(diào)用、離線合成。

      電話智能語音中心

      提供CTI可視化制作系統(tǒng),由維護(hù)端和監(jiān)視管理端兩部分組成,使用戶無需編程,就可完成簡(jiǎn)單的、計(jì)算機(jī)電話語音集成功能。該方案適用于簡(jiǎn)單的CTI應(yīng)用,如中小企業(yè)的咨詢服務(wù)、統(tǒng)計(jì)調(diào)查,以及金融、工商、稅務(wù)、醫(yī)院等行業(yè)。

      TTS語音服務(wù)器方案

      直接提供裝載有捷通TTS語音服務(wù)系統(tǒng)的服務(wù)器,與現(xiàn)有的聲訊服務(wù)相平行,接受其指令和文字?jǐn)?shù)據(jù)流,合成產(chǎn)生語音數(shù)據(jù)流返給原系統(tǒng),適用于電信、大型企業(yè)CTI系統(tǒng)及聲訊臺(tái)改造、升級(jí),如160、168等聲訊臺(tái)、UMS統(tǒng)一信息服務(wù)系統(tǒng)、呼叫中心等。


      與其他文語轉(zhuǎn)換系統(tǒng)相比,捷通的TTS技術(shù)具有音庫壓縮特點(diǎn),從而使TTS技術(shù)向嵌入式操作系統(tǒng)的移植(尤其是向PDA上的移植)具備先決條件。同時(shí),捷通TTS技術(shù)在大規(guī)模真實(shí)錄音語音庫的基礎(chǔ)上,增加了音庫壓縮算法和音色變換算法形成核心技術(shù),音庫大小可縮擴(kuò),小音庫為1MB,適合基于嵌入式操作系統(tǒng)的應(yīng)用。

      針對(duì)嵌入式系統(tǒng)的應(yīng)用,捷通提供了TTS開發(fā)工具包CE版本,提供掌上電腦上的語音合成應(yīng)用,即語音伴侶CE版本。

      在TTS技術(shù)的基礎(chǔ)上,捷通將以語音合成技術(shù)為核心,逐步發(fā)展語音識(shí)別、自然語言理解、模式識(shí)別等人工智能處理技術(shù)。

    摘自中國(guó)計(jì)算機(jī)報(bào)

    相關(guān)閱讀:

    • 0

    • 0

    • 0

    • 0

    • 0

    • 0

    • 0

    • 0

    分享到:   收藏

    專題

    亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 方山县| 西平县| 灵武市| 杭州市| 和政县| 南溪县| 海门市| 丰顺县| 雅江县| 筠连县| 东兰县| 满城县| 三河市| 松溪县| 邓州市| 石门县| 岑溪市| 罗源县| 江达县| 陵水| 本溪| 南江县| 孝感市| 鹤山市| 北流市| 霞浦县| 兰溪市| 璧山县| 阳谷县| 逊克县| 曲靖市| 祁连县| 鹿邑县| 晋宁县| 来安县| 东平县| 浪卡子县| 河曲县| 大港区| 宝清县| 邹平县| http://444 http://444 http://444 http://444 http://444 http://444