• <strike id="fdgpu"><input id="fdgpu"></input></strike>
    <label id="fdgpu"></label>
    <s id="fdgpu"><code id="fdgpu"></code></s>

  • <label id="fdgpu"></label>
  • <span id="fdgpu"><u id="fdgpu"></u></span>

    <s id="fdgpu"><sub id="fdgpu"></sub></s>
    您當(dāng)前的位置是:  首頁 > 新聞 > 國(guó)內(nèi) >
     首頁 > 新聞 > 國(guó)內(nèi) >

    極限元語音合成為「有聲讀物」提供高質(zhì)量的情感合成音

    2018-11-05 17:01:05   作者:   來源:CTI論壇   評(píng)論:0  點(diǎn)擊:


      據(jù)中國(guó)新聞出版研究院數(shù)據(jù)顯示,2017年中國(guó)成年人的聽書率為22.8%,越來越多的人習(xí)慣于用耳朵聽而不是用眼睛看,有聲閱讀正在成為未來閱讀的新形式。生活節(jié)奏的加快,上班族習(xí)慣了通勤路上或者碎步化時(shí)間來收聽消息,所以能夠收聽新聞資訊、滿足閱讀需求的音頻類平臺(tái)、APP越來越受大眾喜歡。
      聲音作為有聲閱讀中重要環(huán)節(jié),是如何實(shí)現(xiàn)的?
      傳統(tǒng)的聲音獲取可以通過找專業(yè)的聲優(yōu)進(jìn)行錄音或配音,而互聯(lián)網(wǎng)信息瞬息萬變,錄制的速度可能趕不上信息變化的速度,同時(shí)海量的內(nèi)容信息通過錄音工作量大且成本高,而人工智能技術(shù)的發(fā)展,語音合成技術(shù)改變了這一難題。
      語音合成技術(shù),從源頭解決聲音輸出的方式
      極限元的語音合成技術(shù)采用國(guó)際先進(jìn)的數(shù)據(jù)驅(qū)動(dòng)技術(shù),利用精心設(shè)計(jì)的語音語料庫(kù)進(jìn)行聲學(xué)模型和文本處理模型的訓(xùn)練,得到的模型深度挖掘了語音語言特性,合成的語音清晰、自然、親切、具有高表現(xiàn)力,媲美真人發(fā)聲。
      極限元的語音合成技術(shù)能夠?qū)崿F(xiàn)有聲閱讀下的多種平臺(tái)多種場(chǎng)景的應(yīng)用,如提供新聞資訊播報(bào)平臺(tái)、小說詩歌閱讀APP、音頻公眾號(hào)、智能音箱等。
      適配于多用戶多場(chǎng)景下的“閱讀”體驗(yàn)
      在面對(duì)多種人群多種閱讀內(nèi)容形式時(shí),單一的合成語音已經(jīng)不能滿足需求,極限元語音合成能夠提供各類型男聲、女生及童聲。
      還可根據(jù)用戶需求定制個(gè)性化音色服務(wù),如:林志玲的嗲氣十足、郭德綱幽默逗趣、游戲動(dòng)漫角色聲、各類方言等。極限元定制化語音合成支持錄音人選型、錄音采集、語料標(biāo)注,還能實(shí)現(xiàn)模型迭代訓(xùn)練、合成引擎優(yōu)化,支持在線、離線模式,適用于多種平臺(tái)。
    極限元語音合成為「有聲讀物」提供高質(zhì)量的情感合成音
      極限元語音合成技術(shù)優(yōu)勢(shì)體現(xiàn)
      數(shù)字、符號(hào)在生活中無處不在,同樣也充斥在閱讀的文本中,那么不同的數(shù)字,符號(hào)代表不同的意思,該如何處理呢?極限元語音合成技術(shù)能夠根據(jù)數(shù)字的上下文語境,做出智能判斷,以確保朗讀的正確性,例如10:12,可以表示十點(diǎn)十二分,也可能是比分十比十二,這就需要根據(jù)其上下文語境進(jìn)行判斷。
      而對(duì)于符號(hào),極限元語音合成技術(shù)能正確判斷這些符號(hào)的讀法,以及其符號(hào)與相鄰文本(數(shù)字)朗讀的先后順序。比如RMB100讀作“100元人民幣”,40%-50%讀作“百分之四十到百分之五十”。
      語音合成技術(shù)中,讓聲音富有情感和表現(xiàn)力,一直是語音合成的一大難點(diǎn),而極限元為了保證合成語音真實(shí)、自然、富有情感,適用于多種場(chǎng)景下,積極地與國(guó)際接軌。其創(chuàng)始團(tuán)隊(duì)源自中科院自動(dòng)化研究所并成立“智能交互聯(lián)合實(shí)驗(yàn)室”,號(hào)稱語音合成界的“黃埔軍校”;在人工智能領(lǐng)域有20多年技術(shù)積累,在國(guó)際會(huì)議和期刊上發(fā)表論文400余篇,申請(qǐng)語音及音頻領(lǐng)域?qū)@?00余項(xiàng);作為負(fù)責(zé)人、科研骨干參與多項(xiàng)國(guó)家自然基金項(xiàng)目、國(guó)家863項(xiàng)目和國(guó)家重點(diǎn)研發(fā)計(jì)劃等項(xiàng)目,獲得多媒體情感競(jìng)賽第二名、北京市自然科學(xué)進(jìn)步二等獎(jiǎng)、中國(guó)專利獎(jiǎng)優(yōu)秀獎(jiǎng)、北京科技進(jìn)步獎(jiǎng)、Eurospeech大會(huì)獎(jiǎng)等多種獎(jiǎng)項(xiàng)。
     
    【免責(zé)聲明】本文僅代表作者本人觀點(diǎn),與CTI論壇無關(guān)。CTI論壇對(duì)文中陳述、觀點(diǎn)判斷保持中立,不對(duì)所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請(qǐng)讀者僅作參考,并請(qǐng)自行承擔(dān)全部責(zé)任。

    專題

    亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 平江县| 错那县| 蒙城县| 同德县| 城固县| 乃东县| 铅山县| 松溪县| 思茅市| 五常市| 南乐县| 思南县| 遵化市| 桐庐县| 海南省| 西丰县| 来凤县| 宝清县| 尚志市| 当阳市| 西昌市| 文化| 河曲县| 晋城| 交口县| 抚远县| 阳曲县| 泸水县| 罗田县| 金寨县| 延边| 盐津县| 临颍县| 长春市| 新宁县| 寿宁县| 岗巴县| 静安区| 夏津县| 博湖县| 河南省| http://444 http://444 http://444 http://444 http://444 http://444