• <strike id="fdgpu"><input id="fdgpu"></input></strike>
    <label id="fdgpu"></label>
    <s id="fdgpu"><code id="fdgpu"></code></s>

  • <label id="fdgpu"></label>
  • <span id="fdgpu"><u id="fdgpu"></u></span>

    <s id="fdgpu"><sub id="fdgpu"></sub></s>
    您當(dāng)前的位置是:  首頁 > 資訊 > 國內(nèi) >
     首頁 > 資訊 > 國內(nèi) >

    標(biāo)貝科技語音合成技術(shù)再升級,傾力打造AI語音極致體驗

    2021-03-30 11:16:00   作者:   來源:CTI論壇   評論:0  點擊:


      2020年防疫常態(tài)化的要求下,遠(yuǎn)程會議、在線教育、在線辦公已成為人們生活中的標(biāo)配,智能語音交互應(yīng)用加速落地,智能語音交互技術(shù)規(guī)模化發(fā)展由此得到了極大的推動。
      為了賦予合成聲音更豐富的情感表現(xiàn)力和個性化,打造AI語音極致體驗,近期,標(biāo)貝科技再一次進(jìn)行語音合成技術(shù)“升級改造”,于3月25日完成TTS3.0版本的驗收,正式上線標(biāo)貝科技官方網(wǎng)站。
      01 全新技術(shù)升級,讓AI聲音更富表現(xiàn)力
      1、發(fā)音效果顯著提升
      標(biāo)貝科技升級的TTS3.0技術(shù)采用全新的非自回歸聲學(xué)模型,在發(fā)音效果上有了顯著提升,對不同角色和情感表達(dá)的判斷更加準(zhǔn)確,輸出的音質(zhì)穩(wěn)定、清晰、順暢,音色富有表現(xiàn)力;聲碼器則采用GAN結(jié)構(gòu),可以高效且真實的還原波形,增加了合成聲音的真實質(zhì)感。
      2、多音字、停頓更加準(zhǔn)確
      此外,標(biāo)貝科技TTS3.0在發(fā)音細(xì)節(jié)上也進(jìn)行了優(yōu)化。例如,基于Mask-basedModel神經(jīng)網(wǎng)絡(luò)多音字模型,對所有多音字進(jìn)行統(tǒng)一建模,提升了語音合成時多音字發(fā)音的準(zhǔn)確率;在韻律方面,采用多任務(wù)的神經(jīng)網(wǎng)絡(luò)模型,利用韻律間的層次關(guān)系,在同一個模型結(jié)構(gòu)下,對多個韻律等級進(jìn)行建模,對合成語音在高低音和停頓的處理更加自然和流暢。
      3、模型兼容
      標(biāo)貝科技本次TTS3.0使用了全新的聲學(xué)模型和聲碼器,同時,保持了對TTS2.0舊模型的全部兼容,最大程度地保證系統(tǒng)服務(wù)的無縫升級,減少老客戶升級帶來的開發(fā)成本。
      02 更多音色加持,助力語音場景快速落地
      此前,基于海量語音數(shù)據(jù)的優(yōu)勢,在TTS1.0、TTS2.0技術(shù)基礎(chǔ)上,標(biāo)貝科技已經(jīng)推出男聲、女聲、老人、童聲等多音色,中文、英文、中英混讀、小語種、方言等多語種的解決方案,并支持用戶個性化的需求定制,可以滿足大部分客戶在車載、有聲閱讀、智能客服、新聞媒體、影視解說等多領(lǐng)域應(yīng)用需求,并已與國內(nèi)外百余家企業(yè)客戶建立合作,服務(wù)項目累計超過500項。
      本次TTS3.0技術(shù)升級,標(biāo)貝科技經(jīng)過多次大規(guī)模產(chǎn)品體驗評測后,再次擴充音庫量及場景化方案。在官方網(wǎng)站正式上線了9大音色,包括童聲、青年男女生,深度覆蓋有聲閱讀、語音交互、智能客服等領(lǐng)域更多場景需求。
    圖:標(biāo)貝科技新音色列表
      與TTS1.0、TTS2.0相同,本次TTS3.0同樣支持SDK、流式/非流式API、MRCP協(xié)議等對接形式,接口同步/異步調(diào)用,且整體合成速度較之前提升了1.6倍,全效助力各開發(fā)者快速落地聲音場景應(yīng)用。
      03 豐富情感表達(dá),助推有聲閱讀創(chuàng)作
      近些年,我國有聲書市場發(fā)展迅速,各大音頻平臺,閱讀應(yīng)用、視頻網(wǎng)站甚至是傳統(tǒng)出版行業(yè)也都嘗試進(jìn)入有聲書市場。據(jù)相關(guān)資料顯示,2020年中國有聲書市場規(guī)模已達(dá)到了95.6億元,同比增長50.3%。5G時代的到來,有聲閱讀必將引起更大規(guī)模的爆發(fā)。
      標(biāo)貝科技TTS3.0結(jié)合最新的語音技術(shù)、海量的文本和聲學(xué)數(shù)據(jù)以及大規(guī)模計算能力,讓機器的聲音情感表現(xiàn)力更加真實自然,充分滿足當(dāng)下有聲閱讀場景的需求。
      比如有聲小說中,最難表達(dá)的人物情緒和對話,TTS3.0技術(shù)做到很多細(xì)節(jié)的處理,讓合成的聲音突出對話重音及語氣,讓人物情感表達(dá)更加細(xì)膩,猶如真人“配音”,使聽眾更直接明白小說情節(jié),進(jìn)一步享受聽覺“盛宴”。
    【試聽體驗】
    貝童
    文本來源:睡前故事《螞蟻士兵》
    貝茹
    文本來源:約翰·伯恩《穿條紋睡衣的男孩》
    貝明
      標(biāo)貝科技作為一家聚焦智能語音交互和AI數(shù)據(jù)服務(wù)的企業(yè),經(jīng)過五年的發(fā)展,現(xiàn)已推出了AI數(shù)字虛擬人、智能客服、智慧媒體等一站式解決方案;在產(chǎn)品方面,推出標(biāo)貝悅讀、恐龍貝克兩大C端產(chǎn)品,已經(jīng)實現(xiàn)從原有的單點語音技術(shù)服務(wù)升級至語音、圖像、虛擬形象等多技術(shù)模塊融合的行業(yè)解決方案。
      標(biāo)貝科技TTS3.0技術(shù)升級,迎合了語音合成發(fā)展的新趨勢,將智能語音應(yīng)用提速增效,實現(xiàn)用戶極致體驗新突破。未來,標(biāo)貝科技將繼續(xù)深耕智能語音技術(shù)研究與發(fā)展,為更多語音合成應(yīng)用場景提供服務(wù)。
    【免責(zé)聲明】本文僅代表作者本人觀點,與CTI論壇無關(guān)。CTI論壇對文中陳述、觀點判斷保持中立,不對所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔(dān)全部責(zé)任。

    專題

    CTI論壇會員企業(yè)

    亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 泰和县| 卢湾区| 蒙阴县| 固原市| 齐齐哈尔市| 武乡县| 铜鼓县| 岳池县| 探索| 吉林省| 建始县| 丰顺县| 钦州市| 永兴县| 汕头市| 济阳县| 遂昌县| 偏关县| 石嘴山市| 商城县| 穆棱市| 阿拉尔市| 宜川县| 韶关市| 黄浦区| 湛江市| 新源县| 高安市| 利川市| 崇左市| 丹寨县| 台中市| 固阳县| 固阳县| 内丘县| 仪征市| 会昌县| 恩平市| 太康县| 金湖县| 嘉荫县| http://444 http://444 http://444 http://444 http://444 http://444