• <strike id="fdgpu"><input id="fdgpu"></input></strike>
    <label id="fdgpu"></label>
    <s id="fdgpu"><code id="fdgpu"></code></s>

  • <label id="fdgpu"></label>
  • <span id="fdgpu"><u id="fdgpu"></u></span>

    <s id="fdgpu"><sub id="fdgpu"></sub></s>
    您當前的位置是:  首頁(yè) > 資訊 > 國內 >
     首頁(yè) > 資訊 > 國內 >

    思必馳高自然度可定制的語(yǔ)音合成(TTS)技術(shù),如何練成的 ?

    2021-06-05 10:34:02   作者:   來(lái)源:CTI論壇   評論:0  點(diǎn)擊:


      語(yǔ)音合成(Text to Speech,TTS)又稱(chēng)文本語(yǔ)音轉換技術(shù),顧名思義,是把文本信息轉化成語(yǔ)音信息。它是對話(huà)式人工智能的最后一環(huán),也是關(guān)鍵一環(huán),它的效果直接影響著(zhù)人機語(yǔ)音交互的體驗。
      思必馳作為國內領(lǐng)先的對話(huà)式人工智能平臺公司,它的語(yǔ)音合成技術(shù)表現究竟如何?
      語(yǔ)音合成的“前世今生”
      人的語(yǔ)音,本質(zhì)上是發(fā)音器官震動(dòng),產(chǎn)生聲波傳出。模仿人聲,最古老的方法是使用樂(lè )器。到19世紀,就可以用機械方法產(chǎn)生語(yǔ)音了。那時(shí),科學(xué)家們會(huì )制作出一些精巧的氣囊和風(fēng)箱去搭建發(fā)聲系統,合成出一些元音和單音。

    人類(lèi)發(fā)音示意圖
      進(jìn)入電子時(shí)代的1939年,貝爾實(shí)驗室H·杜德利制作出第一臺電子合成器,這是用共振峰原理制作的語(yǔ)音合成器,該技術(shù)使用固定頻率,以電子復制我們改變口型時(shí)所發(fā)出的元音聲,也這正是英國劍橋大學(xué)著(zhù)名物理學(xué)家斯蒂芬·霍金教授所使用的聲音合成器。
      上世紀90年代,隨著(zhù)計算和存儲能力大幅度提升,基于大語(yǔ)料庫的單元挑選與波形拼接合成方法出現,可以合成出高質(zhì)量的自然人語(yǔ)音。

    語(yǔ)音合成技術(shù)演變
      進(jìn)入21世紀,隨著(zhù)深度學(xué)習技術(shù)的興起和快速發(fā)展,以語(yǔ)音合成為代表的語(yǔ)音處理技術(shù)得到了極大的飛躍。神經(jīng)網(wǎng)絡(luò )語(yǔ)音合成在近幾年來(lái)取得了顯著(zhù)突破,合成?的?質(zhì)和?然度越來(lái)越?,運?速度也越來(lái)越快。思必馳目前所使用的,也正是這種方法。
      思必馳TTS,魅力何在?
      早在2007年于英國劍橋大學(xué)創(chuàng )立時(shí),思必馳關(guān)于語(yǔ)音合成技術(shù)研究就已開(kāi)啟,該項工作由思必馳聯(lián)合創(chuàng )始人兼首席科學(xué)家、上海交通大學(xué)教授俞凱領(lǐng)頭。
      語(yǔ)音合成系統主要分為文本處理、聲學(xué)模型、聲碼器三個(gè)部分。文本處理負責對文本進(jìn)行轉寫(xiě)和phoneme序列轉換;聲學(xué)模型使用深度神經(jīng)網(wǎng)絡(luò ),可以在文本特征與聲學(xué)特征之間學(xué)習到更復雜的非線(xiàn)性關(guān)系;聲碼器負責將聲學(xué)模型輸出的聲學(xué)特征,通過(guò)卷積運算,轉換成音頻。
      經(jīng)過(guò)10多年的研究積累,思必馳在建模方法上,涵蓋了從傳統的統計參數模型到最新的基于神經(jīng)網(wǎng)絡(luò )的方法;對聲碼器的研究,涵蓋了從傳統的基于信號處理的方法到最新的基于神經(jīng)網(wǎng)絡(luò )的方法。
      語(yǔ)音合成的質(zhì)量與效果,既有賴(lài)于語(yǔ)音廠(chǎng)商的算法模型,還取決于音頻語(yǔ)料的質(zhì)量,即數據質(zhì)量。思必馳有著(zhù)豐富的聲優(yōu)資源以及聲優(yōu)挑選的經(jīng)驗,在蘇州建設有專(zhuān)業(yè)錄?棚并與國內多個(gè)城市的錄?棚有著(zhù)長(cháng)久合作關(guān)系。與此同時(shí),思必馳數據團隊也對數據標注有著(zhù)嚴格的質(zhì)量把控。
      

    位于思必馳蘇州總部的專(zhuān)業(yè)錄音棚
      經(jīng)過(guò)多年的技術(shù)積累,思必馳已逐步形成了?套成熟的技術(shù)?案,業(yè)務(wù)涵蓋了?數據語(yǔ)?定制、?數據快速定制、聲?克隆、歌聲合成、?語(yǔ)種合成、??合成、情感合成等,可選公有云、私有云以及離線(xiàn)三種部署?式,經(jīng)典??可在思必馳官?實(shí)時(shí)體驗。
      2017年、2020年,思必馳還先后參與國家標準《中文語(yǔ)音合成互聯(lián)網(wǎng)服務(wù)接口規范》與行業(yè)標準《中文語(yǔ)音合成服務(wù)系統評估規范》的制定,并成為全國首批通過(guò)評估測評的公司之一,獲得“TTS-4S(Standard Similarity Scene System)服務(wù)證書(shū)”。該測評從合成質(zhì)量、定制能力、場(chǎng)景表現力和系統安全可靠等維度,全面評估合成水平和服務(wù)能力。
      
    2019年11月,思必馳首批通過(guò)“中文語(yǔ)音合成水平測試”
      未來(lái)世界,百“聲”爭鳴
      為能快速提供語(yǔ)音合成定制服務(wù),思必馳全程提供音色選擇、錄音指導、音頻處理、模型訓練、服務(wù)部署等專(zhuān)業(yè)服務(wù),賦予產(chǎn)品開(kāi)口講話(huà)的能?。
      截至目前,思必馳語(yǔ)音合成已建設的??庫內包含音色接近200個(gè),涵蓋多種??、多種風(fēng)格,以及各個(gè)年齡層次。
      思必馳語(yǔ)音合成服務(wù),也已在車(chē)載、?電、機器?、智能客服等諸多領(lǐng)域成功落地,為眾多終端產(chǎn)品賦予聲的魅力,使得萬(wàn)物皆可溝通,并逐漸走入人們的工作與生活。
      當你在家里“躺平”,來(lái)自如影智能的語(yǔ)音管家“Edison”,用他溫暖、紳士的聲音(文章開(kāi)頭的音頻A),為你帶來(lái)踏實(shí)與慰藉;當你在愛(ài)車(chē)中馳騁,車(chē)蘿卜的語(yǔ)音助理“蘿卜”清脆、簡(jiǎn)明的聲音,如同車(chē)水馬龍路途中的一股清流;當你接起順豐95338服務(wù)熱線(xiàn)的外呼電話(huà),智能客服“豐小蜜”親切又不失嚴謹的聲音,配合高效的工作能力,帶給你最省心省力的服務(wù)體驗……
      鏡頭切換到泛娛樂(lè )領(lǐng)域,思必馳團隊打造的“小馳機器人”在央視《機智過(guò)人》中,現場(chǎng)用撒貝寧的聲音生成了一曲《好久不見(jiàn)》。在《經(jīng)典詠流傳》中,思必馳攜手欄目組共同推出 “讀詩(shī)成曲”線(xiàn)上互動(dòng)小工具,提供實(shí)時(shí)讀詩(shī)成曲的能?。用戶(hù)僅需讀幾句簡(jiǎn)單的詩(shī)詞,便可快速生成有腔有韻的歌聲,互動(dòng)總量超過(guò)821萬(wàn)人次。
      
    思必馳聯(lián)合創(chuàng )始人兼首席科學(xué)家俞凱參與節目錄制
      在個(gè)性化定制上,思必馳不僅可以提供普通話(huà)定制、歌聲定制,還可以通過(guò)遷移學(xué)習方法,提供更高難度的方言、小語(yǔ)種TTS定制,如粵語(yǔ)、上海語(yǔ)、四川話(huà)、?東話(huà)、東北話(huà)、德語(yǔ)、法語(yǔ)等。
      而思必馳的情感合成技術(shù),則賦予美妙音色豐沛的情緒,讓聲音更具表現力與感染力。
      此外,思必馳聲音復刻技術(shù)也已在斑馬智能、愛(ài)馳汽車(chē)、嵐圖汽車(chē)、仙豆智能等車(chē)聯(lián)網(wǎng)客戶(hù)以及IoT領(lǐng)域落地,僅需錄音20句話(huà)約400漢字,10分鐘之內便可以完成模型生產(chǎn),MOS 合成音/錄音達到90%,相似度合成音/錄音達到80%。
      人類(lèi)的聲音,是人類(lèi)語(yǔ)言的物質(zhì)外殼,卻承載著(zhù)重要的信息和真摯的情感,擁有著(zhù)無(wú)窮的魅力。人工智能突飛猛進(jìn)地發(fā)展正不斷催化人機交互方式的巨變,“萬(wàn)物可溝通、萬(wàn)事可打理”的語(yǔ)音互聯(lián)未來(lái)世界,正加速到來(lái)……

    【免責聲明】本文僅代表作者本人觀(guān)點(diǎn),與CTI論壇無(wú)關(guān)。CTI論壇對文中陳述、觀(guān)點(diǎn)判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。

    專(zhuān)題

    CTI論壇會(huì )員企業(yè)

    亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 吉安县| 夏邑县| 宁陵县| 牡丹江市| 林口县| 西平县| 巴塘县| 剑河县| 西畴县| 岳池县| 太白县| 平乐县| 平远县| 济源市| 绥芬河市| 章丘市| 大安市| 突泉县| 旬邑县| 清河县| 思南县| 南通市| 丹凤县| 河西区| 于都县| 邛崃市| 仁寿县| 车致| 河间市| 修水县| 兴安县| 衡阳县| 合山市| 高密市| 六安市| 武夷山市| 灵山县| 万州区| 潢川县| 巴林左旗| 宜兰市| http://444 http://444 http://444 http://444 http://444 http://444