• <strike id="fdgpu"><input id="fdgpu"></input></strike>
    <label id="fdgpu"></label>
    <s id="fdgpu"><code id="fdgpu"></code></s>

  • <label id="fdgpu"></label>
  • <span id="fdgpu"><u id="fdgpu"></u></span>

    <s id="fdgpu"><sub id="fdgpu"></sub></s>
    您當(dāng)前的位置是:  首頁 > 新聞 > 國際 >
     首頁 > 新聞 > 國際 >

    語音合成技術(shù)已接近人類語言水平

    --DeepMind最新AI進(jìn)展

    2016-09-13 15:02:26   作者:   來源:雷鋒網(wǎng)   評論:0  點(diǎn)擊:


      AlphaGo背后的谷歌人工智能部門DeepMind近日披露最新研究成果,其正在設(shè)法研發(fā)出更為接近人類實際語言水平的機(jī)器語音合成系統(tǒng)。據(jù)說,這個被稱為Wave Net的新型人工智能系統(tǒng)是一種深層神經(jīng)網(wǎng)絡(luò),能通過抽樣現(xiàn)實中的人類語言形成原始音頻波形,最后達(dá)到生成語音的目的。 
      從面向廣大英語和普通話聽眾的測試中發(fā)現(xiàn),WaveNet的表現(xiàn)已經(jīng)優(yōu)于現(xiàn)有的語音合成系統(tǒng),但結(jié)果還是略遜于人類真正的語言水平。
      目前的語音合成系統(tǒng)只有兩種工作方式:第一種是截取實際的講話錄音,然后打碎重組成新的語音——有點(diǎn)像綁架電話慣用的手段;另一種是依賴電腦合成,通過編程生成語音,這意味著它不需要預(yù)先錄制好語音材料,但是聽起來的效果并不好,很像機(jī)器人。
      另一方面,WaveNet仍然使用真實的語音輸入,但通過學(xué)習(xí)和模仿來合成語音,而不是將其打破重組。項目的研究人員寫道:“單單一個WaveNet就能以相同的保真度捕捉記錄下各個不同說話者的特點(diǎn),并且可以任意切換聲音。”
      同樣令人印象深刻的是,它可以利用諸如唇部運(yùn)動和人工呼吸來模擬語調(diào)、情緒和口音。如果這還不夠,WaveNet也許還能像鋼琴一樣彈奏樂曲,研究人員只需提供一些經(jīng)典片段,它就能創(chuàng)作出自己的作品。
      DeepMind在Twitter發(fā)文稱:“讓人類和機(jī)器對話是人機(jī)交互領(lǐng)域長久以來的夢想”

    專題

    亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 鄢陵县| 太白县| 濮阳县| 东兰县| 三穗县| 额尔古纳市| 郁南县| 斗六市| 同心县| 蓬安县| 准格尔旗| 平果县| 多伦县| 临汾市| 阜平县| 旅游| 皮山县| 嘉义市| 永丰县| 崇州市| 伊吾县| 定兴县| 宁南县| 保定市| 南昌县| 体育| 新昌县| 荔波县| 昔阳县| 嘉善县| 栖霞市| 荔浦县| 陇南市| 泾阳县| 磴口县| 永平县| 平谷区| 姚安县| 沁源县| 安塞县| 中牟县| http://444 http://444 http://444 http://444 http://444 http://444