12月2日~8日,第十屆中國國際新媒體短片節在深圳舉辦。AI數字人「陸川導演」與國內首個(gè)AI虛擬偶像「子書(shū)美」與觀(guān)眾見(jiàn)面,可實(shí)現面對面互動(dòng)交流,為觀(guān)眾帶來(lái)打破虛擬空間和現實(shí)空間次元壁的實(shí)時(shí)實(shí)感交流互動(dòng)體驗。
虛擬形象不僅要看的見(jiàn),其高辨識度的「嗓音」更是重要的聲音名片。值得一提的是,這兩位虛擬形象的「造聲」,均由思必馳提供的技術(shù)支持。
其中,AI數字人陸川導演「造聲」是基于思必馳神經(jīng)網(wǎng)絡(luò )建立的語(yǔ)音合成學(xué)習模型,將采集錄制的陸川導演本人的音頻進(jìn)行訓練學(xué)習,合成出了以假亂真的AI數字人陸川導演的聲音。
與復刻AI數字人陸川導演的嗓音不同,子書(shū)美的合成音需要「憑空創(chuàng )造」。思必馳結合子書(shū)美形象性格與人設屬性,為其量身打造了一款知性?xún)?yōu)雅的合成音。
語(yǔ)音合成技術(shù)也是當今國際人機交互領(lǐng)域競相研究的熱門(mén)技術(shù)之一,合成音的應用極大減少了人力錄音的成本,成為了智能機器的標配能力,幫助廠(chǎng)商打造voice-IP。
思必馳提供數十種語(yǔ)音合成預設方案作為音色選擇,同時(shí)還可以對合成音進(jìn)行大數據深度定制與小數據快速定制服務(wù)。
此外,關(guān)于語(yǔ)音合成的效果,一方面依賴(lài)算法模型,另一方面,依賴(lài)于用戶(hù)提供音頻語(yǔ)料的質(zhì)量。因此在音頻語(yǔ)料的采集上,建議在安靜的環(huán)境下進(jìn)行,說(shuō)話(huà)語(yǔ)速勻速、聲音大小適當、音色盡量一致、不要噴麥。語(yǔ)料音頻質(zhì)量越高,合成音效果自然越貼近真實(shí)人聲。
語(yǔ)音合成,好比AI時(shí)代的活字印刷術(shù),創(chuàng )建一套合成模型,便可以「印出」你想要的聲音。語(yǔ)音合成出的聲音,以前所未有的方式改變著(zhù)信息傳播交流的形式。