《聲臨其境》節目里,張含韻用不同情緒模仿皮卡丘的超萌配音,讓人印象深刻。網(wǎng)友坦言,"太可愛(ài)了!真想把張含韻抱回家。"
誰(shuí)的童年記憶里沒(méi)有一只皮卡丘呢?
這個(gè)擁有軟萌叫聲,萌萌噠外表的黃色大老鼠,可謂征服了無(wú)數觀(guān)眾,不但被周深、楊超越、宋茜等明星紛紛模仿,化身明星界的動(dòng)漫寵兒,就連很多抖音玩家也喜歡為皮卡丘配音,不同的情感表達,盡顯靈動(dòng)可愛(ài)。
相信大家也看過(guò)不少皮卡丘聲音配音秀,如果換成人工智能,讓 AI 用不同情感的聲音來(lái)演繹皮卡丘的叫聲,會(huì )是怎樣的 "皮卡~皮卡" 呢?
讓我們來(lái)一同感受下~
(以上視頻僅用于情感合成技術(shù)應用示意)
影視來(lái)源:《皮卡丘大偵探》
bgm | Pen Pineapple Apple Pen -DJ Rikituki
視頻中皮卡丘所發(fā)出的喜、怒、哀、懼配音都是由人工智能完成。可以明顯感受到 AI 版皮卡丘 "說(shuō)" 的每一句聲音情感的變化,當想要表達高興的情緒時(shí),AI 則會(huì )展現歡快喜悅的聲音;表達悲傷的情緒時(shí),則顯現憂(yōu)愁凄涼的聲音;表達憤怒的情緒時(shí),則是郁悶生氣的聲音;表達害怕的情緒時(shí),則是慌張驚恐的聲音。
這背后運用的技術(shù)就是 AI 情感合成技術(shù)。
什么是情感合成?可以簡(jiǎn)單理解為,賦予機器語(yǔ)音情感與表現力,讓機器具有人情味。我們可以想象一下,當我們與智能家具、車(chē)載、機器人、語(yǔ)音助手等智能體交流時(shí),它不僅說(shuō)話(huà)效果接近真人,而且富有情感。
比如它可以用高興的聲音、悲傷等不同情緒起伏的聲音來(lái)和你交流,你會(huì )明顯感覺(jué)到,它今天心情挺不錯,它好像微微有些不高興,你還會(huì )覺(jué)得它是冷冰冰的機器嗎?會(huì )不會(huì )更加愿意和這些人工智能進(jìn)一步互動(dòng)與相處呢?
上述皮卡丘配音視頻中,為大家展示的是情感合成技術(shù)在泛娛樂(lè )場(chǎng)景下的應用,如今短視頻的火爆,更是推動(dòng)了 UGC+ 時(shí)代的到來(lái),當大量的內容制作需要配音完成時(shí),有許多創(chuàng )作者開(kāi)始將語(yǔ)音合成結合到內容創(chuàng )作中,高效提高內容制作效率,當語(yǔ)音具有一定情感表達能力后,內容也會(huì )變得更加生動(dòng)和有趣。
此外,虛擬形象近年來(lái)發(fā)展勢頭也逐漸迅猛,例如虛擬主持人、虛擬偶像,能夠具有一定的情感表現能力,相信也會(huì )為虛擬形象市場(chǎng)帶來(lái)很大的改變。
另外,有聲讀物的廣泛應用,由于故事、小說(shuō)等文本素材包含大量角色人物,通過(guò)不同情感合成聲音配合文本內容,在展現文學(xué)小說(shuō)人物的的特點(diǎn)同時(shí),給用戶(hù)營(yíng)造引人入勝沉浸感體驗。比如下面這段故事《老鼠去海邊》。
讓我們來(lái)聽(tīng)下 AI 用不同情感閱讀:
(以上文本閱讀僅用于情感合成技術(shù)應用示意)
不同的情感表達是存在明顯差別的,我們能從聲音里明顯感受到情緒的變化。
目前,標貝科技已推出可商業(yè)化落地的 AI情感合成技術(shù)解決方案,主打高音質(zhì)、高自然度與多情感,可以呈現出高興、憤怒、恐懼、哀嘆、悲傷等六大經(jīng)典情感類(lèi)型,支持客戶(hù)定制化情感語(yǔ)音合成解決方案需求。
情感合成作為一項技術(shù),離不開(kāi)神經(jīng)網(wǎng)絡(luò )的三要素:算法、算力和數據,其中數據是打造自然、高表現力的聲音效果重要臂力之一。
在數據方面,標貝擁有包括識別自有庫,合成自有庫,歌曲音庫、明星 IP 音庫、以及方言音庫等在內的多種不同類(lèi)型的語(yǔ)音數據庫,語(yǔ)音數據時(shí)長(cháng)累計超過(guò)十萬(wàn)小時(shí),這些數據有很多應用到了我們的情感合成實(shí)踐當中。(點(diǎn)擊了解標貝情感數據庫)

標貝科技致力于為智能客服、智能機器人、智能家居、車(chē)載導航、有聲讀物等相關(guān)應用場(chǎng)景提供更加優(yōu)質(zhì)的語(yǔ)音技術(shù)服務(wù),為用戶(hù)提供高質(zhì)量的智能交互體驗。
歡迎對以上情感合成技術(shù)解決方案感興趣的行業(yè)伙伴與我們聯(lián)系marketing@data-baker.com