用戶(hù):對的,請問(wèn)有什么事嗎?(糟糕,這低沉且磁性的聲音是我喜歡的)
客服:哈~看到您修改了地址,那按照最新地址給您派送可以嗎?
用戶(hù):好的······可以要一下您的私人聯(lián)系方式嗎?(害羞······)
客服:非常抱歉,我是智能客服哦~快遞將會(huì )按照新的地址給您派送,再見(jiàn)。
用戶(hù):額,好的,再見(jiàn)。(震驚!智能客服的聲音都這么驚艷了嗎?)
不得不說(shuō),在科技飛速發(fā)展的今天,智能語(yǔ)音無(wú)處不在,他們或溫柔、或磁性、或俏皮,用富含各種情感色彩的語(yǔ)音服務(wù)著(zhù)我們的生活。
語(yǔ)音合成技術(shù)為機器人裝上了嘴巴,而音色合成則豐富了機器的情感表達。那么,在時(shí)間就是成本的情況下,如何簡(jiǎn)單、快速、低成本打造適合自己業(yè)務(wù)的專(zhuān)屬音色?
思必馳推出的發(fā)音人音色定制平臺,助力用戶(hù)快速、高效、自主完成語(yǔ)音合成音色模型定制,降低語(yǔ)音合成定制門(mén)檻。用戶(hù)只需要根據自身場(chǎng)景需要,上傳一定量符合規定標準的有效音頻,即可一站式完成自動(dòng)標注、模型定制、質(zhì)量評測等流程,高度模擬發(fā)音人的音色、韻律和停頓習慣,獲得所需音色。
1、音色合成,讓人機溝通更有溫度
智能語(yǔ)音作為人類(lèi)與機器溝通的途徑之一,廣泛應用于生活和工作場(chǎng)景。而不同情感的音色,為人機交互賦予了情感溫度。
思必馳發(fā)音人音色定制平臺支持定制中英文、成人男女、兒童以及幽默、嚴肅、甜美、中性等各種情感風(fēng)格的音色,可滿(mǎn)足客戶(hù)在消費電子產(chǎn)品、明星動(dòng)漫熱門(mén)IP、虛擬數字人、智能客服、有聲讀物、新聞播報等多個(gè)領(lǐng)域的應用需求。
智能管家定制男音
故事機定制女音
繪本閱讀定制童音
2、低門(mén)檻,大制作,快速定制音色
用戶(hù)使用思必馳發(fā)音人音色定制平臺,最快數小時(shí)即可獲得專(zhuān)屬音色,那么,思必馳是如何做到這一點(diǎn)的呢?
- 在數據采集方面,用戶(hù)可按照思必馳錄音規范進(jìn)行數據采集,保證數據質(zhì)量;
- 在數據標注方面,可選擇思必馳“自動(dòng)標注”技術(shù),一小時(shí)音頻標注時(shí)間可壓縮至數分鐘,且不會(huì )對合成效果產(chǎn)生明顯影響,自然度MOS損失在0~0.2內;
- 在模型訓練方面,思必馳構建了快速高質(zhì)量的模型自訓練流程,可自動(dòng)進(jìn)行數據特征提取和模型訓練,結合大數據預訓練和遷移學(xué)習技術(shù),最快數小時(shí)即可完成一個(gè)音色的模型訓練流程。
豐富而具有差異化的平臺服務(wù),讓思必馳發(fā)音人音色定制平臺具有簡(jiǎn)單快捷、交付能力強、數據門(mén)檻低、定制成本低四大優(yōu)勢:

- 簡(jiǎn)單快捷
將之前繁瑣的流程通過(guò)平臺化的方式實(shí)現,僅需要進(jìn)行基礎的配置,其它標注、訓練等流程即可一站式完成,效率大大提高。
- 交付能力強
不再受限于研發(fā)人力,沒(méi)有技術(shù)背景的用戶(hù)也可快速使用平臺,僅需數小時(shí)即可完成音色定制。
- 數據門(mén)檻低
只需要少量的音頻即可訓練出自然、情感豐富、還原度高的音色。
- 定制成本低
減少了標注、工程化等成本,定制成本大大降低。
思必馳支持公有云、混合云、私有化、終端離線(xiàn)等多種部署方式,讓用戶(hù)的數據更安全。
此外,思必馳DUI開(kāi)放平臺音色庫還擁有男聲、女聲、童聲等百余種音色,可以直接滿(mǎn)足客戶(hù)在智能車(chē)載、智能家居、智能客服等多個(gè)領(lǐng)域的應用需求,已服務(wù)于央視網(wǎng)、騰訊、美的、海爾等多家客戶(hù)。
3、技術(shù)沉淀,鑄就AI實(shí)力
作為國內專(zhuān)業(yè)的對話(huà)式人工智能平臺公司,思必馳曾先后參與國家標準《中文語(yǔ)音合成互聯(lián)網(wǎng)服務(wù)接口規范》與行業(yè)標準《中文語(yǔ)音合成服務(wù)系統評估規范》的制定,并成為全國首批通過(guò)評估測評的公司之一。
思必馳的語(yǔ)音合成技術(shù)涵蓋了大數據語(yǔ)音定制、小數據快速定制、歌聲合成、小語(yǔ)種合成、方言合成、情感合成。語(yǔ)音合成技術(shù)得到業(yè)內肯定,思必馳智能中文語(yǔ)音合成系統通過(guò)了AIIA組織的中文語(yǔ)音合成水平測試。


近年,基于深度神經(jīng)網(wǎng)絡(luò )為基礎的語(yǔ)音合成成為主流,語(yǔ)音合成質(zhì)量有了巨大提升。路漫漫其修遠兮,思必馳將持續加大技術(shù)研究,為大家帶來(lái)更自然、更真實(shí)、更個(gè)性、更低成本的語(yǔ)音合成服務(wù)。