個性化語音合成功能產(chǎn)品即將走向?qū)嵱没?/font>
2011/01/28
所謂個性化語音合成,就是通過身邊的一些錄音設備,錄取某個人的某些語音片段后,讓TTS(Text To Speech)語音技術(shù),合成出像某個特定人的說話語音,說話方式,和說話情感。目前國內(nèi)外的語音合成技術(shù)—即讓機器像人類說話的技術(shù),由于使用高標準、高成本的大規(guī)模音庫制作流程,已經(jīng)日臻成熟,可以合成出自然度很高、音色很好的文本語音,并且在工業(yè)級的行業(yè)領(lǐng)域應用益愈廣泛。同時,如何用盡量小的成本代價,教會機器模仿您的聲音,或者合成出像某個知名人士的特色聲音,即所謂的個性化語音合成技術(shù),也正在日益走向?qū)嵱没,可以說,未來十年將是個性化語音合成彰顯勃勃生機的時代。
個性化語音合成技術(shù),涉及到語音學方面許多現(xiàn)代發(fā)展起來的新技術(shù),包括:語音頻譜特征轉(zhuǎn)換技術(shù)、韻律特征轉(zhuǎn)換技術(shù)、和個性化參數(shù)自適應技術(shù)等,目前宇音天下公司擬在新研制的中文語音合成芯片,采取個性化語音合成技術(shù)的最新成果和技術(shù)路線,以研制在物聯(lián)網(wǎng)和智能家居時代,更符合時代應用需求的個性化語音合成芯片。
個性化語音合成,與人們常說的個性化語音生成雖只有一字之差,但內(nèi)涵卻具有較大的差別,主要是:個性化語音生成,不僅包括個性化語音合成技術(shù),還包括可以對語音進行實時轉(zhuǎn)換的個性化語音轉(zhuǎn)換,和實時語音變換等技術(shù);蛘哒f,個性化語音合成只是個性化語音生成的一個技術(shù)子模塊,強調(diào)的是由文字轉(zhuǎn)換成目標說話人的合成語音。
個性化語音合成技術(shù),未來可以大量應用于電腦、手機、電子書、MP3、車載導航、車載電話、智能家居、智能交通、虛擬機器人、車聯(lián)網(wǎng)、物聯(lián)網(wǎng)、等豐富多彩的智能化電子終端領(lǐng)域,應用場景十分豐富,具有重要的娛樂實用價值。例如讓信息終端合成出:著名笑星葛優(yōu)的聲音、奧運冠軍何雯娜的聲音、親善大使李連杰的聲音等等,讓他們?yōu)槲覀冞M行語音導航,讓我們身邊的生活更加多姿多彩。
CTI論壇編輯
相關(guān)閱讀:
富宁县|
陵水|
余姚市|
鄢陵县|
邢台县|
饶河县|
昭觉县|
石嘴山市|
静乐县|
扶风县|
江阴市|
阳新县|
长岭县|
嘉兴市|
察哈|
鄂托克旗|
永福县|
临泉县|
鄂托克前旗|
县级市|
汝南县|
辉县市|
大英县|
陆良县|
项城市|
郎溪县|
重庆市|
墨脱县|
广昌县|
镶黄旗|
蓝山县|
蓬安县|
自贡市|
彭阳县|
海晏县|
三明市|
名山县|
柏乡县|
正蓝旗|
枣强县|
四平市|