11月1日,捷通華聲宣布推出新版靈云英文語(yǔ)音合成(TTS)技術(shù)。具有國際水準、擁有獨立自主知識產(chǎn)權的靈云英文TTS技術(shù)的推出,標志著(zhù)捷通華聲在發(fā)展多國語(yǔ)言TTS技術(shù)上取得了重大突破。捷通華聲此次推出最新靈云英文TTS,也是繼宣布推出最新靈云離線(xiàn)式語(yǔ)音識別(ASR)技術(shù)、靈云智能客戶(hù)服務(wù)系統全新升級之后又一重大突破。
語(yǔ)音合成即TTS(Text to Speech)技術(shù),又稱(chēng)文語(yǔ)轉換技術(shù),能將任意文本信息實(shí)時(shí)轉化為標準流暢的語(yǔ)音朗讀,簡(jiǎn)單講就是讓"機器開(kāi)口講話(huà)"。TTS技術(shù)涉及聲學(xué)、語(yǔ)言學(xué)、數字信號處理、計算機科學(xué)等多個(gè)學(xué)科技術(shù),是語(yǔ)言信息處理領(lǐng)域的一項前沿技術(shù)。通過(guò)TTS技術(shù),計算機可以在任何時(shí)候將任意文本“輕松”轉換成具有高自然度的語(yǔ)音,從而真正實(shí)現讓機器"像人一樣開(kāi)口說(shuō)話(huà)"。我國自上世紀80年代,開(kāi)始研究中文TTS技術(shù),因為起步晚,國內語(yǔ)音研究領(lǐng)域大多專(zhuān)注在中文語(yǔ)音研究與商品化進(jìn)程。
創(chuàng )建于2000年的北京捷通華聲語(yǔ)音技術(shù)有限公司,是國內最早從事中文TTS研究與應用的企業(yè),捷通華聲中文語(yǔ)音合成(TTS)技術(shù)在國內已處于絕對領(lǐng)先地位,市場(chǎng)占有率超過(guò)50%。全新升級后的英文TTS,能夠自動(dòng)識別并表現出合成文本中包含的各類(lèi)句式,合成效果更富表現力;優(yōu)化了分詞對特殊符號、韻律短語(yǔ)等內容的分析,確保合成的高準確度;改善了短語(yǔ)停頓、數字識別效果,使朗讀更加準確、節奏感更強,發(fā)音準確、清晰、飽滿(mǎn),完全達到國際水平。
長(cháng)期以來(lái),國際智能語(yǔ)音技術(shù)市場(chǎng)基本為美國Nuance公司壟斷,給應用智能語(yǔ)音的國際廠(chǎng)商,尤其是一些跨國企業(yè)形成一定的壓力,多家跨國企業(yè)在與捷通華聲的多次交流中表示,希望捷通華聲等中國語(yǔ)音技術(shù)公司也能夠走向國際市場(chǎng)。因此,此次捷通華聲靈云英文語(yǔ)音合成(TTS)技術(shù)達到國際水準,預示捷通華聲已開(kāi)始實(shí)施進(jìn)軍國際智能語(yǔ)音技術(shù)市場(chǎng)的戰略部署。
十幾年來(lái),捷通華聲始終堅持自主研究語(yǔ)音合成(TTS)、語(yǔ)音識別(ASR)等智能人機交互(HCI)技術(shù),并不斷在語(yǔ)音合成(TTS)、語(yǔ)音識別(ASR)等智能語(yǔ)音技術(shù)領(lǐng)域取得突破,為保證我國中文智能語(yǔ)音技術(shù)始終處于世界領(lǐng)先地位做出了主要貢獻。經(jīng)過(guò)長(cháng)期與國內金融、電信、交通、能源及CTI等各領(lǐng)域企業(yè)保持良好的合作伙伴關(guān)系,并憑借為合作企業(yè)提供周到細致的技術(shù)服務(wù),捷通華聲靈云智能語(yǔ)音技術(shù)的語(yǔ)音服務(wù)從縱貫中國的高鐵到各大飛機場(chǎng);從各個(gè)醫院語(yǔ)音叫號到各地長(cháng)途汽車(chē)站;從建行、農行等各大銀行聲訊服務(wù)到各領(lǐng)域呼叫中心服務(wù);從北京奧運會(huì )到上海世博會(huì ),從2000年到今天,捷通華聲無(wú)時(shí)無(wú)刻、無(wú)處不在地為中國億萬(wàn)大眾提供最先進(jìn)的智能語(yǔ)音服務(wù)。隨著(zhù)移動(dòng)互聯(lián)網(wǎng)的高速發(fā)展,靈云智能語(yǔ)音技術(shù)助力并通過(guò)百度導航、導航犬、搜狗地圖、嘀嘀打車(chē)、快的打車(chē)等數百款移動(dòng)應用服務(wù)大眾,為超過(guò)2億社會(huì )大眾提供輕松、便捷的語(yǔ)音服務(wù)。
2011年,捷通華聲創(chuàng )造性推出了全球第一個(gè)最大、最全的智能人機交互(HCI)技術(shù)開(kāi)放平臺 — 靈云(www.hcicloud.com)。靈云是一種可以用語(yǔ)音、手寫(xiě)、拍照、手勢,將來(lái)甚至可使用腦波識別等智能手段來(lái)操作、感知手機、計算機等數字設備的網(wǎng)絡(luò )云服務(wù),發(fā)展目標是讓人機交互像人與人溝通一樣的簡(jiǎn)單自然。靈云以“云 + 端”方式,為中國整個(gè)信息產(chǎn)業(yè)領(lǐng)域提供語(yǔ)音合成(TTS)、語(yǔ)音識別(ASR)、手寫(xiě)識別(HWR)、光學(xué)字符識別(OCR)和自然語(yǔ)言理解(NLU)等多項核心技術(shù)能力。在語(yǔ)音合成(TTS)技術(shù)領(lǐng)域,靈云開(kāi)放平臺已能夠提供中文普通話(huà)、粵語(yǔ)(廣東話(huà))、維吾爾語(yǔ)、英語(yǔ)、德語(yǔ)、法語(yǔ)、日語(yǔ)、韓語(yǔ)等在內十幾種語(yǔ)言的語(yǔ)音合成技術(shù)。國內外企業(yè)與個(gè)人,均可以通過(guò)靈云開(kāi)發(fā)者社區(www.hcicloud.com)直接體驗并獲取代表最高水平的各種HCI技術(shù)能力支持。
此次靈云英文TTS的全新升級,不僅標志我國英文語(yǔ)音成(TTS)技術(shù)的整體水平實(shí)現與國際同步,也將幫助國內各種智能移動(dòng)終端、呼叫中心等應用智能語(yǔ)音技術(shù)的企業(yè)拓展海外市場(chǎng),也必將推動(dòng)捷通華聲靈云開(kāi)放平臺,在立足服務(wù)中國,走向國際的道路上邁出更加堅實(shí)的一步。捷通華聲靈云,源自中國,服務(wù)全球!
更多詳情請登陸,靈云智能人機交互能力開(kāi)放平臺:www.hcicloud.com