靈云科技訊:近日,捷通華聲最新靈云嵌入式語(yǔ)音合成技術(shù),iHear 7.0正式登陸靈云平臺,全面向產(chǎn)業(yè)開(kāi)放。iHear 7.0版在語(yǔ)音合成效果、資源占用、產(chǎn)品功能等多方面全面超越目前市場(chǎng)的同類(lèi)產(chǎn)品,達到國內嵌入式語(yǔ)音合成技術(shù)的最高水平。捷通華聲面向智能車(chē)載、智能家電、智能家居、穿戴式設備等領(lǐng)域專(zhuān)門(mén)開(kāi)發(fā)的全方位解決方案——靈云種子也藉此全面升級,并開(kāi)始為國內智能終端領(lǐng)域提供最清新的語(yǔ)音合成技術(shù)。
回顧2014年,眾多設備商、制造商、互聯(lián)網(wǎng)+公司在內的各領(lǐng)域廠(chǎng)商都在智能硬件領(lǐng)域積極投入。業(yè)內分析人士認為,除了市場(chǎng)前景廣闊外,智能硬件市場(chǎng)極有可能成為繼移動(dòng)互聯(lián)網(wǎng)后下一個(gè)入口的新興行業(yè),這是海內外眾多廠(chǎng)商搶占市場(chǎng)的另一個(gè)主要原因。此外,智能硬件系統的普及,也有利于增強消費者粘性,為未來(lái)搭建自有平臺做準備。
進(jìn)入2015年,智能硬件廠(chǎng)商更是如雨后春筍般冒芽而出,從智能手環(huán)到智能手表、從智能車(chē)機到智能后視鏡、從智能插座到智能燈泡、從智能電視到智能空調。然而在硬件大軍的浪潮中,相對應的軟件卻少之又少,雖然各種“云”也有所冒頭,但是,卻鮮有能夠一套方案便能解決智能硬件所需所有功能的云服務(wù)。在現在推出的語(yǔ)音云中,大多數僅固步在“聲”的方向,如語(yǔ)音合成、語(yǔ)音識別等語(yǔ)音交互能力,對于用戶(hù)的圖像需求,如人臉識別、指紋識別、手寫(xiě)識別、光學(xué)字符識別等能力則無(wú)法實(shí)現。
在此種形式下,捷通華聲推出了新一代“靈云種子”一體式解決方案。“靈云種子”融合了靈云(hcicloud。com)平臺語(yǔ)音識別(ASR)、語(yǔ)音合成(TTS)、聲紋識別(VPR)、語(yǔ)義理解(NLU)、手寫(xiě)識別(HWR)和圖像識別(OCR、指紋識別、人臉識別等)等多項靈云核心技術(shù)能力,可實(shí)現智能語(yǔ)音交互、智能語(yǔ)音導航、智能語(yǔ)音控制、聲紋安全鎖、智能手寫(xiě)/手勢輸入、智能圖像識別、身份認證等功能。涵蓋了智能車(chē)載、智能家電、智能家居及可穿戴式設備等行業(yè)。可廣泛應用在以下幾種場(chǎng)景中:
語(yǔ)音檢索:支持包括路況導航類(lèi)、家居菜單智能導航類(lèi)、周邊服務(wù)類(lèi)、生活服務(wù)類(lèi)、娛樂(lè )類(lèi)等多種語(yǔ)音檢索服務(wù);
消息提醒:人性化定制推送類(lèi)別:來(lái)電提醒、短信提醒、應用提醒,并可將設置在云端;
通訊娛樂(lè ):支持短信發(fā)送,電話(huà)通訊,多媒體播放,手機操控;
健康服務(wù):支持傳感器,提供傳感器數據分析,為用戶(hù)提供健康圖表,并結合云端服務(wù)提供定制健康指導等現有及正在研發(fā)的能力;
云平臺:基于靈云平臺,提供多設備數據同步,私人信息云存儲,智能推薦;
智能支付:結合智能終端特點(diǎn),提供更便捷、更多樣的智能支付方式。
虛擬現實(shí)擴展:將AR技術(shù)與LBS技術(shù)整合,為用戶(hù)提供包括周邊景點(diǎn)商圈實(shí)景展示,路線(xiàn)提示,為O2O服務(wù)提供優(yōu)秀體驗;
靈云(hcicloud.com)平臺將這些特定領(lǐng)域和場(chǎng)景的智能交互方案經(jīng)過(guò)設計和優(yōu)化后,打造出一體化的全智能人機交互解決方案——“靈云種子”。合作伙伴開(kāi)發(fā)應用時(shí)可直接應用“靈云種子”配置的技術(shù)服務(wù)和內容服務(wù),即可完全滿(mǎn)足智能終端行業(yè)需求。
靈云種子自推出以來(lái),為滿(mǎn)足用戶(hù)需求,不斷升級以滿(mǎn)足智能車(chē)載、智能家電等智能終端設備的快速發(fā)展,靈云種子此次升級,采用了最新的靈云嵌入式語(yǔ)音合成——iHear7.0 Embedded 7.0.0技術(shù),此項技術(shù)創(chuàng )造性使用了最新一代高音質(zhì)合成器,音質(zhì)效果更加真實(shí)、干凈、細膩;利用模型優(yōu)化了算法,大大提高音色的逼真度和音質(zhì)的細膩度,克服機器味底噪;增加了數據訓練流程,比傳統訓練方法穩定性更高;優(yōu)化音高算法,使朗讀更加抑揚頓挫;優(yōu)化了計算效率,默認情況下比舊版快2.5倍,資源消耗大幅降低;更全面的地名詞庫,精心裁剪,可辨認全國常見(jiàn)地名、機構名;支持用戶(hù)定制化需求:針對用戶(hù)特定詞匯、語(yǔ)句保證讀音正確、韻律自然;豐富的語(yǔ)種與發(fā)音人:語(yǔ)種可支持中文普通話(huà)、粵語(yǔ)、英語(yǔ)、北方語(yǔ)系方言、臺灣腔調國語(yǔ)等;已發(fā)布十余種發(fā)音人音色,性別涵蓋男聲、女聲、童聲,涵蓋正式、閑適、可愛(ài)、激昂、穩重、柔美等各類(lèi)風(fēng)格,尤其值得一提的是,最新語(yǔ)音合成技術(shù)為導航等特殊領(lǐng)域專(zhuān)門(mén)定制,可清晰流暢朗讀全國常見(jiàn)地名、機構名。
2011年,捷通華聲率先推出全球第一個(gè)全方位人工智能開(kāi)放平臺-靈云平臺(hcicloud.com)。靈云平臺是一種可以用語(yǔ)音、手寫(xiě)、拍照,手勢,將來(lái)甚至可使用腦波識別等智能手段來(lái)操作、感知手機、計算機等數字設備的網(wǎng)絡(luò )云服務(wù),目標是讓人機交互像人與人溝通一樣的簡(jiǎn)單自然。靈云平臺自全面向產(chǎn)業(yè)開(kāi)放以來(lái),靈云語(yǔ)音識別、語(yǔ)音合成、語(yǔ)義理解等人工智能技術(shù)能力通過(guò)百度導航、搜狗導航、導航犬、嘀嘀打車(chē)、快的打車(chē)、天行聽(tīng)書(shū)、靈云輸入法等“家喻戶(hù)曉”的經(jīng)典應用服務(wù)中國13億社會(huì )大眾,使大眾群體充分感受并體驗到智能語(yǔ)音等人工智能技術(shù)為現代生活所帶來(lái)的輕松與便捷。
靈云平臺作為國內外最大的全方位人工智能開(kāi)放平臺,為促進(jìn)智能車(chē)載、智能家電、智能家居、穿戴式設備等產(chǎn)業(yè)發(fā)展,將靈云智能語(yǔ)音交互(TTS、ASR、VPR)、智能圖像識別(OCR證照識別、文檔識別、名片識別、手寫(xiě)識別)、生物特征識別(指紋識別、人臉識別)、自然語(yǔ)言理解(NLU)、語(yǔ)義分析、機器翻譯(MT)等人工智能技術(shù)能力全面向產(chǎn)業(yè)開(kāi)放,此舉不但得到了數千家企業(yè)的支持,更直接推動(dòng)了人工智能技術(shù)在車(chē)載、家電、家居、穿戴式設備的發(fā)展與進(jìn)步。
在中國華南地區,尤其廣州、深圳地區經(jīng)濟發(fā)達、創(chuàng )新力強,在智能車(chē)載、智能家電、智能家居、穿戴式設備擁有獨特優(yōu)勢。由此,捷通華聲在2015年初成立了深圳捷通華聲分公司,旨在依托靈云平臺,利用靈云平臺智能語(yǔ)音、智能圖像、語(yǔ)義理解等全方位人工智能技術(shù)能力和豐富完善的智能終端交互解決方案,與華南地區硬件廠(chǎng)商加強合作關(guān)系,發(fā)揮華南地區智能終端設備研發(fā)和生產(chǎn)的優(yōu)勢,以推動(dòng)智能終端產(chǎn)業(yè)長(cháng)足的進(jìn)步,攜手智能硬件廠(chǎng)商互惠共贏(yíng),共同推動(dòng)中國人工智能產(chǎn)業(yè)的發(fā)展。
更多靈云種子及iHear7.0相關(guān)信息,請訪(fǎng)問(wèn)靈云官網(wǎng):www.hcicloud.com