
新一代靈云語(yǔ)音識別演示(建議全屏觀(guān)看)
此次靈云語(yǔ)音識別技術(shù)的升級,是捷通華聲在CTC算法的基礎上,對建模單元粗粒度、模型訓練方法、解碼幀率進(jìn)行創(chuàng )新優(yōu)化。有效提升了語(yǔ)音識別引擎的執行效率、魯棒性,增強了口音、語(yǔ)速適配能力,大幅提升了多人對講、遠場(chǎng)講話(huà)等場(chǎng)景中的語(yǔ)音識別率。
調用云端語(yǔ)音識別服務(wù)就上靈云平臺
新一代靈云語(yǔ)音識別技術(shù)已上線(xiàn)靈云平臺,開(kāi)發(fā)者可以去靈云開(kāi)發(fā)者社區(aicloud.com/dev/)申請調用。

開(kāi)發(fā)者將靈云語(yǔ)音識別SDK集成到ISO、JAVA、安卓、Windows等軟件應用中后,填寫(xiě)申請到的靈云平臺語(yǔ)音識別服務(wù)地址、授權信息,便可免費調用靈云平臺的語(yǔ)音識別服務(wù)。
目前,靈云平臺上的語(yǔ)音識別技術(shù)已服務(wù)包括打車(chē)軟件、輸入法、翻譯APP、手機銀行客戶(hù)端等各類(lèi)數十萬(wàn)應用,覆蓋數億終端用戶(hù)。
靈云ASR能力平臺為政企單位提供私有、專(zhuān)業(yè)的語(yǔ)音識別能力
在提供公有云ASR能力的同時(shí),捷通華聲一直在為Callcenter、會(huì )議、公安等場(chǎng)景提供私有化的語(yǔ)音識別能力。
其中,在Callcenter電話(huà)信道8K語(yǔ)音識別場(chǎng)景,捷通華聲已服務(wù)眾多大型銀行客服中心、客服BPO中心,將海量語(yǔ)音實(shí)時(shí)轉寫(xiě)為文字,為智能質(zhì)檢、智能客服、智能外呼、數據分析等提供私有云的語(yǔ)音識別能力。
在會(huì )議、司法、醫療等16k語(yǔ)音識別場(chǎng)景,捷通華聲積累了大量聲學(xué)、語(yǔ)言數據,分別推出了會(huì )議、審訊、醫療各科室等行業(yè)版的語(yǔ)音識別能力平臺,為政企客戶(hù)提供專(zhuān)業(yè)、私有、更安全的語(yǔ)音識別能力。
十多年來(lái),捷通華聲始終堅持核心技術(shù)自主研發(fā)。隨著(zhù)此次靈云語(yǔ)音識別技術(shù)的跨越式提升,捷通華聲將為公有云開(kāi)發(fā)者、政企客戶(hù)提供識別率更高、更優(yōu)質(zhì)的語(yǔ)音識別能力與服務(wù)。