·醫療保健領(lǐng)域:應用到電子病歷中,可自動(dòng)實(shí)現把醫生的聲音轉換成文本。這一領(lǐng)域也是若干發(fā)達國家在語(yǔ)音識別的主要收入領(lǐng)域。
由于擁有領(lǐng)先的語(yǔ)音識別技術(shù),普強已經(jīng)做好了進(jìn)入這些領(lǐng)域的準備。普強將先鎖定在企業(yè)客戶(hù)這塊。當我們在這個(gè)領(lǐng)域做到最好時(shí),我們再繼續滲透到其它版塊。
普強目前擁有:
千語(yǔ)語(yǔ)音平臺:向企業(yè)提供語(yǔ)音識別服務(wù)
千語(yǔ)語(yǔ)音云平臺:為手機互聯(lián)網(wǎng)應用提供的語(yǔ)音識別云服務(wù)
普強智能語(yǔ)音分析系統:為企業(yè)提供360度大數據分析(語(yǔ)音,視頻,文學(xué)數據等)
突破ASR語(yǔ)音識別技術(shù)難點(diǎn) 應用于可穿戴設備
語(yǔ)音識別技術(shù)要求快速,準確。語(yǔ)音識別目前還達不到百分百準確,達到完美的距離還很遠。因為中文5千字中發(fā)音有406個(gè),是最難辨識的語(yǔ)種,例如(wu),可以是吳、無(wú)、吾、梧、蜈等。同樣文字各地方言發(fā)音不一,便會(huì )增加難度,所以語(yǔ)音辯識應用的成功關(guān)鍵,更傾向是專(zhuān)業(yè)能力。人類(lèi)有眼睛,耳朵,文字來(lái)幫助識別,語(yǔ)音識別是只通過(guò)能“聽(tīng)”來(lái)完成,有限的聲音數據要用來(lái)識別聲音的同時(shí)也要區分不同的背景雜音,需要花時(shí)間和精力去完善核心算法和積累數據。為了使每個(gè)垂直領(lǐng)域達到最優(yōu)的識別效果,我們都需要積累經(jīng)驗去適當調整算法和采集選擇數據,例如為呼叫中心的電話(huà)信道建立模型與移動(dòng)互聯(lián)網(wǎng)的聲學(xué)模型是不一樣的。
在可穿戴設備上,語(yǔ)音識別技術(shù)將是必備技術(shù)之一,但是要應用ASR技術(shù)到可穿戴設備,我們首先要解決能耗問(wèn)題,這類(lèi)設備一般沒(méi)有太多電能。
一個(gè)成功的案例是:低功耗的語(yǔ)音喚醒技術(shù)。它通過(guò)只針對特定人和少數命令詞的識別解決了低能耗的問(wèn)題,成功應用在許多嵌入式產(chǎn)品中,例如:手機語(yǔ)音喚醒,寵物語(yǔ)音鎖鏈(鎖鏈回答寵物主人的叫喚)等。
CEO:何國濤先生
北京大學(xué)計算機碩士,美國雪城大學(xué)計算機碩士。曾在HP、Aruba等公司從事Opencall、Voice XML、 無(wú)線(xiàn)網(wǎng)關(guān)等產(chǎn)品的開(kāi)發(fā)和研究,并成功地在世界500強公司產(chǎn)品中部署應用;在語(yǔ)音領(lǐng)域擁有三項專(zhuān)利和一 項待批專(zhuān)利。興趣和專(zhuān)長(cháng)包括語(yǔ)音識別技術(shù)、呼叫中心、無(wú)線(xiàn)網(wǎng)絡(luò )等。
CTO:李全忠博士
北京大學(xué)計算機碩士,美國亞利桑那大學(xué)計算機博士。曾在IBM Almaden研究中心擔任研究員, 從事 數據庫及云計算研究;榮獲過(guò)IBM發(fā)明成就獎,擁有多個(gè)專(zhuān)利并且在頂級互聯(lián)網(wǎng)及數據庫期刊上發(fā)表過(guò) 多篇論文。興趣和專(zhuān)長(cháng)包括大規模數據處理、數據庫和云計算等。