中科信利關(guān)鍵詞識別引擎

2016-05-24 16:19:38 作者：來源：CTI論壇評論：0 點擊：

　　在某些特定情況下，我們并不關(guān)心說話者所說的每一句話，只是想了解個大概的主題，這時關(guān)鍵詞檢測系統(tǒng)是理想的選擇。關(guān)鍵詞檢測是語音識別技術(shù)的一個重要分支，其目的就是在連續(xù)語音流中檢測是否存在某些感興趣的關(guān)鍵詞。

　　在關(guān)鍵詞檢測的很多實際應(yīng)用中，輸入的信號是各種信道的自然對話語音數(shù)據(jù)。一般來說，由于聲學(xué)模型和語音數(shù)據(jù)的不匹配，關(guān)鍵詞檢測的性能會急劇地下降。為了解決這個問題，中科信利研發(fā)的關(guān)鍵詞檢測系統(tǒng)采用了一種基于混淆網(wǎng)絡(luò)的搜索策略。與以往不同的是，解碼是在整個聲學(xué)空間上進(jìn)行的，而不僅僅是關(guān)鍵詞所構(gòu)成的聲學(xué)空間，解碼器輸出不僅是首選結(jié)果，而是一種混淆網(wǎng)絡(luò)的數(shù)據(jù)結(jié)構(gòu)。通過統(tǒng)計訓(xùn)練數(shù)據(jù)中的發(fā)音變異情況，我們得到音素間的混淆度。利用這種音素間的混淆度和關(guān)鍵詞列表，我們就可以從解碼器輸出的混淆網(wǎng)絡(luò)中搜索獲取最有可能出現(xiàn)的關(guān)鍵詞。這種方法大大提高了關(guān)鍵詞的識別率，但同時也引入了一定的虛警。最后，我們采用了可靠的置信度策略來有效地降低了虛警。

　　體系框架：

　　功能模塊：

　　語音識別模塊

　　首先，輸入的實時語音流或語音文檔，經(jīng)過語音分段模塊處理后，產(chǎn)生分段信息和語音片斷；其次，各語音片斷經(jīng)連續(xù)語音識別引擎進(jìn)行識別產(chǎn)生網(wǎng)格結(jié)構(gòu)；最后，網(wǎng)格結(jié)構(gòu)經(jīng)分解對齊后產(chǎn)生音節(jié)混淆網(wǎng)絡(luò)。

　　索引模塊

　　分段信息和音節(jié)混淆網(wǎng)絡(luò)通過前向索引產(chǎn)生前向索引文件。前向索引文件再經(jīng)逆向索引產(chǎn)生逆向索引文件。采用逆向索引的數(shù)據(jù)結(jié)構(gòu)，是為了方便和減速后續(xù)的搜索過程。

　　檢索模塊

　　給定的關(guān)鍵詞首先通過字音轉(zhuǎn)換產(chǎn)生音節(jié)序列，再通過應(yīng)用音節(jié)混淆矩陣，采用中科信利在國際上首次提出的基于混淆網(wǎng)絡(luò)和模糊動態(tài)規(guī)劃的關(guān)鍵詞檢索策略，在逆向索引文件中進(jìn)行快速模糊匹配，產(chǎn)生候選關(guān)鍵詞列表。

　　技術(shù)特點：

關(guān)鍵詞檢測引擎與說話人無關(guān)。支持自然對話語音（如：電話聊天，廣播電視訪談等）。
支持電話信道、廣播電視信道、互聯(lián)網(wǎng)信道等各類信道數(shù)據(jù)。
關(guān)鍵詞列表可由用戶自主定義和修改。
檢測結(jié)果不但包含關(guān)鍵詞在語音流或音頻文件中出現(xiàn)的位置，還包括相應(yīng)的置信度得分。
操作點調(diào)整方便，可按不同的應(yīng)用需求調(diào)整操作點閾值，使系統(tǒng)性能根據(jù)應(yīng)用需求達(dá)到最優(yōu)。
引擎處理速度快，核心算法支持海量并行處理。適應(yīng)于大規(guī)模語音數(shù)據(jù)的自動檢測。
引擎函數(shù)接口簡單，用戶可以方便靈活地應(yīng)用開發(fā)。

　　性能指標(biāo)：

　　應(yīng)用范圍：

　　中科信利的關(guān)鍵詞檢測系統(tǒng)，居于國內(nèi)領(lǐng)先、國際先進(jìn)水平。目前已在國內(nèi)電信、安全、廣電等多個行業(yè)領(lǐng)域中得到成功應(yīng)用。

　　關(guān)鍵詞檢測的主要應(yīng)用領(lǐng)域大概有以下兩個方面：一是國家的信息安全領(lǐng)域。主要是用來對敏感語音信號的監(jiān)測，一旦發(fā)現(xiàn)敏感關(guān)鍵詞可以立刻報警。二是多媒體檢索領(lǐng)域。采用關(guān)鍵詞檢測技術(shù)，可以利用文字檢測出感興趣的音視頻流。

相關(guān)熱詞搜索：中科信利關(guān)鍵詞識別

上一篇:中科信利靜音檢測引擎

下一篇:最后一頁

相關(guān)閱讀：

·中科信利語種識別引擎2016-05-24 16:01:39
·中科信利語音識別引擎2016-05-24 16:03:40
·中科信利語音喚醒引擎2016-05-24 16:06:53
·中科信利語義理解引擎2016-05-24 16:09:24
·中科信利聲紋識別引擎2016-05-24 16:11:02

分享到：

亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩,日本久久久久,日本-区二区三区免费精品,中文字幕日本亚洲欧美不卡

中科信利關(guān)鍵詞識別引擎

評論排行

最新新聞