• <strike id="fdgpu"><input id="fdgpu"></input></strike>
    <label id="fdgpu"></label>
    <s id="fdgpu"><code id="fdgpu"></code></s>

  • <label id="fdgpu"></label>
  • <span id="fdgpu"><u id="fdgpu"></u></span>

    <s id="fdgpu"><sub id="fdgpu"></sub></s>
    中科信利

    中科信利關(guān)鍵詞識別引擎

    2016-05-24 16:19:38   作者:   來(lái)源:CTI論壇   評論:0 點(diǎn)擊:


      在某些特定情況下,我們并不關(guān)心說(shuō)話(huà)者所說(shuō)的每一句話(huà),只是想了解個(gè)大概的主題,這時(shí)關(guān)鍵詞檢測系統是理想的選擇。關(guān)鍵詞檢測是語(yǔ)音識別技術(shù)的一個(gè)重要分支,其目的就是在連續語(yǔ)音流中檢測是否存在某些感興趣的關(guān)鍵詞。
      在關(guān)鍵詞檢測的很多實(shí)際應用中,輸入的信號是各種信道的自然對話(huà)語(yǔ)音數據。一般來(lái)說(shuō),由于聲學(xué)模型和語(yǔ)音數據的不匹配,關(guān)鍵詞檢測的性能會(huì )急劇地下降。為了解決這個(gè)問(wèn)題,中科信利研發(fā)的關(guān)鍵詞檢測系統采用了一種基于混淆網(wǎng)絡(luò )的搜索策略。與以往不同的是,解碼是在整個(gè)聲學(xué)空間上進(jìn)行的,而不僅僅是關(guān)鍵詞所構成的聲學(xué)空間,解碼器輸出不僅是首選結果,而是一種混淆網(wǎng)絡(luò )的數據結構。通過(guò)統計訓練數據中的發(fā)音變異情況,我們得到音素間的混淆度。利用這種音素間的混淆度和關(guān)鍵詞列表,我們就可以從解碼器輸出的混淆網(wǎng)絡(luò )中搜索獲取最有可能出現的關(guān)鍵詞。這種方法大大提高了關(guān)鍵詞的識別率,但同時(shí)也引入了一定的虛警。最后,我們采用了可靠的置信度策略來(lái)有效地降低了虛警。
      體系框架:
      功能模塊:
      語(yǔ)音識別模塊
      首先,輸入的實(shí)時(shí)語(yǔ)音流或語(yǔ)音文檔,經(jīng)過(guò)語(yǔ)音分段模塊處理后,產(chǎn)生分段信息和語(yǔ)音片斷;其次,各語(yǔ)音片斷經(jīng)連續語(yǔ)音識別引擎進(jìn)行識別產(chǎn)生網(wǎng)格結構;最后,網(wǎng)格結構經(jīng)分解對齊后產(chǎn)生音節混淆網(wǎng)絡(luò )。
      索引模塊
      分段信息和音節混淆網(wǎng)絡(luò )通過(guò)前向索引產(chǎn)生前向索引文件。前向索引文件再經(jīng)逆向索引產(chǎn)生逆向索引文件。采用逆向索引的數據結構,是為了方便和減速后續的搜索過(guò)程。
      檢索模塊
      給定的關(guān)鍵詞首先通過(guò)字音轉換產(chǎn)生音節序列,再通過(guò)應用音節混淆矩陣,采用中科信利在國際上首次提出的基于混淆網(wǎng)絡(luò )和模糊動(dòng)態(tài)規劃的關(guān)鍵詞檢索策略,在逆向索引文件中進(jìn)行快速模糊匹配,產(chǎn)生候選關(guān)鍵詞列表。
      技術(shù)特點(diǎn):
    • 關(guān)鍵詞檢測引擎與說(shuō)話(huà)人無(wú)關(guān)。支持自然對話(huà)語(yǔ)音(如:電話(huà)聊天,廣播電視訪(fǎng)談等)。
    • 支持電話(huà)信道、廣播電視信道、互聯(lián)網(wǎng)信道等各類(lèi)信道數據。
    • 關(guān)鍵詞列表可由用戶(hù)自主定義和修改。
    • 檢測結果不但包含關(guān)鍵詞在語(yǔ)音流或音頻文件中出現的位置,還包括相應的置信度得分。
    • 操作點(diǎn)調整方便,可按不同的應用需求調整操作點(diǎn)閾值,使系統性能根據應用需求達到最優(yōu)。
    • 引擎處理速度快,核心算法支持海量并行處理。適應于大規模語(yǔ)音數據的自動(dòng)檢測。
    • 引擎函數接口簡(jiǎn)單,用戶(hù)可以方便靈活地應用開(kāi)發(fā)。
      性能指標:
      應用范圍:
      中科信利的關(guān)鍵詞檢測系統,居于國內領(lǐng)先、國際先進(jìn)水平。目前已在國內電信、安全、廣電等多個(gè)行業(yè)領(lǐng)域中得到成功應用。
      關(guān)鍵詞檢測的主要應用領(lǐng)域大概有以下兩個(gè)方面:一是國家的信息安全領(lǐng)域。主要是用來(lái)對敏感語(yǔ)音信號的監測,一旦發(fā)現敏感關(guān)鍵詞可以立刻報警。二是多媒體檢索領(lǐng)域。采用關(guān)鍵詞檢測技術(shù),可以利用文字檢測出感興趣的音視頻流。

    相關(guān)熱詞搜索: 中科信利 關(guān)鍵詞識別

    上一篇:中科信利靜音檢測引擎

    下一篇:最后一頁(yè)

    相關(guān)閱讀:

    分享到: 收藏

    最新新聞

    亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 安远县| 西华县| 博客| 广东省| 吴忠市| 开化县| 平南县| 商丘市| 秭归县| 南召县| 佳木斯市| 定南县| 四平市| 黔西| 远安县| 长子县| 长顺县| 乐陵市| 唐海县| 临高县| 内丘县| 南川市| 元江| 句容市| 泸定县| 尚义县| 孟津县| 饶平县| 噶尔县| 深泽县| 奉贤区| 利辛县| 乐安县| 亳州市| 普陀区| 昔阳县| 页游| 富川| 司法| 弥勒县| 益阳市| http://444 http://444 http://444 http://444 http://444 http://444