• <strike id="fdgpu"><input id="fdgpu"></input></strike>
    <label id="fdgpu"></label>
    <s id="fdgpu"><code id="fdgpu"></code></s>

  • <label id="fdgpu"></label>
  • <span id="fdgpu"><u id="fdgpu"></u></span>

    <s id="fdgpu"><sub id="fdgpu"></sub></s>
     首頁 > 技術 > 技術文摘 > 聲紋識別的模式識別方法

    聲紋識別的模式識別方法

    2011-01-05 00:00:00   作者:   來源:   評論:0 點擊:



    對于模式識別,有以下幾大類方法

    1. 模板匹配方法:利用動態(tài)時間彎折(DTW)以對準訓練和測試特征序列,主要用于固定詞組的應用(通常為文本相關任務);
    2. 最近鄰方法:訓練時保留所有特征矢量,識別時對每個矢量都找到訓練矢量中最近的K個,據此進行識別,通常模型存儲和相似計算的量都很大;
    3. 神經網絡方法:有很多種形式,如多層感知、徑向基函數(RBF)等,可以顯式訓練以區(qū)分說話人和其背景說話人,其訓練量很大,且模型的可推廣性不好;
    4. 隱式馬爾可夫模型(HMM)方法:通常使用單狀態(tài)的HMM,或高斯混合模型(GMM),是比較流行的方法,效果比較好;
    5. VQ聚類方法(如LBG):效果比較好,算法復雜度也不高,和HMM方法配合起來更可以收到更好的效果;
    6. 多項式分類器方法:有較高的精度,但模型存儲和計算量都比較大;

      聲紋識別需要解決的關鍵問題還有很多,諸如:短話音問題,能否用很短的語音進行模型訓練,而且用很短的時間進行識別,這主要是聲音不易獲取的應用所需求的;聲音模仿(或放錄音)問題,要有效地區(qū)分開模仿聲音(錄音)和真正的聲音;多說話人情況下目標說話人的有效檢出;消除或減弱聲音變化(不同語言、內容、方式、身體狀況、時間、年齡等)帶來的影響;消除信道差異和背景噪音帶來的影響;……此時需要用到其他一些技術來輔助完成,如去噪、自適應等技術。

      對說話人確認,還面臨一個兩難選擇問題。通常,表征說話人確認系統(tǒng)性能的兩個重要參數是錯誤拒絕率和錯誤接受率,前者是拒絕真正說話人而造成的錯誤,后者是接受集外說話人而造成的錯誤,二者與閾值的設定相關。在現(xiàn)有的技術水平下,兩者無法同時達到最小,需要調整閾值來滿足不同應用的需求,比如在需要“易用性”的情況下,可以讓錯誤拒絕率低一些,此時錯誤接受率會增加,從而安全性降低;在對“安全性”要求高的情況下,可以讓錯誤接受率低一些,此時錯誤拒絕率會增加,從而易用性降低。前者可以概括為“寧錯勿漏”,而后者可以“寧漏勿錯”。我們把真正閾值的調整稱為“操作點”調整。好的系統(tǒng)應該允許對操作點的自由調整。

    CTI論壇報道

    相關熱詞搜索:

    上一篇:聲紋識別的應用

    下一篇:聲紋識別的關鍵問題

    相關閱讀:

    分享到: 收藏

    專題

    亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 高清| 顺昌县| 甘肃省| 饶河县| 鹤壁市| 兴安盟| 桂平市| 东宁县| 花垣县| 龙江县| 丁青县| 云和县| 康马县| 彰武县| 双流县| 鲜城| 巨鹿县| 石城县| 澄城县| 葵青区| 双鸭山市| 扎兰屯市| 贵溪市| 泗阳县| 五台县| 迁安市| 凤山市| 辛集市| 神木县| 晋宁县| 大余县| 甘肃省| 抚松县| 嘉义市| 安庆市| 革吉县| 鸡东县| 连平县| 兴国县| 方城县| 新平| http://444 http://444 http://444 http://444 http://444 http://444