亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩,日本久久久久,日本-区二区三区免费精品,中文字幕日本亚洲欧美不卡

 首頁 > 技術 > 技術文摘 > 聲紋識別的分類

聲紋識別的分類

2011-01-05 00:00:00   作者:   來源:   評論:0 點擊:



  聲紋識別(Voiceprint Recognition, VPR),也稱為說話人識別(Speaker Recognition),有兩類,即說話人辨認(Speaker Identification)和說話人確認(Speaker Verification)。前者用以判斷某段語音是若干人中的哪一個所說的,是“多選一”問題;而后者用以確認某段語音是否是指定的某個人所說的,是“一對一判別”問題。不同的任務和應用會使用不同的聲紋識別技術,如縮小刑偵范圍時可能需要辨認技術,而銀行交易時則需要確認技術。不管是辨認還是確認,都需要先對說話人的聲紋進行建模,這就是所謂的“訓練”或“學習”過程。
  從另一方面,聲紋識別有文本相關的(Text-Dependent)和文本無關的(Text-Independent)兩種。與文本有關的聲紋識別系統(tǒng)要求用戶按照規(guī)定的內容發(fā)音,每個人的聲紋模型逐個被精確地建立,而識別時也必須按規(guī)定的內容發(fā)音,因此可以達到較好的識別效果,但系統(tǒng)需要用戶配合,如果用戶的發(fā)音與規(guī)定的內容不符合,則無法正確識別該用戶。而與文本無關的識別系統(tǒng)則不規(guī)定說話人的發(fā)音內容,模型建立相對困難,但用戶使用方便,可應用范圍較寬。根據特定的任務和應用,兩種是有不同的應用范圍的。比如,在銀行交易時可以使用文本相關的聲紋識別,因為用戶自己進行交易時是愿意配合的;而在刑偵或偵聽應用中則無法使用文本相關的聲紋識別,因為你無法要求犯罪嫌疑人或被偵聽的人配合。
  在說話人辨認方面,根據待識別的說話人是否在注冊的說話人集合內,說話人辨認可以分為開集(open-set)辨認和閉集(close-set)辨認。前者假定待識別說話人可以在集合外,而后者假定待識別說話人在集合內。顯然,開集辨認需要有一個對集外說話人的“拒識問題”,而且閉集辨認的結果要好于開集辨認結果。本質上講,說話人確認和開集說話人辨認都需要用到拒識技術,為了達到很好的拒識效果,通常需要訓練一個假冒者模型或背景模型,以便拒識時有可資比較的對象,閾值容易選定。而建立背景模型的好壞直接影響到拒識甚至聲紋識別的性能。一個好的背景模型,往往需要通過預先采集好的若干說話人的數(shù)據,通過某種算法去建立。
  如果技術達到一定的水平,可以把文本相關識別并入文本無關識別,把閉集辨認并入開集辨認,從而提供更為方便的使用方法。比如北京得意音通技術有限公司的“得意”身份證就是文本無關的、開集方式的說話人辨認和確認,“得意”身份證SDK還提供建立背景模型的工具。

CTI論壇報道

相關熱詞搜索:

上一篇:聲紋識別的關鍵問題

下一篇:聲紋識別的原理及其應用

相關閱讀:

分享到: 收藏

專題

隆尧县| 龙井市| 汉川市| 石河子市| 内江市| 津南区| 安仁县| 特克斯县| 呼图壁县| 湟中县| 普兰店市| 旬阳县| 本溪| 鲜城| 冕宁县| 神木县| 北流市| 乳山市| 土默特右旗| 开封市| 南陵县| 精河县| 安化县| 临城县| 乐清市| 洛浦县| 黄浦区| 儋州市| 衡南县| 论坛| 辽源市| 河曲县| 寿光市| 新丰县| 晋宁县| 昌都县| 武鸣县| 云梦县| 望都县| 陆川县| 冀州市|