首頁(yè)>>>技術(shù)>>>語(yǔ)音應用>>>語(yǔ)音識別(ASR)  語(yǔ)音識別產(chǎn)品

聲紋識別的關(guān)鍵問(wèn)題

2011/01/05

   聲紋識別可以說(shuō)有兩個(gè)關(guān)鍵問(wèn)題,一是特征提取,二是模式匹配(模式識別)。

  特征提取的任務(wù)是提取并選擇對說(shuō)話(huà)人的聲紋具有可分性強、穩定性高等特性的聲學(xué)或語(yǔ)言特征。與語(yǔ)音識別不同,聲紋識別的特征必須是“個(gè)性化”特征,而說(shuō)話(huà)人識別的特征對說(shuō)話(huà)人來(lái)講必須是“共性特征”。雖然目前大部分聲紋識別系統用的都是聲學(xué)層面的特征,但是表征一個(gè)人特點(diǎn)的特征應該是多層面的,包括:
  1. 與人類(lèi)的發(fā)音機制的解剖學(xué)結構有關(guān)的聲學(xué)特征(如頻譜、倒頻譜、共振峰、基音、反射系數等等)、鼻音、帶深呼吸音、沙啞音、笑聲等;
  2. 受社會(huì )經(jīng)濟狀況、受教育水平、出生地等影響的語(yǔ)義、修辭、發(fā)音、言語(yǔ)習慣等;
  3. 個(gè)人特點(diǎn)或受父母影響的韻律、節奏、速度、語(yǔ)調、音量等特征。

  從利用數學(xué)方法可以建模的角度出發(fā),聲紋自動(dòng)識別模型目前可以使用的特征包括:

  1. 聲學(xué)特征(倒頻譜);
  2. 詞法特征(說(shuō)話(huà)人相關(guān)的詞n-gram,音素n-gram);
  3. 韻律特征(利用n-gram描述的基音和能量“姿勢”);
  4. 語(yǔ)種、方言和口音信息;
  5. 通道信息(使用何種通道);等等。

  根據不同的任務(wù)需求,聲紋識別還面臨一個(gè)特征選擇或特征選用的問(wèn)題。例如,對“信道”信息,在刑偵應用上,希望不用,也就是說(shuō)希望弱化信道對說(shuō)話(huà)人識別的影響,因為我們希望不管說(shuō)話(huà)人用什么信道系統它都可以辨認出來(lái);而在銀行交易上,希望用信道信息,即希望信道對說(shuō)話(huà)人識別有較大影響,從而可以剔除錄音、模仿等帶來(lái)的影響。

  總之,較好的特征,應該能夠有效地區分不同的說(shuō)話(huà)人,但又能在同一說(shuō)話(huà)人語(yǔ)音發(fā)生變化時(shí)保持相對的穩定;不易被他人模仿或能夠較好地解決被他人模仿問(wèn)題;具有較好的抗噪性能;……。當然,這些問(wèn)題也可以通過(guò)模型方法去解決。

CTI論壇報道



相關(guān)閱讀:
聲紋識別技術(shù):利用人體生物特征進(jìn)行身份認證 2011-01-05
聲紋識別的原理及其應用 2011-01-05
聲紋識別的分類(lèi) 2011-01-05
Nuance:車(chē)載信息平臺邁入語(yǔ)音時(shí)代 2010-12-27
臺達語(yǔ)音:讓消費者使用科技就像呼吸般簡(jiǎn)單自然 2010-12-27

熱點(diǎn)專(zhuān)題:  語(yǔ)音合成TTS 語(yǔ)音識別ASR  
相關(guān)頻道:  聲紋識別    

亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 阿拉善左旗| 高陵县| 西贡区| 永新县| 桐梓县| 宁南县| 桑植县| 枣庄市| 大化| 赤壁市| 巍山| 夏津县| 永德县| 连南| 武穴市| 林口县| 万源市| 甘泉县| 大港区| 玉环县| 云霄县| 台州市| 通化市| 绥棱县| 乌什县| 丰宁| 新晃| 英德市| 龙海市| 昌江| 驻马店市| 中阳县| 安顺市| 正镶白旗| 旬阳县| 辽阳县| 永济市| 民乐县| 张家界市| 曲阳县| 上犹县| http://444 http://444 http://444 http://444 http://444 http://444