中科信利語(yǔ)種識別引擎能夠在連續語(yǔ)音中自動(dòng)提取語(yǔ)音的語(yǔ)種信息。
中科信利的語(yǔ)種識別技術(shù)將從聲學(xué)層特征和音子序列特征的提取,分別采用了聲學(xué)建模和語(yǔ)法建模的方法,來(lái)描述這些特征的空間分布情況,并且以此來(lái)構建高層的得分向量空間,通過(guò)分類(lèi)器對得分向量進(jìn)行劃分,以達到自動(dòng)分類(lèi)判決的目的,以使得語(yǔ)種識別技術(shù)能滿(mǎn)足實(shí)際的應用需求。
工作原理:

功能模塊:
預處理:將語(yǔ)音分段,盡可能的保證每段語(yǔ)音只包含同一個(gè)說(shuō)話(huà)人或者同一類(lèi)非語(yǔ)音,此外,也要保證檢測出的說(shuō)話(huà)人或者同一類(lèi)非語(yǔ)音的虛轉折點(diǎn)少;噪聲檢測,檢測出電話(huà)語(yǔ)音數據中包含的傳真音、震鈴、音樂(lè )彩鈴等非有效說(shuō)話(huà)人語(yǔ)音。
特征提取:在語(yǔ)種識別技術(shù)中,選取能夠表征語(yǔ)種類(lèi)別特征的有效而可靠的特征參量,是保證識別性能的重要因素之一。語(yǔ)音信號的長(cháng)時(shí)差分頻譜特征,包含了語(yǔ)音信號中的語(yǔ)義信息、說(shuō)話(huà)人信息、語(yǔ)種信息。分析語(yǔ)音信號的頻譜特性可以用來(lái)確認各個(gè)目標語(yǔ)種。
模式匹配:指的是通過(guò)建立統計模型,將低層聲學(xué)特征轉換為高層的得分向量特征。中科信利的語(yǔ)種識別系統中,目標是對各個(gè)待識語(yǔ)種建立可靠模型,保證語(yǔ)種識別系統的性能。
判決規則:語(yǔ)種識別系統的輸出一般都是對各個(gè)目標語(yǔ)種有個(gè)打分,這些得分都是通過(guò)將測試語(yǔ)音同模型庫進(jìn)行似然概率計算或者進(jìn)行距離度量所得到。
技術(shù)特點(diǎn):
- 與發(fā)音人無(wú)關(guān),與傳輸信道無(wú)關(guān)。系統對用戶(hù)的輸入聲音進(jìn)行鑒別和確認,可以來(lái)源不同的信道。
- 對語(yǔ)音長(cháng)度有一定的要求。待識別的測試語(yǔ)音有效長(cháng)度不小于3秒。
- 識別速度快,能確保實(shí)時(shí)識別。說(shuō)話(huà)人識別引擎每次一對一比對,在普通PC上具有0.01倍以上的實(shí)時(shí)率,并且支持多路并發(fā)識別。
- 操作點(diǎn)調整方便:可按不同的應用需求調整操作點(diǎn)閾值,可以調整虛警率和漏警率,使最終準確率達到最高或使錯誤率降到最低。
- 操作點(diǎn)調整方便,可按不同的應用需求調整操作點(diǎn)閾值,使系統性能根據應用需求達到最優(yōu)。
- 支持自動(dòng)添加新語(yǔ)種的訓練,滿(mǎn)足用戶(hù)擴充。
性能指標:
