目前,犯罪分子、恐怖分子和間諜等的作案手段逐漸趨向高智能、高科技,為了逃避打擊,他們往往通過多種渠道進(jìn)行通信,如手機(jī)、固定電話、公用電話等與同伙或者親友聯(lián)系,有些特殊的被監(jiān)控電話是公用電話甚至是中繼線,由于通話量大,而且大量的通話都與案件無關(guān),涉及到被控對象的通話只是其中一小部分。這樣,公安和安全部門的執(zhí)法人員只能整天守候在偵控終端旁,花費(fèi)大量的時(shí)間和精力處理大量無用的語音信息,等候嫌疑人的出現(xiàn);這樣,公安人員只能整天守候在偵控終端旁,花費(fèi)大量的時(shí)間和精力處理大量無用的語音信息,等候嫌疑人的出現(xiàn);而一些在逃的嫌疑人,經(jīng)常幾個月才往特定的目標(biāo)處打一個電話,而且通話內(nèi)容又難以判斷,導(dǎo)致執(zhí)法人員很難分辨出嫌疑人的聲音。如何從大量的語音信息中提取嫌疑人的聲音,并更好地消除判別語音的過程中可能出現(xiàn)的人為誤差,從而提高對偵察對象身份識別的效率和準(zhǔn)確率,為偵查辦案提供可靠的情報(bào),提高辦案效率,是有關(guān)部門迫切需要解決的問題。
"得意"文本無關(guān)的聲紋身份辨認(rèn)系統(tǒng),為有關(guān)執(zhí)法部門提供了高性能價(jià)格比的應(yīng)用方案,幫助這些機(jī)構(gòu)通過電話偵聽采集的語音進(jìn)行自動的身份辨認(rèn),節(jié)省大量的警力,并大大提高監(jiān)聽的效率和破案的成功率。
得意公司的聲紋識別引擎支持說話人辨認(rèn),同時(shí)具有文本和語言的無關(guān)性,并支持開集的識別方式;對語音長度的要求也非常低,通常訓(xùn)練只需要幾十秒有效語音,而識別階段只需幾秒鐘的有效語音即可;具有很高的識別精度,在公安監(jiān)聽復(fù)雜應(yīng)用環(huán)境,同一信道比對的情況下,聲紋辨認(rèn)的正確率能達(dá)到90%以上;也可以靈活地調(diào)整操作點(diǎn)參數(shù)從而適應(yīng)于不同應(yīng)用的需求。
"得意"聲紋識別引擎支持多機(jī)協(xié)同處理。當(dāng)聲紋庫容量巨大且實(shí)時(shí)性要求高時(shí),可以考慮采取集群處理方式,即采用多臺機(jī)器協(xié)調(diào)工作,對監(jiān)控對象數(shù)據(jù)庫以及聲紋模型庫的操作通過調(diào)度算法協(xié)調(diào)工作以加強(qiáng)運(yùn)算速度,大大提升識別效率和速度。
"得意"聲紋識別引擎也支持串行處理方式。在識別速度要求不特別苛刻的條件下,可以考慮采取串行處理方式,即在單臺機(jī)器上,將一批待比對的語音數(shù)據(jù)流串行處理,依次提取聲紋模型并將其與聲紋庫比對。聲紋識別過程中,語音采集消耗系統(tǒng)資源很少,主要是在提取聲紋模型和進(jìn)行比對的過程中耗費(fèi)較多的系統(tǒng)資源;而"得意"聲紋識別引擎的效率非常高,實(shí)時(shí)識別率為1:20以上(即每20秒的語音數(shù)據(jù)流可在1秒內(nèi)處理完成);另外,由于"得意"聲紋識別引擎只需30秒以內(nèi)的有效語音數(shù)據(jù)就能進(jìn)行識別處理,而一般來說,電話監(jiān)控過程中,電話通話時(shí)間往往超過60秒甚至更長,因此一個聲紋識別處理線程就能同時(shí)處理20路以上的語音流而保證實(shí)時(shí)判別(即在長于30秒的電話通話結(jié)束以前,完成聲紋識別處理)。由于以上出色的串行處理性能,用戶就能以更高的性能價(jià)格比來實(shí)現(xiàn)更多通訊線路的實(shí)時(shí)監(jiān)測。
得意公司的聲紋識別技術(shù)及其開發(fā)工具,技術(shù)國際領(lǐng)先,功能強(qiáng)大實(shí)用,開發(fā)方便快捷,應(yīng)用廣泛靈活,產(chǎn)品性價(jià)比高,已經(jīng)通過國家公安部的部級鑒定,并得到各級公安和軍隊(duì)等重要部門用戶的高度稱贊和實(shí)際應(yīng)用。
得意音通公司供稿 CTI論壇編輯