首頁(yè)>>廠(chǎng)商>>語(yǔ)音識別與合成>>得意音通

聲紋識別與數據安全

鄭方 鄧永強 2003/04/17

  自1946年世界上第一臺馮-依曼計算機面世以來(lái),在半個(gè)多世紀的時(shí)間里,計算機硬件按摩爾定律(芯片產(chǎn)業(yè)每18個(gè)月速度增長(cháng)1倍)迅猛發(fā)展;而微軟公司等軟件生產(chǎn)商所開(kāi)發(fā)的高質(zhì)量軟件,相輔相成,給人類(lèi)使用計算機帶來(lái)了很大的方便;這些都使人類(lèi)的能力得到延伸。網(wǎng)絡(luò )技術(shù)的飛速發(fā)展又使得人類(lèi)所生活的地球變成了一個(gè)“地球村”,人類(lèi)的活動(dòng)空間變大了,在某種意義上講,人類(lèi)的活動(dòng)和交流甚至可以跨越時(shí)間和空間的障礙。因此可以說(shuō),由于計算機及其技術(shù)的飛速發(fā)展而推動(dòng)的信息化進(jìn)程,極大地改變了人們的生活方式,并提高了人類(lèi)的生活質(zhì)量。

  然而,在人們享受著(zhù)信息化所帶來(lái)的好處的同時(shí),人們也面臨著(zhù)“個(gè)人隱私有被信息化吞食的危險”。

  美國計算機安全企業(yè)Cryptography Research公司近日指出,由于計算機性能18個(gè)月倍增這一所謂“摩爾定律”的作用,計算機系統越來(lái)越脆弱,安全專(zhuān)家稱(chēng),這就是摩爾定律的負面影響。

  Cryptography Research公司總裁、安全專(zhuān)家Paul Kocher說(shuō),在摩爾定律的作用下,計算機性能提高了,但是系統也日益復雜化,這就為非法入侵者增加了進(jìn)攻手段和機會(huì )。

  2002年11月29日《北京青年報》報道(http://finance.sina.com.cn)“京城第一稅案開(kāi)審,三稅官玩忽職守損失2.8億”:由于當事人經(jīng)常把進(jìn)入系統的專(zhuān)用IC卡隨意放在抽屜里、桌子上,導致罪犯趁機非法操作增值稅防偽稅控系統。

  2003年1月6日,《環(huán)球時(shí)報》報道:一伙竊賊躲過(guò)美國鳳凰城“三西健康保健公司”的保安系統,進(jìn)入了這家公司的一座大樓,偷走了數臺筆記本電腦和臺式電腦的硬盤(pán),以及一些文字資料,然后逃之夭夭,從而使50多萬(wàn)份軍人醫療保健檔案被盜。日本政府從2002年8月開(kāi)始建立的全國居民個(gè)人資料聯(lián)網(wǎng)系統(即我們所說(shuō)的“電子身份證”),用以存儲日本1.26億國民的個(gè)人信息,包括姓名、住址、出生年月、性別和新的身份證號碼,而開(kāi)始運行僅5個(gè)月的電子身份證系統就連續發(fā)生了2次嚴重的資料泄密事件。

  這些事件的發(fā)生,促使人們考慮這樣一個(gè)問(wèn)題,那就是:在信息化時(shí)代如何保護個(gè)人隱私。試想在把個(gè)人資料加以整合進(jìn)行集中管理,只用一張IC卡就能完成各種活動(dòng),從而可以極大地提高工作效率和生活質(zhì)量的同時(shí),如何才能防止系統被非法或非授權闖入?如何才能有效地防止被記錄下來(lái)的個(gè)人資料被竊?

一、用生物特征進(jìn)行身份認證

  為了有效防止類(lèi)似事件的發(fā)生,必須嚴格限制系統操作員,防止系統被非授權者非法闖入。而密碼或IC卡等具有先天性安全缺陷的身份認證手段,必將被更為有效的方法所取代,那就是利用生物特征進(jìn)行身份認證的技術(shù)。正如比爾·蓋茨所說(shuō):“以人類(lèi)生物特征(指紋、語(yǔ)音、臉像等)進(jìn)行身份驗證的生物識別技術(shù),在今后數年內將成為IT產(chǎn)業(yè)最為重要的技術(shù)革命。”

  那么有那些生物特征可資使用呢?下面舉例說(shuō)明。

  1.1面孔
  人的面容各異,世界上沒(méi)有長(cháng)得一模一樣的兩個(gè)人,即使是雙胞胎,用人類(lèi)學(xué)方法測量也可發(fā)現差異。把人臉面部各個(gè)解剖部位間的點(diǎn)、線(xiàn)測繪出來(lái),用紅外線(xiàn)對面部熱相進(jìn)行掃描,就可以進(jìn)行人臉識別。

  1.2指紋、手指和掌紋
  指紋(Finger prints)是人手指末端掌面皮膚乳突線(xiàn)隆起形成的花紋;而在人手掌上形成的這種花紋稱(chēng)為掌紋(palm prints);另外在人的腳掌面上也有類(lèi)似的花紋。

  指紋可分上百種圖形,每個(gè)指紋又由13種不同形狀的點(diǎn)、線(xiàn)等排列組合成近百個(gè)特征點(diǎn),加之各特征點(diǎn)、線(xiàn)間的位置、分布又不同,而使指紋的特異性、穩定性、遺傳性"終生不變,萬(wàn)人不同"。法國有人報告,指紋上的細節特征按數學(xué)方法可以歸納為4種,而每個(gè)指紋約有100個(gè)細節,經(jīng)排列組合得出61位數,假定一個(gè)世紀內有50億人口,即有500億個(gè)指頭,經(jīng)推算發(fā)現,人類(lèi)要經(jīng)過(guò)50位數字的世紀才可能出現絕對重復的指紋,故實(shí)際上世人中不可能有兩個(gè)指紋完全相同的人,所以說(shuō),指紋是公認的個(gè)人認定絕對可靠的標志,并已在法庭科學(xué)中得到很長(cháng)時(shí)間的應用。我國古代一直以指紋畫(huà)押證明個(gè)人身份,并為世界各國推崇,可見(jiàn)指紋是舉世公認而且是不可仿冒的個(gè)人標記。

  另外,美國科學(xué)專(zhuān)家對4,000名飛行員的手指逐一測試,結果發(fā)現每個(gè)人的手指都不一樣長(cháng)。這一意外發(fā)現促成了一種用手指長(cháng)度辨別身份的機器的誕生。

  人手掌紋的形成及其特異性與指紋相同。手掌形根據人類(lèi)學(xué)方法測量,可找出每個(gè)人之間的差異,但其準確性遠不如指紋。

  1.3虹膜
  人眼虹膜位于眼角膜之后,水晶體之前,其顏色因含色素的多少與分布不同而不同。透過(guò)角膜可見(jiàn)虹膜呈圓盤(pán)狀,中央有一小孔稱(chēng)瞳孔,瞳孔依環(huán)境的明暗,可自動(dòng)縮小或擴大。圓盤(pán)狀的虹膜以中央的瞳孔為中心,向周?chē)休椛錉畹募y理和小凹,猶如裙子折。瞳孔縮小時(shí)紋理變直;瞳孔擴大時(shí)紋理呈波浪形,虹膜上的紋理、血管、斑點(diǎn)等細微特征人各不同。

  1.4視網(wǎng)膜
  瑞士科學(xué)家發(fā)現每個(gè)人的視網(wǎng)膜圖紋也都是不同的。人眼球視網(wǎng)膜的中央動(dòng)脈,在眼底至視神經(jīng)乳頭處分為上下兩支,然后在視網(wǎng)膜顳側上下及鼻側上下再分為4支小動(dòng)脈,各支小動(dòng)脈再逐級分的更細、更小,以至在視網(wǎng)膜上形成四通八達的毛細血管網(wǎng),此即臨床醫生觀(guān)察眼底診病的眼底血管圖。這些血管逐級分支以至成網(wǎng),正如參天大樹(shù)逐級分出樹(shù)杈形成許多樹(shù)葉,絕無(wú)完全相同的兩個(gè)眼底血管圖。如果某個(gè)體眼底血管有先天變異,或后天變異血管或眼底發(fā)生病變,則更增添了鑒別的特殊標志。因此,在法庭科學(xué)上將眼底視網(wǎng)膜血管圖視為個(gè)人識別的優(yōu)選方法之一。

  1.5氣味
  每個(gè)人的身體散發(fā)出的氣味都是不同的。當一個(gè)人在一個(gè)地點(diǎn)活動(dòng)時(shí),他散發(fā)出的氣味就會(huì )留在周?chē)目臻g內,人離去后氣味不會(huì )馬上消失。將氣味收集起來(lái),經(jīng)濃縮轉移到清潔無(wú)味的布上就稱(chēng)為“味紋”,用電子鼻或警犬能準確區分不同人的“味紋”。

  1.6 DNA
  DNA(脫氧核糖核酸)存在于一切有核的動(dòng)、植物中,生物的全部遺傳信息都貯存在DNA分子里。DNA結構中的編碼區,即遺傳基因或稱(chēng)基因序列部分占DNA全長(cháng)的1/10~1/30,這部分就是遺傳密碼區。

  就人來(lái)講遺傳基因約有十萬(wàn)個(gè),每個(gè)均由A、T、G、C四種核苷酸按次序排列在兩條互補的螺旋的DNA長(cháng)鏈上。核苷酸的總數達30億左右,如隨機查兩個(gè)人的DNA圖譜,其完全相同的概率僅為三千億分之一,這一概率遠低于目前世界人口總數的倒數,所以其認定個(gè)人的價(jià)值可看作是100%。

  1.7血管紋路
  美國科達公司工程師喬·萊斯發(fā)現,每個(gè)人手背上樹(shù)狀血管的脈絡(luò )紋路都是不同的,即使是孿生兄弟姐妹也不具備相同的血管紋路,因為這與后天影響有關(guān),其形成及意義與網(wǎng)膜血管相同,但遠不如視網(wǎng)膜血管那么繁雜,而且透過(guò)皮膚可視的血管又有限。血管紋路識別儀主要由電腦和紅外攝像機組成。其錄入存儲與檢查的方法均較簡(jiǎn)便,只需把緊握拳的手放在攝像機下數秒鐘,經(jīng)計算機與存儲的圖像比較后即可認定或否定的結論,這不失為更簡(jiǎn)便的一種。

  1.8聲紋
  所謂聲紋(Voiceprint),是用電聲學(xué)儀器顯示的攜帶言語(yǔ)信息的聲波頻譜。
  人類(lèi)語(yǔ)言的產(chǎn)生是人體語(yǔ)言中樞與發(fā)音器官之間一個(gè)復雜的生理物理過(guò)程,人在講話(huà)時(shí)使用的發(fā)聲器官--舌、牙齒、喉頭、肺、鼻腔在尺寸和形態(tài)方面每個(gè)人的差異很大,所以任何兩個(gè)人的聲紋圖譜都有差異。每個(gè)人的語(yǔ)音聲學(xué)特征既有相對穩定性,又有變異性,不是絕對的、一成不變的。這種變異可來(lái)自生理、病理、心理、模擬、偽裝,也與環(huán)境干擾有關(guān)。盡管如此,由于每個(gè)人的發(fā)音器官都不盡相同,因此在一般情況下,人們仍能區別不同的人的聲音或判斷是否是同一人的聲音。

  1.9其他生物特征
  人類(lèi)還有其他可以進(jìn)行身份鑒別或確認的生物特征,如指法、筆跡、簽名、步態(tài)、耳形等等。所有這些生物特征在進(jìn)行身份鑒別或確認時(shí),其普遍性、唯一性、永久性、易獲取性、可區分性、防偽能力以及用戶(hù)接受程度等等,都不盡相同,因此,在不同場(chǎng)合、不同應用環(huán)境下,應選擇不同的特征。目前,在全球用生物特征進(jìn)行身份鑒別和確認的應用中,各種生物特征的使用比例分別為:手指34.7%,手31%,聲音15.8%,面孔7.1%,AFIS(自動(dòng)指紋辨認)4.4%,虹膜3.7%,簽名2.7%,視網(wǎng)膜0.6%,等等(1999年底數據)。

二、聲紋識別及其應用

  聲紋識別的應用有一些缺點(diǎn),比如同一個(gè)人的聲音具有易變性,易受身體狀況、年齡、情緒等的影響;比如不同的麥克風(fēng)和信道對識別性能有影響;比如環(huán)境噪音對識別有干擾;又比如混合說(shuō)話(huà)人的情形下人的聲紋特征不易提取;……等等。盡管如此,與其他生物特征相比,聲紋識別的應用有一些特殊的優(yōu)勢:(1)蘊含聲紋特征的語(yǔ)音獲取方便、自然,聲紋提取可在不知不覺(jué)中完成,因此使用者的接受程度也高;(2)獲取語(yǔ)音的識別成本低廉,使用簡(jiǎn)單,一個(gè)麥克風(fēng)即可,在使用通訊設備時(shí)更無(wú)需額外的錄音設備;(3)適合遠程身份確認,只需要一個(gè)麥克風(fēng)或電話(huà)、手機就可以通過(guò)網(wǎng)路(通訊網(wǎng)絡(luò )或互聯(lián)網(wǎng)絡(luò ))實(shí)現遠程登錄;(4)聲紋辨認和確認的算法復雜度低;(5)配合一些其他措施,如通過(guò)語(yǔ)音識別進(jìn)行內容鑒別等,可以提高準確率;……等等。這些優(yōu)勢使得聲紋識別的應用越來(lái)越收到系統開(kāi)發(fā)者和用戶(hù)親睞,聲紋識別的世界市場(chǎng)占有率15.8%,僅次于手指和手的生物特征識別,并有不斷上升的趨勢。

  2.1聲紋識別的分類(lèi)
  聲紋識別(Voiceprint Recognition, VPR),也稱(chēng)為說(shuō)話(huà)人識別(Speaker Recognition),有兩類(lèi),即說(shuō)話(huà)人辨認(Speaker Identification)和說(shuō)話(huà)人確認(Speaker Verification)。前者用以判斷某段語(yǔ)音是若干人中的哪一個(gè)所說(shuō)的,是“多選一”問(wèn)題;而后者用以確認某段語(yǔ)音是否是指定的某個(gè)人所說(shuō)的,是“一對一判別”問(wèn)題。不同的任務(wù)和應用會(huì )使用不同的聲紋識別技術(shù),如縮小刑偵范圍時(shí)可能需要辨認技術(shù),而銀行交易時(shí)則需要確認技術(shù)。不管是辨認還是確認,都需要先對說(shuō)話(huà)人的聲紋進(jìn)行建模,這就是所謂的“訓練”或“學(xué)習”過(guò)程。

  從另一方面,聲紋識別有文本相關(guān)的(Text-Dependent)和文本無(wú)關(guān)的(Text-Independent)兩種。與文本有關(guān)的聲紋識別系統要求用戶(hù)按照規定的內容發(fā)音,每個(gè)人的聲紋模型逐個(gè)被精確地建立,而識別時(shí)也必須按規定的內容發(fā)音,因此可以達到較好的識別效果,但系統需要用戶(hù)配合,如果用戶(hù)的發(fā)音與規定的內容不符合,則無(wú)法正確識別該用戶(hù)。而與文本無(wú)關(guān)的識別系統則不規定說(shuō)話(huà)人的發(fā)音內容,模型建立相對困難,但用戶(hù)使用方便,可應用范圍較寬。根據特定的任務(wù)和應用,兩種是有不同的應用范圍的。比如,在銀行交易時(shí)可以使用文本相關(guān)的聲紋識別,因為用戶(hù)自己進(jìn)行交易時(shí)是愿意配合的;而在刑偵或偵聽(tīng)應用中則無(wú)法使用文本相關(guān)的聲紋識別,因為你無(wú)法要求犯罪嫌疑人或被偵聽(tīng)的人配合。

  在說(shuō)話(huà)人辨認方面,根據待識別的說(shuō)話(huà)人是否在注冊的說(shuō)話(huà)人集合內,說(shuō)話(huà)人辨認可以分為開(kāi)集(open-set)辨認和閉集(close-set)辨認。前者假定待識別說(shuō)話(huà)人可以在集合外,而后者假定待識別說(shuō)話(huà)人在集合內。顯然,開(kāi)集辨認需要有一個(gè)對集外說(shuō)話(huà)人的“拒識問(wèn)題”,而且閉集辨認的結果要好于開(kāi)集辨認結果。本質(zhì)上講,說(shuō)話(huà)人確認和開(kāi)集說(shuō)話(huà)人辨認都需要用到拒識技術(shù),為了達到很好的拒識效果,通常需要訓練一個(gè)假冒者模型或背景模型,以便拒識時(shí)有可資比較的對象,閾值容易選定。而建立背景模型的好壞直接影響到拒識甚至聲紋識別的性能。一個(gè)好的背景模型,往往需要通過(guò)預先采集好的若干說(shuō)話(huà)人的數據,通過(guò)某種算法去建立。

  如果技術(shù)達到一定的水平,可以把文本相關(guān)識別并入文本無(wú)關(guān)識別,把閉集辨認并入開(kāi)集辨認,從而提供更為方便的使用方法。比如北京得意音通技術(shù)有限公司的“得意”身份證就是文本無(wú)關(guān)的、開(kāi)集方式的說(shuō)話(huà)人辨認和確認,“得意”身份證SDK還提供建立背景模型的工具。

  2.2聲紋識別的關(guān)鍵問(wèn)題

  聲紋識別可以說(shuō)有兩個(gè)關(guān)鍵問(wèn)題,一是特征提取,二是模式匹配(模式識別)。

  特征提取的任務(wù)是提取并選擇對說(shuō)話(huà)人的聲紋具有可分性強、穩定性高等特性的聲學(xué)或語(yǔ)言特征。與語(yǔ)音識別不同,聲紋識別的特征必須是“個(gè)性化”特征,而說(shuō)話(huà)人識別的特征對說(shuō)話(huà)人來(lái)講必須是“共性特征”。雖然目前大部分聲紋識別系統用的都是聲學(xué)層面的特征,但是表征一個(gè)人特點(diǎn)的特征應該是多層面的,包括:(1)與人類(lèi)的發(fā)音機制的解剖學(xué)結構有關(guān)的聲學(xué)特征(如頻譜、倒頻譜、共振峰、基音、反射系數等等)、鼻音、帶深呼吸音、沙啞音、笑聲等;(2)受社會(huì )經(jīng)濟狀況、受教育水平、出生地等影響的語(yǔ)義、修辭、發(fā)音、言語(yǔ)習慣等;(3)個(gè)人特點(diǎn)或受父母影響的韻律、節奏、速度、語(yǔ)調、音量等特征。從利用數學(xué)方法可以建模的角度出發(fā),聲紋自動(dòng)識別模型目前可以使用的特征包括:(1)聲學(xué)特征(倒頻譜);(2)詞法特征(說(shuō)話(huà)人相關(guān)的詞n-gram,音素n-gram);(3)韻律特征(利用n-gram描述的基音和能量“姿勢”);(4)語(yǔ)種、方言和口音信息;(5)通道信息(使用何種通道);等等。

  根據不同的任務(wù)需求,聲紋識別還面臨一個(gè)特征選擇或特征選用的問(wèn)題。例如,對“信道”信息,在刑偵應用上,希望不用,也就是說(shuō)希望弱化信道對說(shuō)話(huà)人識別的影響,因為我們希望不管說(shuō)話(huà)人用什么信道系統它都可以辨認出來(lái);而在銀行交易上,希望用信道信息,即希望信道對說(shuō)話(huà)人識別有較大影響,從而可以剔除錄音、模仿等帶來(lái)的影響。

  總之,較好的特征,應該能夠有效地區分不同的說(shuō)話(huà)人,但又能在同一說(shuō)話(huà)人語(yǔ)音發(fā)生變化時(shí)保持相對的穩定;不易被他人模仿或能夠較好地解決被他人模仿問(wèn)題;具有較好的抗噪性能;……。當然,這些問(wèn)題也可以通過(guò)模型方法去解決。

  對于模式識別,有以下幾大類(lèi)方法:

  (1)模板匹配方法:利用動(dòng)態(tài)時(shí)間彎折(DTW)以對準訓練和測試特征序列,主要用于固定詞組的應用(通常為文本相關(guān)任務(wù));
  (2)最近鄰方法:訓練時(shí)保留所有特征矢量,識別時(shí)對每個(gè)矢量都找到訓練矢量中最近的K個(gè),據此進(jìn)行識別,通常模型存儲和相似計算的量都很大;
  (3)神經(jīng)網(wǎng)絡(luò )方法:有很多種形式,如多層感知、徑向基函數(RBF)等,可以顯式訓練以區分說(shuō)話(huà)人和其背景說(shuō)話(huà)人,其訓練量很大,且模型的可推廣性不好;
  (4)隱式馬爾可夫模型(HMM)方法:通常使用單狀態(tài)的HMM,或高斯混合模型(GMM),是比較流行的方法,效果比較好;
  (5)VQ聚類(lèi)方法(如LBG):效果比較好,算法復雜度也不高,和HMM方法配合起來(lái)更可以收到更好的效果;
  (6)多項式分類(lèi)器方法:有較高的精度,但模型存儲和計算量都比較大;
  (7)……

  聲紋識別需要解決的關(guān)鍵問(wèn)題還有很多,諸如:短話(huà)音問(wèn)題,能否用很短的語(yǔ)音進(jìn)行模型訓練,而且用很短的時(shí)間進(jìn)行識別,這主要是聲音不易獲取的應用所需求的;聲音模仿(或放錄音)問(wèn)題,要有效地區分開(kāi)模仿聲音(錄音)和真正的聲音;多說(shuō)話(huà)人情況下目標說(shuō)話(huà)人的有效檢出;消除或減弱聲音變化(不同語(yǔ)言、內容、方式、身體狀況、時(shí)間、年齡等)帶來(lái)的影響;消除信道差異和背景噪音帶來(lái)的影響;……此時(shí)需要用到其他一些技術(shù)來(lái)輔助完成,如去噪、自適應等技術(shù)。
  對說(shuō)話(huà)人確認,還面臨一個(gè)兩難選擇問(wèn)題。通常,表征說(shuō)話(huà)人確認系統性能的兩個(gè)重要參數是錯誤拒絕率和錯誤接受率,前者是拒絕真正說(shuō)話(huà)人而造成的錯誤,后者是接受集外說(shuō)話(huà)人而造成的錯誤,二者與閾值的設定相關(guān)。在現有的技術(shù)水平下,兩者無(wú)法同時(shí)達到最小,需要調整閾值來(lái)滿(mǎn)足不同應用的需求,比如在需要“易用性”的情況下,可以讓錯誤拒絕率低一些,此時(shí)錯誤接受率會(huì )增加,從而安全性降低;在對“安全性”要求高的情況下,可以讓錯誤接受率低一些,此時(shí)錯誤拒絕率會(huì )增加,從而易用性降低。前者可以概括為“寧錯勿漏”,而后者可以“寧漏勿錯”。我們把真正閾值的調整稱(chēng)為“操作點(diǎn)”調整。好的系統應該允許對操作點(diǎn)的自由調整。

  2.3聲紋識別的應用

  聲紋識別可以應用的范圍很寬,可以說(shuō)聲紋識別幾乎可以應用到人們日常生活的各個(gè)角落。比如下面舉幾個(gè)例子。

  (1)信息領(lǐng)域。比如在自動(dòng)總機系統中,把“得意”身份證之聲紋辨認(www.d-ear.com/Technologies&Products/Products-d-Ear%20ID_ch.htm)和“得意”關(guān)鍵詞檢出器(http://www.d-ear.com/Technologies&Products/Products-d-Ear%20Word-Spotter_ch)結合起來(lái),可以在姓名自動(dòng)撥號的同時(shí)向受話(huà)方提供主叫方的身份信息。前者用于身份認證,后者用于內容認證。同樣,聲紋識別技術(shù)可以在呼叫中心(Call Center)應用中為注冊的常客戶(hù)提供友好的個(gè)性化服務(wù)。
  (2)銀行、證券。鑒于密碼的安全性不高,可以用聲紋識別技術(shù)對電話(huà)銀行、遠程炒股等業(yè)務(wù)中的用戶(hù)身份進(jìn)行確認,為了提供安全性,還可以采取一些其他措施,如密碼和聲紋雙保險,如隨機提示文本用文本相關(guān)的聲紋識別技術(shù)進(jìn)行身份確認(隨機提示文本保證無(wú)法用事先錄好的音去假冒),甚至可以把交易時(shí)的聲音錄下來(lái)以備查詢(xún)。
  (3)公安司法。對于各種電話(huà)勒索、綁架、電話(huà)人身攻擊等案件,聲紋辨認技術(shù)可以在一段錄音中查找出嫌疑人或縮小偵察范圍;聲紋確認技術(shù)還可以在法庭上提供身份確認的旁證。
  (4)軍隊和國防。聲紋辨認技術(shù)可以察覺(jué)電話(huà)交談過(guò)程中是否有關(guān)鍵說(shuō)話(huà)人出現,繼而對交談的內容進(jìn)行跟蹤(戰場(chǎng)環(huán)境監聽(tīng));在通過(guò)電話(huà)發(fā)出軍事指令時(shí),可以對發(fā)出命令的人的身份進(jìn)行確認(敵我指戰員鑒別)。目前該技術(shù)在國外軍事方面已經(jīng)有所應用,據報道,迫降在我國海南機場(chǎng)的美軍EP-3偵察機中就載有類(lèi)似的聲紋識別偵聽(tīng)模塊。
  (5)保安和證件防偽。如機密場(chǎng)所的門(mén)禁系統。又如聲紋識別確認可用于信用卡、銀行自動(dòng)取款機、門(mén)、車(chē)的鑰匙卡、授權使用的電腦、聲紋鎖以及特殊通道口的身份卡,把聲紋存在卡上,在需要時(shí),持卡者只要將卡插入專(zhuān)用機的插口上,通過(guò)一個(gè)傳聲器讀出事先已儲存的暗碼,同時(shí)儀器接收持卡者發(fā)出的聲音,然后進(jìn)行分析比較,從而完成身份確認。同樣可以把含有某人聲紋特征的芯片嵌入到證件之中,通過(guò)上面所述的過(guò)程完成證件防偽。
  (6)……等等。
  北京得意音通技術(shù)有限責任公司開(kāi)發(fā)的“得意”身份證開(kāi)發(fā)工具,可以很好應用于上述領(lǐng)域中。“得意”身份證有如下特點(diǎn):(1)文本和語(yǔ)言無(wú)關(guān)性。用戶(hù)訓練系統和系統對用戶(hù)的聲音進(jìn)行鑒別和確認,可以是完全不同的文本,完全不同的語(yǔ)言。(2)對語(yǔ)音長(cháng)度沒(méi)有特殊要求。用戶(hù)訓練系統,讓其記住其聲紋,只需要幾秒種(如8秒)的聲音;而在識別時(shí),系統只要獲得被測試人幾秒(如4秒)的聲音,就可以進(jìn)行聲紋識別。在某些情況下,比如待識別人語(yǔ)音很難獲取時(shí),系統可以通過(guò)一秒一秒不斷累積的漸進(jìn)方式,來(lái)判斷說(shuō)話(huà)人的身份。隨著(zhù)被測試者說(shuō)的話(huà)的累積長(cháng)度不斷增加,系統識別的準確性越來(lái)越高。(3)很高的精度。“得意”身份證技術(shù)的辨認和確認準確度都很高,可以到達接近100%的準確率。(4)模型小。存儲每個(gè)人聲紋的存儲<5KB。(5)操作點(diǎn)調整方便。“得意”身份證技術(shù)允許開(kāi)發(fā)者方便地調整操作點(diǎn)參數。

三、聲紋S鎖-數據安全的衛士

  在本文開(kāi)頭所談,國際互聯(lián)網(wǎng)和無(wú)線(xiàn)通信技術(shù)的普及和推廣,在給人們帶來(lái)極大方便的同時(shí),也給重要數據和個(gè)人隱私帶來(lái)被信息化吞食的危險。那么是否有解決方案呢?答案是肯定的。
  比如,我們可以設計一種USB接口的聲紋S鎖。對于S鎖持有者計算機上重要數據的存取,必須以下兩個(gè)條件同時(shí)滿(mǎn)足:
  (1)持有S鎖并將其插入計算機的USB接口;
  (2)由S鎖合法用戶(hù)本人口述命令經(jīng)聲紋鑒證系統確認與S鎖中鎖存的聲紋一致。

  北京得意音通公司在國際上率先推出的“聲紋S鎖”,利用對人類(lèi)具有唯一性的聲紋這個(gè)主要的生物特征,把具有全部自主知識產(chǎn)權和國際領(lǐng)先的聲紋識別技術(shù)和數據安全技術(shù)緊密結合在一起,對個(gè)人電腦甚至服務(wù)器中的重要數據進(jìn)行雙重安全認證,保證了數據的安全性,聲紋和鑰匙同時(shí)正確才可以存取數據,即使硬盤(pán)丟失數據也不會(huì )失竊。還無(wú)需記憶密碼,因為聲紋就是密碼,人在密碼在,免除記憶密碼的煩惱,也無(wú)需擔心被別人破解或者偷竊密碼。

  從此,人們就可以方便地應用先進(jìn)的聲紋識別技術(shù),管理自己的電腦和電腦中的信息。你可以象阿里巴巴一樣對著(zhù)電腦麥克風(fēng)口述你的命令,只需隨意講出幾句話(huà),就電腦就乖乖地聽(tīng)話(huà),打開(kāi)只屬于你自己的信息“保險箱”,實(shí)現強有力的Windows安全登錄、身份認證、文件加密存儲、訪(fǎng)問(wèn)權限控制等功能,有效地保護保存在個(gè)人計算機上的個(gè)人隱私信息、重要業(yè)務(wù)數據和系統中的應用軟件,使其不被偷看、竊取、泄露、篡改或破壞。更重要的是,由于聲紋的唯一性特征,“聲紋S鎖”只認識你的聲音,只給你開(kāi)門(mén),別人企圖模仿你的聲音和口令、偷窺你的信息也是很難做到的。

  科技不僅在你身邊,還在你身上、嘴邊。科技的發(fā)展,有時(shí)候會(huì )帶來(lái)很多新的困擾,比如數據安全的問(wèn)題。因此,科技應該更人性化,為人們創(chuàng )造的輕松和愉快的數字化生活。聲紋識別技術(shù),就是輕松、愉快的數字化生活的阿里巴巴魔咒。

作者供稿 原文刊登于新浪科技《權威學(xué)術(shù)報告》專(zhuān)欄



相關(guān)鏈接:
得意珠三角綜合智能信息增值平臺項目中標 2009-08-20
北京軟件產(chǎn)品質(zhì)量檢測檢驗中心對《海量語(yǔ)音文件的目標說(shuō)話(huà)人篩選系統》進(jìn)行測試 2009-06-25
廣東政府和清華大學(xué)舉行了全面開(kāi)展產(chǎn)學(xué)研合作協(xié)議簽約儀式 2009-06-25
得意中文整句輸入法V1.0開(kāi)源for Windows Mobile5.0 2009-01-23
得意聲紋識別VPR4.0_b20080808新版本發(fā)布 2008-08-27

分類(lèi)信息:     文摘   技術(shù)_語(yǔ)音識別_文摘
亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 锦屏县| 东乌珠穆沁旗| 沅陵县| 务川| 临沧市| 富蕴县| 绥滨县| 界首市| 沁阳市| 嘉禾县| 南召县| 青岛市| 霍州市| 晋中市| 加查县| 建水县| 岳西县| 甘孜| 南汇区| 长顺县| 黑龙江省| 托克逊县| 西乌珠穆沁旗| 若尔盖县| 额尔古纳市| 福建省| 万宁市| 留坝县| 岢岚县| 河东区| 南涧| 泽州县| 建平县| 馆陶县| 休宁县| 房山区| 沙坪坝区| 红原县| 长宁区| 黄骅市| 渭源县| http://444 http://444 http://444 http://444 http://444 http://444