20世紀40年代,“聲紋”概念首次在Bell實(shí)驗室被提出。1966年,美國法院采用“聲紋”進(jìn)行取證后,聲紋技術(shù)開(kāi)始在司法場(chǎng)景應用。伴隨聲紋技術(shù)在金融行業(yè)使用的標準頒布,聲紋技術(shù)落地應用迎來(lái)了開(kāi)篇。
聲紋識別又稱(chēng)“說(shuō)話(huà)人識別”,與語(yǔ)音識別同屬于語(yǔ)音前端信號處理環(huán)節。若語(yǔ)音識別的重點(diǎn)在于“說(shuō)了什么”,聲紋識別則解決了“誰(shuí)說(shuō)的”問(wèn)題。因其非接觸式特性,聲音成為補全人臉、指紋、虹膜等生物識別的一種新方式。
繼“刷臉”、“刷指紋”之后,聲紋識別走進(jìn)尋常生活。
“登錄銀行APP”
用戶(hù)說(shuō)出隨機驗證碼,進(jìn)行驗證登錄,即可進(jìn)行余額查詢(xún)、轉賬服務(wù)。
“開(kāi)啟車(chē)門(mén)”
車(chē)門(mén)應聲解鎖
“打開(kāi)空調”
空調識別出是A主人說(shuō)話(huà),將溫度設置成他習慣的24℃。
以隨身“ID”的特性,聲紋技術(shù)在金融、汽車(chē)、家居等場(chǎng)景迎來(lái)落地,其是否具備可用性、長(cháng)效穩定成為用戶(hù)對AI技術(shù)信任的重要考量。
“逆流而上”的硬核科技——聲紋識別
疫情之下,聲紋識別技術(shù)填補了遠程身份驗證的市場(chǎng)需求,在銀行數字化轉型里大放異彩。思必馳在服務(wù)西南某銀行實(shí)現數字化轉型中,將聲紋識別技術(shù)納入了升級的范疇。
聲紋技術(shù)為銀行數字轉型注入新力量。中國信通院《中國聲紋識別產(chǎn)業(yè)發(fā)展白皮書(shū)2.0》報告顯示,截至2020年下半年,30家銀行機構采購了聲紋識別技術(shù)產(chǎn)品,其中動(dòng)態(tài)聲紋密碼登錄成為第一大應用場(chǎng)景,用于賬號登錄、轉賬、找回密碼等業(yè)務(wù)場(chǎng)景。微信、支付寶等主流的移動(dòng)支付平臺,也陸續上線(xiàn)了基于聲紋動(dòng)態(tài)口令登錄的功能。
信息來(lái)源:《中國聲紋識別產(chǎn)業(yè)發(fā)展白皮書(shū)》
窺一斑而知全豹,思必馳深研多年聲紋技術(shù)有了落地生根的土壤。除了作為全新的身份認證“活密碼”為金融安全保駕護航,更在出行場(chǎng)景中,有了新嘗試。
運用于電動(dòng)兩輪車(chē)領(lǐng)域的聲紋解鎖方案由此誕生,基于固定文本+隨機驗證碼認證,融合文本相關(guān)和文本半相關(guān)的聲紋識別方案,獲得了比固定文本更高的聲紋識別率,且有效防止被提前錄音,具備了更高的安全性。
文本相關(guān)聲紋,識別準確率高,但易被提前錄音;文本半相關(guān)聲紋,有效防止錄音,但識別準確率欠缺。
思必馳聲紋解鎖方案基于“固定文本+隨機驗證碼”(你好小馳3751),用戶(hù)語(yǔ)音通過(guò)多麥語(yǔ)音增強技術(shù),先判斷內容是否與系統發(fā)送的驗證碼一致,再通過(guò)聲紋識別系統進(jìn)行身份確認。通過(guò)內容驗證+聲紋驗證雙重認證才能成功解鎖。
聲紋技術(shù)讓解鎖騎行的方式更自由。
對抗攻擊,防御自有奇招
在實(shí)際應用中,聲紋識別系統在對抗攻擊性下體現出的安全穩定至關(guān)重要,基于此,思必馳采取了一系列技術(shù)手段。
·聲紋仿冒攻擊技術(shù)
思必馳通過(guò)聲紋ID檢測判斷是否為本人說(shuō)話(huà),并通過(guò)仿冒攻擊技術(shù)對抗錄音與合成音的攻擊,加強了智能電子設備的私人屬性。基于文本相關(guān)和文本無(wú)關(guān)的聲紋融合方案,保證聲紋準確率達到99%的同時(shí)誤判率低至千分之五甚至千分之一 ,有效防止錄音攻擊和合成音攻擊。
在開(kāi)放場(chǎng)景下,例如地鐵、馬路、商場(chǎng)等高噪聲場(chǎng)景下,仍能達到很好的效果。思必馳聲紋識別系統達到國家金融權威機構認證的聲紋技術(shù)安全標準。并通過(guò)了中國信通院主持的聲紋識別服務(wù)能力基礎評估測試,展示出了高可信度的產(chǎn)品及服務(wù)。

聲紋識別開(kāi)啟個(gè)性化交互
聲紋識別技術(shù)在民生場(chǎng)景層下沉。例如在家居產(chǎn)品中,基于聲紋識別技術(shù)智能終端可以給予用戶(hù)個(gè)性化推薦;車(chē)載場(chǎng)景下聲紋識別能夠完成語(yǔ)音解鎖;安防場(chǎng)景下還可應用于聲紋門(mén)禁等等。
通過(guò)聲紋的辨聲識人能力,家里的智能音箱可以為老人推薦戲曲,為小孩播放詩(shī)詞,聲紋技術(shù)產(chǎn)生了與全家人生活連接的天然契合。思必馳聲紋識別技術(shù)已在美的空調、海信電視等多款家居產(chǎn)品中應用,為用戶(hù)提供個(gè)性化的推薦服務(wù)。
聲紋可控制各類(lèi)設備的訪(fǎng)問(wèn)權限。穿戴產(chǎn)品中,思必馳通過(guò)骨傳導低功耗喚醒技能避免他人誤喚醒,并融合聲紋技術(shù)實(shí)現語(yǔ)音交互、低敏感度APP解鎖等功能,現已賦能多家手機廠(chǎng)商、移動(dòng)電子設備的落地。此前雅迪發(fā)布旗下城市高端品牌VFLY,多款車(chē)型均具備聲紋解鎖能力,讓出行更自由。用戶(hù)聲紋庫可離線(xiàn)保存,數據更安全。
聲紋技術(shù)仍需回歸理性。未來(lái),聲紋識別技術(shù)將朝著(zhù)聲紋+智能,及多模態(tài)識別的方向發(fā)展。思必馳將持續挖掘不同場(chǎng)景下的技術(shù)開(kāi)發(fā)需求,在標準的正確引導和業(yè)界的共同努力下探索AI精神,擁有廣闊應用場(chǎng)景的聲紋識別技術(shù),定能走進(jìn)更多普通人的生活。