亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩,日本久久久久,日本-区二区三区免费精品,中文字幕日本亚洲欧美不卡

富士通研發(fā)基于深度學(xué)習(xí)的短時(shí)長(zhǎng)聲紋認(rèn)證技術(shù)

2017-03-13 14:27:35 作者：來源：CTI論壇評(píng)論：0 　點(diǎn)擊：

　　富士通研究開發(fā)中心有限公司(FRDC)開發(fā)了一種高精度的聲紋認(rèn)證技術(shù)，該技術(shù)利用深度學(xué)習(xí)方法，可以從一段很短的語音片段中甄別出說話人的身份。該技術(shù)融合了兩個(gè)深度學(xué)習(xí)引擎，一個(gè)引擎用于提取與語音內(nèi)容相關(guān)的特征，而另一個(gè)引擎用于提取與說話人相關(guān)的特征，從而實(shí)現(xiàn)了“語音密碼”身份認(rèn)證的功能，即：只有說話人本人正確說出預(yù)先設(shè)定的內(nèi)容時(shí)，其身份才能被接受。利用該技術(shù)，在不超過3s的語音片段上，身份認(rèn)證的錯(cuò)誤率可達(dá)到2.2%左右。

　　該技術(shù)可廣泛應(yīng)用于呼叫中心及IoT設(shè)備交互等應(yīng)用中，通過快速安全的驗(yàn)證用戶的身份，強(qiáng)化操作的安全性和便利性。

　　【開發(fā)背景】

　　聲紋識(shí)別是生物認(rèn)證領(lǐng)域的一個(gè)重要分支。由于具有可遠(yuǎn)程操作的獨(dú)特優(yōu)勢(shì)，在金融業(yè)電話銀行業(yè)務(wù)、智能家居、刑偵安防等領(lǐng)域中，基于聲紋的身份認(rèn)證方式已經(jīng)逐漸被認(rèn)可，并成為防欺詐的一個(gè)重要手段。在呼叫中心業(yè)務(wù)中，顧客常常需要輸入密碼或通過回答一系列的問題來驗(yàn)證其身份。這種問詢式身份驗(yàn)證過程平均需要60秒以上的時(shí)間，既影響了客服的工作效率，又給顧客帶來厭煩情緒。因此，開發(fā)一種安全有效的遠(yuǎn)程身份驗(yàn)證方式，將大幅提升呼叫中心的運(yùn)營(yíng)效率，降低其運(yùn)營(yíng)成本。

　　【課題】

　　傳統(tǒng)的聲紋識(shí)別技術(shù)，依靠統(tǒng)計(jì)學(xué)和信號(hào)處理技術(shù)從語音中提取與說話人特質(zhì)相關(guān)的特征，以此實(shí)現(xiàn)身份認(rèn)證。然而，該技術(shù)往往需要較長(zhǎng)的語音才能鑒定說話人的身份，例如30秒時(shí)長(zhǎng)。在金融業(yè)呼叫中心及IoT設(shè)備交互等應(yīng)用中，需要快速驗(yàn)證用戶的身份，傳統(tǒng)的聲紋識(shí)別技術(shù)顯然不能滿足這種需求。此外，傳統(tǒng)的認(rèn)證方式不能防止利用他人的錄音來假冒身份的欺詐行為。

　　【開發(fā)的方法】

　　(1)采用深度學(xué)習(xí)技術(shù)有效降低語音時(shí)長(zhǎng)

　　傳統(tǒng)的聲紋識(shí)別技術(shù)通常將語音分割成小片段(一般為20ms左右，稱為一幀)，然后，利用上千個(gè)高斯模型，從每一個(gè)語音片段中甄別出與說話人相關(guān)的特征。由于高斯模型數(shù)目多、維度高，因此，只有當(dāng)語音數(shù)據(jù)足夠多時(shí)，這種統(tǒng)計(jì)方法才能獲得有效的說話人特征。如圖1所示，深度學(xué)習(xí)技術(shù)能同時(shí)處理多幀語音片段，從中學(xué)習(xí)與說話人特有的特征。由于處理的語音長(zhǎng)度增加，因此，其包含了更多的與發(fā)音方式相關(guān)的特征，例如語調(diào)變化、停頓、音頻等。所以，這種上下文技術(shù)能大大降低身份認(rèn)證所需要的語音長(zhǎng)度。

富士通研發(fā)基于深度學(xué)習(xí)的短時(shí)長(zhǎng)聲紋認(rèn)證技術(shù)

　　(2)融合說話人特征與語音內(nèi)容

　　本技術(shù)中，我們采用兩個(gè)深度學(xué)習(xí)模型，分別提取和說話人本身相關(guān)的特征以及語音內(nèi)容進(jìn)行身份驗(yàn)證，從而實(shí)現(xiàn)了“語音密碼”功能，即：只有說話人本人正確說出預(yù)先設(shè)定的內(nèi)容時(shí)，其身份才能被接受，如圖2所示。采用固定的語音密碼，一方面能防止利用他人的錄音來假冒身份的欺詐行為，此外，還能幫助提取更有效的說話人特征。例如：某人的語音密碼中包含了音節(jié)[a]，而此人對(duì)音節(jié)[a]的發(fā)音模式與他人不同，那么，這個(gè)特定的模式就被說話人模型所學(xué)習(xí)，成為區(qū)分此人的一個(gè)重要特征。即使他人知道了語音密碼，由于音節(jié)[a]的發(fā)音模式不同，其身份也不能被接受。

　　【效果】

　　由于充分利用了上下文信息，我們的技術(shù)只需要2-3秒的語音片段就可以甄別出說話人的身份。雖然語音長(zhǎng)度變短了，但是，我們的技術(shù)依然可以達(dá)到較高的識(shí)別精度。在一個(gè)由200人組成的數(shù)據(jù)集上，身份認(rèn)證的錯(cuò)誤率可低至2.2%左右。

　　【將來】

　　FRDC今后會(huì)將本技術(shù)應(yīng)用于金融保險(xiǎn)等行業(yè)的呼叫中心，向客戶提供高效安全的身份認(rèn)證解決方案。此外，F(xiàn)RDC還將繼續(xù)推進(jìn)和擴(kuò)大聲紋認(rèn)證在監(jiān)獄親情電話管理中的應(yīng)用。

復(fù)制網(wǎng)址收藏打印郵件微信新浪微博一鍵分享 QQ 更多

相關(guān)熱詞搜索：富士通聲紋認(rèn)證深度學(xué)習(xí)

上一篇:智慧城市指揮中心激光大屏大行其道

下一篇:最后一頁

相關(guān)閱讀：

·8Manage助香港富士通打通企業(yè)一體化管理的“奇經(jīng)八脈”2016-12-12 14:15:36
·富士通：我們已經(jīng)正式加入云陣營(yíng)！2015-11-19 14:03:34
·富士通發(fā)布新一代高端存儲(chǔ)系統(tǒng)和企業(yè)級(jí)數(shù)據(jù)庫平臺(tái)2015-09-22 10:03:15
·富士通推出OpenStack云端服務(wù)K5 搶攻公有云市場(chǎng)2015-05-13 09:24:48
·富士通聯(lián)手NTT DoCoMo進(jìn)行5G試驗(yàn)2014-05-09 10:18:30
·富士通發(fā)表廣域網(wǎng)絡(luò)分散處理技術(shù) 2014-03-17 14:33:09

評(píng)論排行

專題

華為生態(tài)伙伴大會(huì)2017: 因聚而生-華為ΣCO-Partner大會(huì)于三月九日在湖南長(zhǎng)沙國(guó)...[詳細(xì)]

2017年世界移動(dòng)通...: 世界移動(dòng)通信大會(huì)會(huì)議于2月27日至3月2日舉行，屆時(shí)將探...[詳細(xì)]

擁抱云、融入云、...: 華為輪值CEO 徐直軍在華為全聯(lián)接大會(huì)上發(fā)表主題演講：...[詳細(xì)]

2017中國(guó)呼叫中心...: 　　業(yè)界矚目的2017中國(guó)呼叫中心及企業(yè)通信大會(huì)春季展會(huì)...[詳細(xì)]

亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩,日本久久久久,日本-区二区三区免费精品,中文字幕日本亚洲欧美不卡

富士通研發(fā)基于深度學(xué)習(xí)的短時(shí)長(zhǎng)聲紋認(rèn)證技術(shù)

評(píng)論排行

推薦閱讀

專題

大家都在看