廈門(mén)日報訊(記者 林露虹)近日,在世界級聲紋識別競賽中,廈門(mén)火炬高新區企業(yè)快商通拔得頭籌。根據VoxSRC國際說(shuō)話(huà)人識別競賽(聲紋識別競賽)最新公布的榜單顯示,快商通Kriston AI團隊以4.9%的說(shuō)話(huà)人日志錯誤率,位列榜單第一,展現了中國人工智能技術(shù)的硬核實(shí)力。

VoxSRC比賽由英國牛津大學(xué)、韓國NAVER公司、美國斯坦福國際研究院語(yǔ)音技術(shù)與研究實(shí)驗室和麻省理工學(xué)院林肯實(shí)驗室組織發(fā)起,是聲紋識別領(lǐng)域有影響力和權威性的國際賽事,每年都吸引大批業(yè)界精英參與。
據快商通聯(lián)合創(chuàng )始人李稀敏介紹,VoxSRC比賽采用隨機抽題、提交回答后系統自動(dòng)打分的形式進(jìn)行,榜單類(lèi)似體育運動(dòng)員的積分排名榜,定期更新。“簡(jiǎn)單理解,比賽題目是多個(gè)人說(shuō)話(huà)的語(yǔ)音數據包,參賽團隊開(kāi)發(fā)的AI系統需根據語(yǔ)音數據來(lái)判斷‘誰(shuí)在什么時(shí)候說(shuō)話(huà)’。題目設置了不少干擾項,語(yǔ)音長(cháng)短不一,數據來(lái)源也五花八門(mén),這對參賽者來(lái)說(shuō)是不小的挑戰。”
快商通的機器人是如何精準“揪”出說(shuō)話(huà)人的?李稀敏說(shuō),團隊訓練機器人主要有兩類(lèi)技術(shù)路線(xiàn):一是從“你一言我一語(yǔ)”的多人對話(huà)中找出說(shuō)話(huà)人的“轉折點(diǎn)”;二是基于神經(jīng)網(wǎng)絡(luò )的深度學(xué)習,給機器人“喂食”大量的語(yǔ)音數據,以數據驅動(dòng)來(lái)提升機器人識別水平。
快商通是我市自主培育的人工智能企業(yè)。經(jīng)過(guò)十多年的積累,快商通Kriston AI團隊在聲紋識別、語(yǔ)音識別等人工智能領(lǐng)域創(chuàng )造了多項行業(yè)領(lǐng)先的技術(shù)創(chuàng )新,擁有發(fā)明專(zhuān)利超過(guò)500項。