- 早期測試顯示:VocalZoom的光學(xué)傳感器能將科大訊飛的聲控平臺的自動(dòng)語(yǔ)音識別(ASR)性能平均顯著(zhù)提高50%以上。
- 最明顯的性能增強體現在最高噪音級別環(huán)境中,例如:將車(chē)窗保持打開(kāi)狀態(tài)時(shí)駕駛汽車(chē)所產(chǎn)生的噪音。
- 很多公司正在探索將VocalZoom的傳感器技術(shù)與科大訊飛的“語(yǔ)音云”結合起來(lái),而“語(yǔ)音云”是中國領(lǐng)先的移動(dòng)云和嵌入式應用程序的智能語(yǔ)音平臺。
作為人機交流(HMC)光學(xué)傳感器的主要供應商--VocalZoom,其產(chǎn)品可以帶來(lái)一種更自然、更個(gè)性化的、安全的聲控體驗。今天該公司宣布,它已經(jīng)與科大訊飛簽署了一項協(xié)議,將VocalZoom的人機交流(HMC)光學(xué)傳感器與科大訊飛的“語(yǔ)音云”智能語(yǔ)音技術(shù)平臺相結合,并進(jìn)行性能測試;該平臺是在中國應用最為廣泛的解決方案,擁有數以百萬(wàn)計的用戶(hù)。初步結果表明,通過(guò)向用戶(hù)耳機和汽車(chē)信息娛樂(lè )解決方案中加入VocalZoom傳感器,科大訊飛的自動(dòng)語(yǔ)音識別(ASR)功能可以平均得到50%的改善,尤其在嘈雜的噪音環(huán)境中得到更多的改善。
“隨著(zhù)我們不斷探索將兩種技術(shù)融合到語(yǔ)音控制和身份驗證的革命性解決方案中,VocalZoom 和科大訊飛打算在本月完成聯(lián)合測試。我們通過(guò)使用更小、更時(shí)尚的耳機以及在各種各樣的應用程序中的其他解決方案來(lái)共享更好的聲控體驗。”
科大訊飛高級研究員王海坤(Haikun Wang)表示“根據全球主要基準測試的標準,科大訊飛已經(jīng)成為最好的聲控解決方案,但是當前面臨的最大挑戰就是在噪音環(huán)境中的性能表現。我們相信VocalZoom的技術(shù)可以為我們在性能改善方面取得突破性進(jìn)步奠定基礎。” 他續指 “我們已經(jīng)在多個(gè)場(chǎng)景中測試了VocalZoom傳感器,其中包括將車(chē)窗保持打開(kāi)狀態(tài)以及狂風(fēng)噪聲的環(huán)境下,在駕駛的汽車(chē)內部所產(chǎn)生噪音的場(chǎng)景,而相應的性能改善是相當可觀(guān)的。”
使用虛擬助理和汽車(chē)語(yǔ)音控制的人機交互的關(guān)鍵是這臺機器是否可以完成人們指定的任務(wù),并且足夠快速、準確地滿(mǎn)足用戶(hù)需求。即使是最新的降噪法,如今的聲學(xué)麥克風(fēng)在這種控制水平下仍舊不能達到足夠的聲音隔離效果,特別是在嘈雜的環(huán)境中。VocalZoom多功能人機交流(HMC)傳感器通過(guò)收集人在談話(huà)時(shí)的其他數據來(lái)解決這個(gè)問(wèn)題,例如人在說(shuō)話(huà)時(shí)嘴巴、嘴唇、臉頰和喉嚨附近的面部皮膚的震動(dòng)等數據。通過(guò)將VocalZoom光學(xué)人機交流(HMC)傳感器集成到聲控解決方案中,并令它著(zhù)重針對這些領(lǐng)域,可以捕足、測量面部震動(dòng)的數據,并將其轉換為一個(gè)獨立的、近乎完美的參考信號。系統可以通過(guò)這個(gè)信號進(jìn)行運轉,而不受噪音水平的影響。
“能夠與科大訊飛合作,顯著(zhù)提高最為廣泛使用的自動(dòng)語(yǔ)音識別(ASR)平臺的性能,我們感到非常興奮,” VocalZoom銷(xiāo)售和業(yè)務(wù)發(fā)展副總裁Rammy Bahalul如是說(shuō)。“隨著(zhù)我們不斷探索將兩種技術(shù)融合到語(yǔ)音控制和身份驗證的革命性解決方案中,VocalZoom 和科大訊飛打算在本月完成聯(lián)合測試。我們通過(guò)使用更小、更時(shí)尚的耳機以及在各種各樣的應用程序中的其他解決方案來(lái)共享更好的聲控體驗。”
VocalZoom和科大訊飛已經(jīng)測試了一個(gè)解決方案的性能,即在多個(gè)不同噪音級別的場(chǎng)景中以及結合音樂(lè )、汽車(chē)噪音和其他干擾因素的移動(dòng)汽車(chē)內部,對兩家公司的技術(shù)相結合的解決方案進(jìn)行了測試。自動(dòng)語(yǔ)音識別(ASR)性能已經(jīng)被提高至一個(gè)幾乎完美的級別,而之前在同樣的高強度噪聲環(huán)境中,理想的聲控性能幾乎是不可能的。