
STT賦能的語(yǔ)音控制應用程序于2017年啟動(dòng),為視頻生成字幕,并在其他功能中處理每個(gè)月超過(guò)十億分鐘的語(yǔ)音。
Google Cloud現在發(fā)布了一個(gè)新的神經(jīng)序列到序列模型,用于語(yǔ)音識別,該模型在不同的用例,噪聲環(huán)境,聲學(xué)條件和詞匯量方面進(jìn)行了測試。
新模型基礎架構基于尖端的機器學(xué)習技術(shù),該技術(shù)使用戶(hù)可以更有效地利用語(yǔ)音培訓數據。
Google Cloud Speech Team杰出科學(xué)家Fran?oiseBeaufays在博客文章中說(shuō):
“使用STTAPI時(shí),企業(yè)和開(kāi)發(fā)人員都會(huì )立即看到盒子外質(zhì)量的改進(jìn),盡管您始終可以調整模型以提高性能,但可以在無(wú)需任何初始調整下即可感受到這種新體系結構的好處。”
“隨著(zhù)模型對各種聲音,噪聲環(huán)境和聲學(xué)條件的擴展支持,您可以在更多的上下文中產(chǎn)生更準確的輸出,從而使您更快,輕松,有效地將語(yǔ)音技術(shù)嵌入在應用程序中。”
隨著(zhù)模型的擴展支持,用戶(hù)現在可以更自然地對其智能家居設備使用更長(cháng)的句子說(shuō)話(huà)。
聲明:版權所有 非合作媒體謝絕轉載