據科技博客TechCrunch報道,谷歌計劃向第三方開(kāi)發(fā)者開(kāi)放其語(yǔ)音識別API,與Nuance及其它的語(yǔ)音識別公司競爭。為了吸引開(kāi)發(fā)者,該API一開(kāi)始將免費提供。

有關(guān)該服務(wù)的消息已經(jīng)傳了好幾周。該公司今天在NEXT云用戶(hù)大會(huì )上正式公布了該項服務(wù)。
谷歌表示,谷歌云語(yǔ)音API(Google Cloud Speech API)將覆蓋超過(guò)80種語(yǔ)言,兼容任何實(shí)時(shí)串流或者批處理模式的應用,它將為應用程序提供一整套API,給它們帶來(lái)“看、聽(tīng)與翻譯”方面的功能。它基于目前驅動(dòng)谷歌應用的語(yǔ)音搜索和谷歌鍵盤(pán)的語(yǔ)音輸入的神經(jīng)網(wǎng)絡(luò )技術(shù)。它還有一些其它有趣的功能,如可在嘈雜的環(huán)境運行,支持實(shí)時(shí)運行。
谷歌的這一舉措將會(huì )對整個(gè)行業(yè)產(chǎn)生不小的影響——尤其是對Nuance。長(cháng)期以來(lái),Nuance一直被認為是業(yè)界最好的語(yǔ)音識別技術(shù)提供商,它也是該領(lǐng)域最大的一家公司。鑒于谷歌提供的體驗比現有提供商要好,而且定價(jià)較低,包括創(chuàng )業(yè)公司在內的眾多Nuance客戶(hù)有可能會(huì )轉投谷歌技術(shù)的懷抱。
為了引起開(kāi)發(fā)者的興趣,谷歌的語(yǔ)音識別API一開(kāi)始將完全免費提供。未來(lái)它將要收費,但價(jià)格很可能會(huì )比較低。谷歌可能會(huì )在成為該行業(yè)的主導者之后再上調服務(wù)價(jià)格。
截至目前為止,谷歌在其產(chǎn)品中提供的語(yǔ)音技術(shù)訪(fǎng)問(wèn)權限十分有限。該公司在去年的I/O大會(huì )上發(fā)布了一款語(yǔ)音交互API,讓Android開(kāi)發(fā)者可以為他們的應用加入語(yǔ)音交互功能。不過(guò),谷歌尚未直接開(kāi)放它的語(yǔ)音識別API。
而語(yǔ)音識別API的推出,將不僅僅影響到Nuance和其它的語(yǔ)音識別技術(shù)提供商,也將會(huì )對蘋(píng)果造成沖擊。蘋(píng)果虛擬助手Siri的語(yǔ)音識別功能并不如谷歌的。蘋(píng)果目前也沒(méi)有通過(guò)提供API讓開(kāi)發(fā)者在他們的應用中使用Siri技術(shù)。
種種跡象顯示,谷歌似乎變得更加注重語(yǔ)音技術(shù)和眾多的使用案例。例如,該公司在2月宣布將允許Google Docs用戶(hù)通過(guò)語(yǔ)音來(lái)編輯和設計文檔。