谷歌今天開(kāi)放了自然語(yǔ)言理解軟件SyntaxNet的源代碼,將其作為該公司TensorFlow開(kāi)源機器學(xué)習庫的一部分。這款軟件可以用于自動(dòng)分析語(yǔ)句含義,而此次公布的包括訓練新模型的代碼,以及英語(yǔ)文本分析的預訓練模型。
谷歌表示,這個(gè)名為Parsey McParseface的句法分析程序可以自動(dòng)判斷某個(gè)單詞是名詞、動(dòng)詞還是形容詞,它是目前全球同類(lèi)程序中準確度最高的一款,甚至可以與人類(lèi)語(yǔ)言學(xué)家媲美。
這種技術(shù)在自然語(yǔ)言研究領(lǐng)域擁有極其重要的意義。但對谷歌本身而言同樣意義重大。

“我們內部評估技術(shù)的方法非常不同。我們不太關(guān)心基準,更加關(guān)心對下游系統性能的影響。我們的目標是改善用戶(hù)體驗。”谷歌研究院產(chǎn)品經(jīng)理戴夫·奧爾(DaveOrr)說(shuō)。
與TensorFlow一樣,SyntaxNet主要使用C++執行。它現在實(shí)現了開(kāi)源,使得外部程序員也可以對其加以改進(jìn),從而幫助該公司尋找新的人才并改進(jìn)產(chǎn)品。整體而言,語(yǔ)句分析與產(chǎn)品評論有關(guān),包括應用評論以及餐館和購物點(diǎn)評,這項技術(shù)與互聯(lián)網(wǎng)搜索和Google Now On Tap功能也有關(guān)系。
“這非常重要,因為語(yǔ)言有的時(shí)候很微妙,未必能直接理解人們的意思,有些內容與上下文關(guān)系很緊密。”谷歌研究院團隊主管塔尼亞·拜德拉克斯-維斯(Tania Bedrax-Weiss)說(shuō)。
奧爾表示,與傳統的機器學(xué)習算法相比,深度學(xué)習技術(shù)在語(yǔ)言理解方面更加擅長(cháng)。這種方法通常需要通過(guò)大量數據對人工神經(jīng)網(wǎng)絡(luò )進(jìn)行訓練,然后讓其對新數據進(jìn)行推斷。谷歌還將深度學(xué)習技術(shù)用于圖片識別和語(yǔ)音識別。事實(shí)上,神經(jīng)網(wǎng)絡(luò )是SyntaxNet的關(guān)鍵所在,該項目的開(kāi)發(fā)代號為“神經(jīng)官能癥”(neurosis)。