5月20日,神州泰岳AI大數據副總裁張瑞飛受邀出席在國家會(huì )議中心舉辦的2018GAITC全球人工智能技術(shù)大會(huì )“自然語(yǔ)言處理”論壇,并做了題為“認知能力:在成本與成效中平衡”的精彩主題演講。

神州泰岳AI大數據副總裁張瑞飛
張瑞飛指出,神州泰岳在人工智能領(lǐng)域主要的攻堅點(diǎn)在自然語(yǔ)言處理的能力,我們更加關(guān)注怎樣把人工智能技術(shù)轉化為企業(yè)的盈利目標,在自然語(yǔ)言處理方面要取得成本和成效的均衡。
神州泰岳在人工智能基礎上的投入非常堅定。在數據的獲取和處理層面,神州泰岳投入大量資源,成功獲取400萬(wàn)份有效樣本,并在此基礎上做了向量化和特征提取,可覆蓋99%的應用場(chǎng)景,有效提升了系統的泛化能力。同時(shí),神州泰岳采用獨特方法,解決多態(tài)性的問(wèn)題,實(shí)現了屬性要素的提取,尤其是對事件的地點(diǎn)、物品、手段、特征、碼號等要素的提取,其中包括190多萬(wàn)個(gè)地址庫。

在上述投入的同時(shí),神州泰岳引入最新的技術(shù)理念,優(yōu)化算法,提升成效:采用遷移學(xué)習,減少樣本模型訓練的樣本量;通過(guò)深度學(xué)習和DINFO-OEC非結構化文本分析挖掘平臺,在命名實(shí)體識別場(chǎng)景,實(shí)現數據處理10%-15%的結果優(yōu)化。
在談到人工智能的應用成效時(shí),張瑞飛指出,神州泰岳面向公安系統,建立了一體化的合成作戰平臺,在語(yǔ)義解析引擎、互聯(lián)網(wǎng)數據采集、大數據流水線(xiàn)、數據展現、流程引擎以及融合通訊等基礎能力上,不斷擴充應用,最終形成可落地的行業(yè)應用體系。最近神州泰岳和北京師范大學(xué)的自然語(yǔ)義聯(lián)合實(shí)驗室在業(yè)界首次推出了NLP集成開(kāi)發(fā)環(huán)境,把語(yǔ)義資源、算法體系、場(chǎng)景化能力等集成在一起。

“自然語(yǔ)言處理”論壇
最后,張瑞飛呼吁,鑒于自然語(yǔ)義處理技術(shù)開(kāi)發(fā)的難度,業(yè)界應當建立生態(tài)聯(lián)盟,在共同在生態(tài)中合作起來(lái),共通共享,降低成本,發(fā)揮各自在不同的領(lǐng)域里形成的獨特優(yōu)勢,共同提升自然語(yǔ)言的處理能力。