2015年12月28日,國家首個(gè)語(yǔ)義庫標準--《智能客服語(yǔ)義庫技術(shù)要求》(標準計劃編號:20151549-T-469)標準啟動(dòng)會(huì )在中國電子技術(shù)標準化研究院(以下簡(jiǎn)稱(chēng)標準院)舉行。本次會(huì )議由全國信標委組織,工信部信軟司軟件產(chǎn)業(yè)處孫文龍處長(cháng),小i機器人,清華軟件學(xué)院,招商銀行、LG、格蘭仕等單位代表參加了本次會(huì )議。
標準研究院趙箐華主任主持會(huì )議,作為技術(shù)的提供方小i機器人與會(huì )代表介紹了標準制定的背景、標準應用前景、編制計劃等。清華、招行等就標準啟動(dòng)的相關(guān)內容發(fā)表了自己的看法。

沒(méi)有語(yǔ)義 人工智能無(wú)從談起
人工智能是科技發(fā)展的方向,未來(lái)將無(wú)所不在。在人工智能涉及到的三大智能技術(shù)中,計算智能領(lǐng)域,計算機早已超越了人類(lèi);感知智能領(lǐng)域,包括語(yǔ)音識別、人臉識別,圖像識別等等,近年,隨著(zhù)深度學(xué)習技術(shù)的發(fā)展,已有了長(cháng)足的進(jìn)展,像語(yǔ)音識別目前技術(shù)在全球已經(jīng)非常成熟,目前已處于產(chǎn)業(yè)的末端。如果說(shuō)感知智能相當于給機器人裝上了“眼睛”、“耳朵”,那么給予機器人“大腦”的就是其中最核心的認知智能,認知智能也就是讓機器具有“思考”能力的技術(shù),目前還處于起步階段,有很多路需要走。
語(yǔ)義識別是認知智能當中非常重要的一個(gè)環(huán)節,在人與機器的溝通交互過(guò)程中,需要以語(yǔ)義識別技術(shù)來(lái)讓機器明白人類(lèi)表達的意思,并根據理解來(lái)給出反饋。而語(yǔ)義的理解正是以知識庫和語(yǔ)義庫來(lái)支撐的。這同人類(lèi)一樣,也是我們與動(dòng)物的最大區別,人類(lèi)能夠不斷的產(chǎn)生知識,并且能夠讓知識傳承下去,這種傳承可以讓我們的下一代不需要在現實(shí)中通過(guò)實(shí)踐學(xué)習新的知識,而可以通過(guò)我們的教育直接獲得,隨著(zhù)知識面的不斷擴充,“思考”能力越來(lái)越強,機器也越來(lái)越“聰明”。脫離了知識庫和語(yǔ)義庫,語(yǔ)義理解就無(wú)從談起。更勿論讓機器人具有理解、思考的能力,做出正確反饋了。
知識語(yǔ)義、學(xué)習體系、產(chǎn)業(yè)化 人工智能發(fā)展的正向循環(huán)
認知智能作為人工智能的核心,其發(fā)展路徑有別于其他技術(shù)的發(fā)展。一般技術(shù)的發(fā)展路徑為實(shí)驗室、小規模生產(chǎn)、大規模商業(yè)應用、產(chǎn)業(yè)化。但認知智能的發(fā)展目前從全球來(lái)看,卻是一個(gè)技術(shù)、應用、產(chǎn)業(yè)化互相促進(jìn)、相輔相成的過(guò)程。
“(在一個(gè)一個(gè)垂直領(lǐng)域的滲透過(guò)程中)我們發(fā)現:在語(yǔ)義層,不同的行業(yè)之間也是有很多共通的部分,可以被規則化和結構化。從而可以做一些標準化的東西出來(lái)。”小i機器人總裁兼CTO朱頻頻表示。

小i成立在2001年,最早做聊天機器人,就像現在的微軟小冰。但聊天功能是無(wú)法轉化為商業(yè)價(jià)值的,于是小i開(kāi)始往垂直方向發(fā)展,把積累的語(yǔ)義理解的技術(shù),應用到垂直領(lǐng)域,教給機器人一個(gè)行業(yè)、一個(gè)行業(yè)的垂直的知識,這樣,它就成為一個(gè)行業(yè)的專(zhuān)家,可以回答行業(yè)的相關(guān)問(wèn)題,為企業(yè)創(chuàng )造價(jià)值。這就是虛擬客戶(hù)助理(VCA),也就是虛擬的客戶(hù)服務(wù)機器人。這條路是小i在市場(chǎng)的考驗下,一步一步走出來(lái)的,卻正與智能機器人技術(shù)全球發(fā)展的路徑不謀而合。
在全球知名的調研機構Gartner的分類(lèi)中,虛擬助理應用分為虛擬個(gè)人助理(VPA)和虛擬客戶(hù)助理(VCA)。對于VPA,Gartner認為還處于技術(shù)的早期,離實(shí)用性還非常遠,從全球范圍內,真正具有自然語(yǔ)言交互能力的VPA投入大規劃的商用,需要5-10年,甚至更長(cháng)的時(shí)間。像上文提到的微軟小冰、蘋(píng)果Siri以及類(lèi)似的語(yǔ)音助手都屬于VPA。VCA的機制和底層技術(shù)類(lèi)似,但是專(zhuān)注在一個(gè)領(lǐng)域或多個(gè)領(lǐng)域,因此實(shí)用性大大增加,已經(jīng)進(jìn)入產(chǎn)業(yè)化的前期。而VCA解決方案提供商中應用領(lǐng)域最多,最具研究?jì)r(jià)值的正是中國的小i機器人。
小i現在服務(wù)的用戶(hù)超過(guò)5億,每年有數百億次的對話(huà),這使得小i在多個(gè)行業(yè)沉淀了強大的領(lǐng)域知識庫和語(yǔ)義庫。而每年數百億的交互量,會(huì )產(chǎn)生出海量的真實(shí)數據,然后通過(guò)學(xué)習體系和算法對這些數據進(jìn)行處理,就會(huì )不斷的挖掘并學(xué)習到新的知識和語(yǔ)義,而新習得的知識和語(yǔ)義,反過(guò)來(lái)讓智能機器人系統表現的更加出色,智能化程度更高,表現的更為“聰明”。
用國家標準促人工智能快速發(fā)展
參與語(yǔ)義庫標準制定工作的招行、LG、格蘭仕等都是在各自的行業(yè)中,成功運用人工智能提升服務(wù)品質(zhì)的代表。有別于互聯(lián)網(wǎng)上的通用知識,行業(yè)的這些數據,在互聯(lián)網(wǎng)上是找不到的,這些知識都存在于企業(yè)內部的知識庫中,企業(yè)的文檔中,甚至企業(yè)內部的一些人的腦子中,這就是所謂“隱性知識”。知識的積累讓人機交互更為順暢,標準的制定,可以把已有的這些積累分享出來(lái),讓更多的行業(yè)快速享用新興技術(shù)的利好。
如人工智能依據數據、算法,產(chǎn)業(yè)化應用正向循環(huán)的閉環(huán)來(lái)促使發(fā)展一樣,標準的制定與人工智能技術(shù)的進(jìn)步一樣密不可分。智能客服語(yǔ)義庫標準是以技術(shù)和產(chǎn)業(yè)應用為基礎,而通過(guò)在技術(shù)在實(shí)踐中的實(shí)施,必將更好、更快的創(chuàng )造出更多新的應用領(lǐng)域;同時(shí),技術(shù)標準在實(shí)施的過(guò)程中,經(jīng)過(guò)市場(chǎng)的不斷檢驗和反饋,必定會(huì )加速技術(shù)的發(fā)展和完善。
智能客服語(yǔ)義庫提供的是一套對通用和行業(yè)領(lǐng)域知識的共享和共同認識,形成統一標準后,能有效降低構建機器人服務(wù)系統的復雜度和建設成本,極大的節省相關(guān)企業(yè)的前期投入,加速智能服務(wù)機器人在更多行業(yè)的快速落地,隨著(zhù)智能機器人在更多行業(yè)、更多領(lǐng)域的普及,使其具有普遍性時(shí),那么人類(lèi)離幻想中無(wú)所不能的機器人也就更加接近了。小i機器人聯(lián)合中國電子技術(shù)標準研究院,啟動(dòng)智能客服語(yǔ)義庫國家標準建立工作,以客服為出發(fā)點(diǎn),提升智能人機交互技術(shù)水平,更快擁抱即將進(jìn)入的機器人時(shí)代。