
CCF-GAIR 2018程序主席朱曉蕊:大家好,我們大會(huì )第一個(gè)環(huán)節的題目是「AI前沿技術(shù)」。最近幾年AI一直都很熱,很多人都會(huì )問(wèn),這個(gè)AI到底能熱多久?我想其中一個(gè)很重要的因素就是AI的前沿技術(shù)到底能做得有多么深入。因此我建議大家今天不妨仔細聽(tīng)聽(tīng)下面幾位嘉賓的演講,或許大家能從中得到一些答案。
首先有請清華大學(xué)張鈸院士為我們作大會(huì )報告。張院士是中國科學(xué)院院士、清華大學(xué)教授,現任清華大學(xué)人工智能研究院院長(cháng),張院士主要是從事人工智能理論、人工神經(jīng)網(wǎng)絡(luò )、遺傳算法、分形和小波等理論研究,以及把上述理論應用于模式識別、知識工程、智能機器人與智能控制等領(lǐng)域的應用研究,他今天的報告題目是「走向真正的人工智能」,有請張院士。
張鈸:各位領(lǐng)導、各位專(zhuān)家,今天給我45分鐘的時(shí)間,我講40分鐘,因為會(huì )議的議程已經(jīng)延遲了。
我今天要講的中心思想就是:我們現在離真正的人工智能還有一段很長(cháng)的路。為了講清這個(gè)思想,我必須回答下面三個(gè)問(wèn)題:第一,什么叫做真正的人工智能?我們的目標是什么?第二,為什么我們需要真正的人工智能?第三,我們如何走向真正的人工智能?我現在回答這三個(gè)問(wèn)題。
首先我們如何評價(jià)目前人工智能取得的成果,我們的評價(jià)很簡(jiǎn)單,針對這5件事:
第一是深藍打敗人類(lèi)國際象棋冠軍;第二是IBM在電視知識競賽中打敗了美國的前兩個(gè)冠軍,這兩件事是一種類(lèi)型,后面的三件事是另外一種類(lèi)型;即2015年微軟在ImageNet上做圖象識別,它的誤識率略低于人類(lèi)。還有百度、訊飛也都宣布在單句的中文語(yǔ)音識別上,它的誤識率也略低于人類(lèi)。還有一個(gè)是大家非常熟悉的AlphaGo打敗了李世石。這5件事情都是機器在一定的范圍內超過(guò)了人類(lèi),我們如何來(lái)評價(jià)這5件事?
大家一致認為這5件事之所以成功,是由于前面三個(gè)因素,一是大數據,二是計算能力提高,第三是有非常好的人工智能算法。這三個(gè)因素大家都討論得非常多了,沒(méi)必要我再來(lái)說(shuō),我現在要說(shuō)的最后一個(gè)因素是被大家所忽略的,這個(gè)因素是說(shuō),這所有的成果必須建立在一個(gè)合適的應用場(chǎng)景下。這5件事雖然領(lǐng)域很不一樣,但是它們都滿(mǎn)足完全一樣的條件,或滿(mǎn)足下面的5個(gè)限制,首先你必須有豐富的數據或者豐富的知識,如果這兩件東西沒(méi)有,或者很少,你不用來(lái)談人工智能,因為你無(wú)法實(shí)現無(wú)米之炊。人工智能唯一的兩個(gè)資源,一個(gè)是數據,一個(gè)是知識。還有確定性信息、完全信息、靜態(tài)的、單任務(wù)和有限領(lǐng)域。這5個(gè)條件里面任何一個(gè)條件不滿(mǎn)足,現在的人工智能做起來(lái)就非常困難了。
大家想想這5個(gè)限制條件下的應用場(chǎng)景是什么樣的應用場(chǎng)景?就是照章辦事,不需要任何靈活性,這顯然不是智能的核心。
我們現在分析一下上述5個(gè)場(chǎng)景。下象棋是完全信息博弈,信息完全和確定,沒(méi)有問(wèn)題。其次,它遵循著(zhù)完全確定的游戲規則演化,我們把這種情況也叫做靜態(tài)。Watson機器人也是這樣,Watson是什么樣的對話(huà)問(wèn)題呢?它為什么選擇知識競賽呢?我們知道知識競賽提的問(wèn)題都沒(méi)有二義性,都是明確的,它的答案總是唯一性的。所以這樣的問(wèn)答對機器人來(lái)講是非常容易的。它涉及的領(lǐng)域雖然比較寬,但也是有限的,包括大家覺(jué)得很玄乎的圍棋,也完全符合上面5個(gè)條件,所以對計算機來(lái)說(shuō)也是很容易的。目前計算機打麻將就不行,因為牌類(lèi)是不完全信息博弈,所以比棋類(lèi)要難。總之,我們對目前人工智能取得的成果要有一個(gè)正確的評價(jià)。
目前的人工智能技術(shù)在以下領(lǐng)域都可以找到它的應用,它們是交通、服務(wù)、教育、娛樂(lè )等等,但我要強調是這些領(lǐng)域里面只有滿(mǎn)足上述5個(gè)條件的事情,計算機做起來(lái)才會(huì )容易,如果不滿(mǎn)足這些條件,計算機就做起來(lái)就困難了。大家常常關(guān)心什么樣的工作會(huì )被機器所替代,我可以明確告訴大家,滿(mǎn)足這5個(gè)條件的工作,總有一天會(huì )被計算機取代,就是那些照章辦事,不需要任何靈活性的工作,比如說(shuō)出納員、收銀員等等。在座的所有工作都不可能被計算機完全代替,但不排斥你的工作中有一部分會(huì )被計算機取代,老師、企業(yè)家等的工作不可能被計算機完全代替。
為什么有這5個(gè)限制?原因在于我們現在的人工智能是沒(méi)有理解的人工智能。
我們先看符號模型,理性行為的模型,舉Watson的例子,它是個(gè)對話(huà)系統,我們現在所有做的對話(huà)系統都跟這個(gè)差不多,但是Watson做得更好些,它里面有知識庫,有推理機制。沃森除了專(zhuān)家知識之外,還有大量互聯(lián)網(wǎng)上大眾的知識,還運用了多推理機制。請看,這就是Watson系統的體系結構。它里面有哪些知識呢?有很多,包括百科全書(shū)、有線(xiàn)新聞、文學(xué)作品等等。所有的知識用紙質(zhì)來(lái)表示有2億頁(yè),用存儲量表示達到了4TB。它能回答什么問(wèn)題呢?用它的例子來(lái)說(shuō)明。第一個(gè)問(wèn)題,1974年9月8日誰(shuí)被總統赦免?這對美國人來(lái)講很好回答,同樣對計算機來(lái)講也很好回答,你用這幾個(gè)關(guān)鍵字「1974年9月8日」、「被總統赦免」,就能在文獻里頭查出來(lái)是誰(shuí),他就是尼克松。也就是說(shuō)根據問(wèn)題中的關(guān)鍵字,可以在已有的文獻里頭直接找到答案,這就是一般的網(wǎng)絡(luò )檢索方法。
第二個(gè)問(wèn)題,熒光粉受到電子撞擊以后,它的電磁能以什么方式釋放出來(lái)?我們用「熒光粉」、「電子撞擊」、「釋放電磁能」等關(guān)鍵詞,也可以找到答案:「光或者光子」。這種方法就是平時(shí)網(wǎng)絡(luò )搜索的原理,應該說(shuō)沒(méi)有什么智能。
回答下面的問(wèn)題就需要「智能」了,跟智利陸地邊界最長(cháng)的是哪個(gè)國家?跟智利有陸地邊界的國家可以檢索到,它們是阿根廷和玻利維亞,但是誰(shuí)的邊境長(cháng)?通常查不到。Watson具備一定的推理能力,它從邊界間發(fā)生的事件、邊界的地理位置等等,經(jīng)過(guò)分析推理以后就可以找出答案,它就是阿根廷。下一個(gè)問(wèn)題也屬于這種性質(zhì),跟美國沒(méi)有外交關(guān)系的國家中哪個(gè)最靠北,跟美國沒(méi)有外交關(guān)系的國家有4個(gè),只要檢索就行了,但是哪個(gè)國家最靠北,沒(méi)有直接答案,但可以從其它信息中推導出來(lái),比如各個(gè)國家所處的緯度、氣候寒冷的程度等等分析出來(lái),答案是北朝鮮。
智能體現在推理能力上。但是很不幸,現在的對話(huà)系統推理能力都很差。Watson系統好一些,但也很有限。換句話(huà)說(shuō),我們現在的對話(huà)系統離真正的智能還很遠。
我們通過(guò)索菲亞機器人就可以看出來(lái),索菲亞的對話(huà)是面向開(kāi)放領(lǐng)域,你可以隨便提問(wèn),問(wèn)題就暴露出來(lái)了。大家在電視上看到索菲亞侃侃而談,問(wèn)什么問(wèn)題都能答得很好,這里面有玄機,如果你的問(wèn)題是預先提出來(lái)的,因為里頭有答案,因此回答得非常好,在電視上給大家演示的都是這種情況。
如果我們臨時(shí)提問(wèn)題,問(wèn)題就出來(lái)了。這是一個(gè)中國記者給索菲亞提的4個(gè)問(wèn)題,它只答對了一個(gè)。「你幾歲了」,這個(gè)問(wèn)題很簡(jiǎn)單,它答不上來(lái),它的回答是「你好,你看起來(lái)不錯」,答非所問(wèn),因為它不理解你所問(wèn)的問(wèn)題。只有第二個(gè)問(wèn)題它是有準備的,里面有答案,所以答得很好。「你的老板是誰(shuí)」,這個(gè)肯定它有準備。第三個(gè)問(wèn)題,「你能回答多少問(wèn)題呢」?它說(shuō)「請繼續」,沒(méi)聽(tīng)懂!。再問(wèn)第四個(gè)問(wèn)題,「你希望我問(wèn)你什么問(wèn)題呢」?它說(shuō)「你經(jīng)常在北京做戶(hù)外活動(dòng)嗎」?這就告訴我們說(shuō),現代的問(wèn)答系統基本上沒(méi)有理解,只有少數有少量的理解,像Watson這樣算是比較好的。
為什么會(huì )這樣?也就是說(shuō)我們現在的人工智能基本方法有缺陷,我們必須走向具有理解的AI,這才是真正的人工智能。我這里提出的概念跟強人工智能有什么區別?首先我們說(shuō)它在這點(diǎn)上是相同的,我們都試圖去準確地描述人類(lèi)的智能行為,希望人工智能跟人類(lèi)的智能相近,這也是強人工智能的一個(gè)目標,但是強人工智能只是從概念上提出來(lái),并沒(méi)有從方法上提出怎么解決。大家知道強人工智能提出了一個(gè)最主要的概念,就是通用人工智能。怎么個(gè)通用法?它沒(méi)有回答。我們現在提出來(lái)的有理解的人工智能是可操作的,不只是概念,這是我們跟強人工智能的區別。
人機對話(huà)的時(shí)候,機器為什么不能理解人們提的問(wèn)題。我們看一個(gè)例子就知道了,我們在知識庫里把「特朗普是美國總統」這個(gè)事實(shí),用「特朗普-總統-美國」這三元組存在計算機里面,如果你提的問(wèn)題是「誰(shuí)是美國總統」?機器馬上回答出來(lái):「特朗普」。但是你如果問(wèn)其它有關(guān)的問(wèn)題,如「特朗普是一個(gè)人嗎」?「特朗普是一個(gè)美國人嗎」?「美國有沒(méi)有總統」?它都回答不了。它太傻了,任何一個(gè)小學(xué)生,你只要告訴他特朗普是美國總統,后面這幾個(gè)問(wèn)題他們絕對回答得出來(lái)。機器為什么回答不了后面的三個(gè)問(wèn)題呢?就是這個(gè)系統太笨了,沒(méi)有常識,也沒(méi)有常識推理。既然特朗普是美國的總統,美國當然有總統,但是它連這一點(diǎn)常識的推理能力都沒(méi)有。所以要解決這個(gè)問(wèn)題,必須在系統中加上常識庫、常識推理,沒(méi)有做到這一步,人機對話(huà)系統中機器不可能具有理解能力。但是大家知道,建立常識庫是一項「AI的曼哈頓工程」。大家想想常識庫多么不好建,怎么告訴計算機,什么叫吃飯,怎么告訴計算機,什么叫睡覺(jué),什么叫做睡不著(zhù)覺(jué),什么叫做夢(mèng),這些對人工智能來(lái)說(shuō)都非常難,美國在1984年就搞了這樣一個(gè)常識庫的工程,做到現在還沒(méi)完全做出來(lái)。可見(jiàn),要走向真正的人工智能,有理解的人工智能,是一條很漫長(cháng)的路。
這里介紹一點(diǎn)我們現在做的工作,加入常識以后,對話(huà)的性能會(huì )不會(huì )有所改善。我們的基本做法是建立一個(gè)常識圖譜,用這個(gè)圖譜幫助理解提出的「問(wèn)題」,同時(shí)利用常識圖譜幫助產(chǎn)生合適的答案。
下面就涉及到具體怎么做了,我不詳細說(shuō)了,我就說(shuō)結果,結果是有了常識以后,性能有了顯著(zhù)的改善,對話(huà)的質(zhì)量提高了。這篇文章已經(jīng)發(fā)表,有興趣可以去閱讀。
另外是準符號模型,深度學(xué)習、神經(jīng)網(wǎng)絡(luò )主要用來(lái)模擬感性行為,感性行為是一般很難采用符號模型,因為感性(感覺(jué))沒(méi)法精確描述。比如「馬」,怎么告訴計算機什么叫做馬?你說(shuō)馬有四條腿,什么叫做腿?你說(shuō)細長(cháng)的叫做腿,什么叫細?什么叫做長(cháng)?沒(méi)法告訴機器,因此不能用符號模型。目前用的辦法就是我們現在說(shuō)的神經(jīng)網(wǎng)絡(luò )或者準符號模型,也就是用人類(lèi)同樣的辦法,學(xué)習、訓練。我不告訴機器什么叫做馬,只是給不同的馬的圖片給它看,進(jìn)行訓練。訓練完以后,然后再用沒(méi)見(jiàn)過(guò)的馬的圖片給它看,說(shuō)對了,就是識別正確了,說(shuō)不對就是識別不正確,如果90%是對的,就說(shuō)明它的識別率是90%。后來(lái)從淺層的神經(jīng)網(wǎng)絡(luò )又發(fā)展到多層的神經(jīng)網(wǎng)絡(luò ),從淺層發(fā)展到多層有兩個(gè)本質(zhì)性的變化,一個(gè)本質(zhì)性的變化就是輸入,深層網(wǎng)絡(luò )一般不用人工選擇的特征,用原始數據就行。所以深度學(xué)習的應用門(mén)檻降低了,你不要有專(zhuān)業(yè)知識,把原始數據輸進(jìn)去就行了。第二個(gè)是它的性能提高很多,所以現在深度學(xué)習用得很多,原因就在這個(gè)地方。
通過(guò)數據驅動(dòng)建立的系統能不能算是有智能呢?必須打一個(gè)很大的問(wèn)號,就是說(shuō)你做出來(lái)的人臉識別系統甚至識別率會(huì )比人還高,但是我們還不能說(shuō)它有智能,為什么呢?這種通過(guò)數據驅動(dòng)做出來(lái)的系統,它的性能跟人類(lèi)差別非常大,魯棒性很差,很容易受干擾,會(huì )發(fā)生重大的錯誤,需要大量的訓練樣本。我們剛才已經(jīng)說(shuō)過(guò),給定一個(gè)圖像庫我們可以做到機器的識別率比人還要高,也就是說(shuō)它可以識別各種各樣的物體,但是這樣的系統,我如果用這個(gè)噪聲輸給它,我可以讓它識別成為知更鳥(niǎo),我用另外的噪聲輸給它,可以讓它識別成為獵豹。換句話(huà)講,這樣的系統只是一個(gè)機械的分類(lèi)器,根本不是感知系統。也就是說(shuō)它盡管把各種各樣動(dòng)物分得很清楚,但是它不認識這個(gè)動(dòng)物,它盡管可以把獵豹跟知更鳥(niǎo)分開(kāi),但是它本質(zhì)上不認識知更鳥(niǎo)和獵豹,它只到達了感覺(jué)的水平,并沒(méi)有達到感知的水平,它只是「感」,沒(méi)有上升到「知」。我們的結論是,只依靠深度學(xué)習很難到達真正的智能。這是很?chē)谰慕Y論,因為如果有這樣的問(wèn)題,在決策系統里頭是不能用這樣的系統,因為它會(huì )犯大錯。我在很多場(chǎng)合講過(guò),人類(lèi)的最大的優(yōu)點(diǎn)是「小錯不斷、大錯不犯」,機器最大的缺點(diǎn)是「小錯不犯,一犯就犯大錯」。這在決策系統里頭是不允許的,這就顯示人跟機器的截然不同,人非常聰明,所以他做什么事都很靈活,這就使得他很容易犯各種各樣的小錯。但是他很理性,很難發(fā)生大錯。計算機很笨,但是很認真,小錯誤絕對不會(huì )犯,但是它一犯就是天大的錯誤。剛才把那個(gè)把噪聲看成知更鳥(niǎo),這不是大錯嗎?你把敵人的大炮看成一匹馬,不是大錯嗎?但是人類(lèi)不會(huì )發(fā)生這種錯誤,人類(lèi)只會(huì )把騾看成驢,但是計算機的識別系統會(huì )把驢看成一塊石頭。原因在哪兒?原因還是AI的理解能力問(wèn)題。
我們看這個(gè)自動(dòng)駕駛,過(guò)去講得很多,而且講得很樂(lè )觀(guān),我們看看問(wèn)題在什么地方。我們現在是這樣做,我們通過(guò)數據驅動(dòng)的學(xué)習方法,學(xué)習不同場(chǎng)景下的圖象分割,并判別是車(chē)輛還是行人、道路等,然后建立三維模型,在三維模型上規劃行駛路徑。現在用硬件已經(jīng)可以做到實(shí)時(shí),請問(wèn)大家,這樣能不能解決問(wèn)題?如果路況比較簡(jiǎn)單,行人、車(chē)輛很少,勉強可以用。復雜的路況就用不了。什么原因?非常簡(jiǎn)單,好多人總結出這個(gè)經(jīng)驗,行人或者司機都會(huì )有意無(wú)意破壞交通規則,包括外國人也一樣,中國人更嚴重一點(diǎn)。這就使得數據驅動(dòng)方法失效,比如說(shuō)我們可以用數據驅動(dòng)方法來(lái)了解各種各樣行人的行為,我們可以通過(guò)大量進(jìn)行訓練,都訓練完以后,如果出現新的情況呢?計算機能理解這是人從底下鉆過(guò)來(lái),很危險嗎?所以你不可能把所有情況都訓練到。自動(dòng)駕駛不可能對付突發(fā)事件,如果這個(gè)突發(fā)事件它沒(méi)見(jiàn)過(guò),它就解決不了。怎么來(lái)解決這個(gè)問(wèn)題呢?實(shí)際上就是要解決從「Without」到「With」理解的問(wèn)題。人工智能現在有兩種基本方法,一種是用符號模型來(lái)模擬理性行為,符號模型可以表達信息的內容,所以它是在一個(gè)語(yǔ)義的符號空間里頭,但是非常不幸,這個(gè)離散的符號表示,數學(xué)工具很難用,很多數學(xué)工具用不上去,所以它發(fā)展很慢。在模擬感性行為的時(shí)候,我們用的是特征空間的向量,向量就是數,可以把所有的數學(xué)工具都用上,優(yōu)化的工具、概率統計的工具全部用上。所以數據驅動(dòng)方法這幾年發(fā)展非常快,再難的問(wèn)題,下圍棋非常難吧,計算機也可以「算」出來(lái)。但是它有一個(gè)非常大的缺陷,它是在特征空間里,缺乏語(yǔ)義。我們用數據去訓練一個(gè)模型,所謂「黑箱學(xué)習法」,加上你的數據質(zhì)量不高,很難學(xué)出有用的東西。什么叫概率統計?重復多了就是真理。如果數據質(zhì)量差,充滿(mǎn)了「謊言」。謊言重復多了,就變成真理了。
我們現在想出的解決辦法是這樣的,就是把這兩個(gè)空間投射到一個(gè)空間去,這個(gè)空間叫做語(yǔ)義的向量空間。也就是說(shuō)我們把符號變成向量,同時(shí)把特征空間的向量變成語(yǔ)義空間的向量。怎么做?一是通過(guò)Embedding(嵌入)把符號變成向量,盡量保持語(yǔ)義不變,可惜現在的方法都會(huì )引起語(yǔ)義的丟失,我們只能在投射的過(guò)程中讓語(yǔ)義丟失得少。第二方面做的工作比較少,就是Raising(提升),把特征空間提升到語(yǔ)義空間去,這主要靠學(xué)科交叉,靠跟神經(jīng)科學(xué)的結合。只有這些問(wèn)題解決以后,我們才能夠建立一個(gè)統一的理論,因為過(guò)去的感知和認知是不同的處理方法,大家說(shuō)不到一塊,如果我們能夠投射到同一空間去,我們就可以建立一個(gè)統一的理論框架,這是我們的目標。在語(yǔ)義空間處理就可以解決理解問(wèn)題,但是這項工作是非常艱巨的。
介紹一項我們現在做的工作。人工神經(jīng)網(wǎng)絡(luò )為什么不能得到語(yǔ)義信息呢?人腦的神經(jīng)網(wǎng)絡(luò )為什么可以呢?差別就在這里,我們現在用的人工神經(jīng)網(wǎng)絡(luò )太簡(jiǎn)單了,我們正想辦法把腦神經(jīng)網(wǎng)絡(luò )的許多結構與功能加進(jìn)去,我們這里只用了「稀疏發(fā)電」這一性質(zhì),就可以看出一些效果,人臉、大象或者鳥(niǎo)的輪廓,神經(jīng)網(wǎng)絡(luò )可以把它提取出來(lái)。
還有一個(gè)辦法就是把數據驅動(dòng)跟知識驅動(dòng)結合起來(lái)。剛才講了,人的智能沒(méi)法通過(guò)單純的大數據學(xué)習把它學(xué)出來(lái),那怎么辦?很簡(jiǎn)單,加上知識,讓它有推理的能力,做決策的能力,這樣就能解決突發(fā)事件。我們現在做的工作就是把這些結合起來(lái),這是我們的基本思路,知識也好,數據也好,都投射到同一空間,然后都用同樣的數學(xué)方法進(jìn)行處理,這方面我們已經(jīng)做了不少工作。
最后做一個(gè)總結,我們從這個(gè)坐標看人工智能,橫軸代表領(lǐng)域的寬窄,從單領(lǐng)域到多領(lǐng)域、到開(kāi)放領(lǐng)域。縱軸代表信息的確定性與完全性,從完全到不完全、從確定到不確定。在左下角代表最容易的,就是剛才講的符合5個(gè)條件的,現在人工智能在這部分解決得非常好,我們用白色來(lái)表示它,AlphaGo在這里,深藍在這里,工業(yè)機器人在這里。現在我們正在向灰色地區去走,打牌,信息不完全,現在打德州撲克,一人對一人,計算機能戰勝人類(lèi),多人對弈,計算機還不行,這是灰色地帶,我們還可以做,為什么可以做?盡管打牌是不確定的,但是它在概率意義下是確定的,你拿的這副牌的概率,可以算出來(lái),同花的概率是多少,排成順的概率是多少,既然概率能算出來(lái),最終人類(lèi)肯定會(huì )被計算機打敗。Watson在右邊,它的領(lǐng)域比較寬,但是它是確定性的,所以是在灰色的區域。往右上方去就比較難了,自動(dòng)駕駛、服務(wù)機器人、大數據分析,它是一個(gè)大框,有的簡(jiǎn)單,有的困難,就自動(dòng)駕駛來(lái)講,專(zhuān)用道、行車(chē)很少,路況簡(jiǎn)單等,在白色或者灰色區,如果路況復雜就到了黃色區域,黃色區現在計算機還解決不好。最遠的在哪兒呢?右上角,圖靈測試。大家對圖靈測試有很多誤解,其實(shí)圖靈測試是開(kāi)領(lǐng)域問(wèn)答,很難!索菲亞做得怎么樣?很糟糕。自然語(yǔ)言理解也在這里,復雜環(huán)境下的決策在偏左一點(diǎn)的地方,這也是很難的。所以我們人工智能現在是從左下角往右上角走,我們現在處在出發(fā)點(diǎn)附近。有的人想把它用一些名詞來(lái)區分人工智能的不同發(fā)展階段,有專(zhuān)家問(wèn)我,你的看法怎么樣?我建議不要用新詞,用新詞往往說(shuō)不清,很麻煩,有的人說(shuō)現在是弱人工智能,以后是強人工智能,也有人說(shuō)現在叫增強智能(AugmentedIntelligence)也是AI……概念太多說(shuō)不清,還是簡(jiǎn)單一點(diǎn),「我們正在通往真正AI的路上」,現在走得并不遠,在出發(fā)點(diǎn)附近,人工智能永遠在路上,大家要有思想準備,這就是人工智能的魅力。大家為什么這么重視人工智能?因為我們永遠在路上,這就吸引我們去解決這些問(wèn)題,這些問(wèn)題一旦解決了,人類(lèi)的社會(huì )進(jìn)步、人類(lèi)的生活就會(huì )發(fā)生本質(zhì)上的改變。
最后我用中文寫(xiě)最后一段作為總結,可惜我翻譯不了。
周穆王西巡狩,路遇匠人名偃師。翌日偃師謁見(jiàn)王,偕來(lái)一個(gè)假人。「趨步俯仰,信人也」。「領(lǐng)其顱,則歌合律;捧其手,則舞應節。千變萬(wàn)化,惟意所適。王以為實(shí)人也,與盛姫內御并觀(guān)之,技將終,倡者瞬其目而招王之左右侍妾。王大怒,要殺這個(gè)偃師。偃師大懾,立剖其倡者以示王,皆傅會(huì )革、木、膠、漆、白、黑、丹、青之所為。穆王始悅,詔貳車(chē)載之以歸。
這是3000年前我們古人對機器人的想象,看看現在的人工智能做得怎么樣呢?索菲亞是我們現在達到的水平,可是她不會(huì )唱歌、不會(huì )跳舞,只會(huì )說(shuō)英文,周王也聽(tīng)不懂,肯定沒(méi)有印象。現在我們假設索菲亞「瞬其目而招王之左右侍妾」,向周王的姨太太們送去秋波,王會(huì )如何呢?我認為沒(méi)反應,因為索菲亞是女的,他用不著(zhù)吃醋。但是我們假設索菲亞「瞬其目而招王」,向大王送去秋波,王會(huì )大悅,立即神魂顛倒,墜入愛(ài)河?我認為不會(huì ),因為索菲亞根本不像人,它最近才剛剛安上手腳,走路都不利索,怎么行呢?所以我的結論是,「索菲亞通不過(guò)穆王的測試,當然它更通不過(guò)圖靈測試」。
我們的結論是什么?人工智能剛剛起步,離真正的AI還很遙遠,大家共同努力吧,我們任重道遠。