• <strike id="fdgpu"><input id="fdgpu"></input></strike>
    <label id="fdgpu"></label>
    <s id="fdgpu"><code id="fdgpu"></code></s>

  • <label id="fdgpu"></label>
  • <span id="fdgpu"><u id="fdgpu"></u></span>

    <s id="fdgpu"><sub id="fdgpu"></sub></s>
    您當前的位置是:  首頁(yè) > 新聞 > 專(zhuān)家觀(guān)點(diǎn) >

    清華大學(xué)張拔院士起底:后深度學(xué)習時(shí)代的人工智能

    2016-10-28 10:06:52   作者:   來(lái)源:雷鋒網(wǎng)   評論:0  點(diǎn)擊:


    \
      今天CNCC2016在山西太原盛大開(kāi)幕,開(kāi)場(chǎng)演講中,CCF會(huì )士、CCF終身成就獲得者,中國科學(xué)院士、清華大學(xué)教授,中國自動(dòng)化學(xué)會(huì )、中國計算機學(xué)報副主編、2011年獲得德國漢堡社會(huì )大學(xué)自然科學(xué)博士學(xué)位,2016年獲得杰出合作貢獻獎的清華大學(xué)張鈸院士做了人工智能未來(lái)展望,后深度學(xué)習時(shí)代的報告,雷鋒網(wǎng)為大家精編如下:
      今年是人工智能60周年,如果用人生的起步來(lái)衡量的話(huà),已經(jīng)進(jìn)入了老年,不過(guò)還是有很多人希望人工智能能提供成熟的成果和技術(shù),用來(lái)發(fā)展產(chǎn)業(yè)、發(fā)展經(jīng)濟進(jìn)行科學(xué)研究。我今天做的報告,本著(zhù)這樣的原則,關(guān)于人工智能的優(yōu)點(diǎn),它的成果我要說(shuō)夠,對它的問(wèn)題我要說(shuō)透……
      后深度學(xué)習的前提-人工智能的春天又來(lái)了
      如今人工智能的春天又來(lái)了,不過(guò)和30年前在日本的那次相比,時(shí)間不同、地點(diǎn)不同,主題也不同,這一次是關(guān)于人工智能第二個(gè)成果,深度學(xué)習相關(guān)的。
    • 從知識情報處理到深度學(xué)習
    • 從第五代計算機到類(lèi)腦計算機
    • 從大容量知識庫到大數據
    • 從高速符號推理到類(lèi)腦芯片
    • 從自然語(yǔ)言理解到感知(機器人)
      我想這一次是不是我們的機會(huì ),我們能不能彎道超車(chē)還是又一個(gè)日本的“五代機”?我的看法是這兩個(gè)可能性都存在,關(guān)鍵我們怎么做。
    \
      中國有句老話(huà),三十年河東,三十年河西,和30年前比現在有何不同?在我眼里兩點(diǎn),一點(diǎn)是大數據,另一點(diǎn)是概率統計方法(及其理論)。正是因為這兩個(gè)因素催生了現在的深度學(xué)習大潮。
    \
      這個(gè)第一點(diǎn)大數據我不用宣傳,大家看這個(gè)圖就行。
    \
      這是在這種啟發(fā)下建立的神經(jīng)網(wǎng)絡(luò )模型,這里神經(jīng)網(wǎng)絡(luò )模型里要著(zhù)重講下概率統計方法論,兩個(gè)詞,一個(gè)貝葉斯推理,一個(gè)概率統計,被“引進(jìn)”了人工智能,并使得人工智能發(fā)生了革命性的變化。
    \
      其實(shí)很多人不知道,作為對當下人工智能有根本性貢獻的概率統計,30年前的它跟現在的它還有很多不同。就是下圖的四個(gè)里程碑。
    \
      我們現在能夠做深度學(xué)習,能夠在幾百萬(wàn)、幾千萬(wàn)的參數下做優(yōu)化,很多人都以為是計算機變快,其實(shí)不完全是,而是要歸功于概念統計方法的變化。這個(gè)變化使得我們現在能把深度學(xué)習做好。就是上面四個(gè)里程碑的出現,大家一定要注意上面的四個(gè)里程碑。
      后來(lái)這些里程碑進(jìn)一步發(fā)展成神經(jīng)網(wǎng)絡(luò )了,特別是深度學(xué)習,使用多層網(wǎng)絡(luò )進(jìn)行學(xué)習。所謂深度,就是層數比較多。由于用的深度學(xué)習方法,把模式識別、圖像識別等識別方法的準確度提高了10%,這個(gè)事情又引起了深度學(xué)習的熱。
      為什么呢?因為深度學(xué)習解決了一個(gè)問(wèn)題,有相當一部分人,按中文的說(shuō)法,我們知其然,不知其所以然。我能識別了了馬,但我們描述不了馬,然后怎么辦?那就用深度學(xué)習辦法:
    • 它可以解決一些不能完全表述的問(wèn)題,也就是說(shuō)“知其然,不知其所以然”的問(wèn)題。
    • 第二個(gè)它能針對不確定性的問(wèn)題,我們不斷的變化,我可以不斷的再學(xué)習,最后,它能解決不能清楚表達的問(wèn)題。
    \
    • 另外,深度學(xué)習還有一個(gè)完全改變傳統神經(jīng)網(wǎng)絡(luò )的作用,它不僅僅做函數映射,更重要提取那些多層次重復的模式,這是我們講的真正公共的特征。
      這樣使我們做模式識別可以達到很高的水平,后來(lái)這些用到模式識別、用到語(yǔ)音,包括用到文本(現在正在做,但是效果不如前面,但也有一些效果),效果都很不錯。
    \
      我們可以這么來(lái)說(shuō),深度學(xué)習這個(gè)第二個(gè)人工智能提供出來(lái)的成果,可以幫助我們解決在給定的數據庫下,有了可利用的大數據,在感知信息處理上,有可能達到人類(lèi)的水平甚至超過(guò)人類(lèi)的水平。
    \
      后深度學(xué)習時(shí)代的人工智能
      后深度學(xué)習時(shí)代的人工智能,就是想把人工智能從這個(gè)狹義的,只能解決一定范圍的方法,推廣更寬廣的范圍去,這就是我們現在講所謂弱人工智能、強人工智能、以及通用人工智能。那我們要做這個(gè)工作面臨什么挑戰?基本上面臨三個(gè)挑戰。
    \
      1)一個(gè)是概念統計方法帶來(lái)的困難。
    \
      我們剛剛說(shuō)概率統計方法,對人工智能起到了革命性的變化,但是也給人工智能帶來(lái)極大的挑戰,這就是概念統計本身的原因——通過(guò)大量的數據,它只能搞出來(lái)重復出現的特征,或者是數據中間的統計關(guān)聯(lián)性,它找出來(lái)的不是本質(zhì)上的特征、語(yǔ)義上的特征,它找出來(lái)的關(guān)系,也不是因果關(guān)系,而是關(guān)聯(lián)關(guān)系。
      這樣做的后果是什么?這里有深度網(wǎng)絡(luò )做出來(lái)的手寫(xiě)數字識別系統,各種各樣的2它都能認出來(lái),它聲稱(chēng)它這個(gè)性能超過(guò)了人,識別能力很超前。
    \
      但你們看,當我們用這種噪聲去欺騙它,它可以用99.99%的置信度確認它是2,這在人是不可能發(fā)生的,為什么機器會(huì )發(fā)生,因為機器去認識這種0和1,不是根據0和1本身的性質(zhì)來(lái)認識,而是通過(guò)黑白分布的統計性質(zhì)來(lái)認識它,因為這排噪聲跟2的統計是一樣的,所以才有這樣的錯誤。
    \
      這個(gè)在模式識別上沒(méi)有問(wèn)題,但如果用到?jīng)Q策就會(huì )出現大錯,它甚至可以把一塊石頭看成是馬。這個(gè)問(wèn)題非常嚴重,也就是說(shuō)深度學(xué)習區分的是重復的模型,但大腦區分的是語(yǔ)義的特征,這兩種區分有本質(zhì)的區別,但是有關(guān)聯(lián)。
      2)第二個(gè),生數據帶來(lái)的問(wèn)題。
    \
      大數據有很多好處,其實(shí)大數據帶來(lái)很大問(wèn)題。我們現在大數據跟以前的大數據不一樣,大量的數據是生數據。我們看網(wǎng)絡(luò )上傳來(lái)的數據都是摻雜了很多噪聲,有騙人的,有各種垃圾,這種數據叫生數據。大家看下機器對于生數據和經(jīng)過(guò)加工的數據的魯棒性表現相對很差,不像人。
      如果我們用右邊的圖去訓練這個(gè)神經(jīng)網(wǎng)絡(luò ),它能很好認識的貓;如果用左邊的圖,它很難認識,因為它不知道貓在哪兒。這個(gè)吳教授在我們學(xué)校做報告的時(shí)候,我跟他開(kāi)玩笑說(shuō),你老說(shuō)你的好成果,不說(shuō)你的毛病,它為什么能在貓臉與人臉的識別上都識別地非常好,因為它用訓練例的時(shí)候,是經(jīng)過(guò)精心挑選的,沒(méi)有背景,沒(méi)有經(jīng)過(guò)加工。因此,這三樣東西的識別都做地非常好。但如果正例、負例都隨便取,那它的識別率只有百分之十幾,幾乎不認識,可見(jiàn)機器跟人的認識形式是很不一樣,它非常不魯棒。
      3)第三個(gè),推廣能力,領(lǐng)域遷移。
    \
      這兩種方法都是就事論事,都很難推廣到不同領(lǐng)域,這就是我們的挑戰。我們要從一個(gè)弱的智能到通用智能,必須要克服這種困難,如果解決這種困難,目前來(lái)講兩個(gè)解決辦法。
      兩個(gè)解決辦法
      1)一個(gè)辦法,是人工智能的這兩個(gè)方法結合起來(lái),因為這兩個(gè)方法是互補的。
    \
      因為知識驅動(dòng)跟語(yǔ)義掛鉤,是理解;數據驅動(dòng)是黑箱的方法,不理解,但可以保持從數據中提取模型。那么,前面那個(gè)必須有人工做模型,這個(gè)地方關(guān)鍵在哪兒?知識驅動(dòng)方法是用離散的符號表示,深度學(xué)習是用高維空間里頭的向量,這兩個(gè)東西我們如果能把它“溝通”起來(lái),就會(huì )把人工智能推動(dòng)非常大地一步,現在世界上很多機構也在做這件事。
      2)另外一個(gè)辦法,就是回到神經(jīng)網(wǎng)絡(luò )的本源。
    \
      它是根據神經(jīng)網(wǎng)絡(luò )和深度學(xué)習借助于人腦神經(jīng)的工作機制來(lái)形成的,人的神經(jīng)網(wǎng)絡(luò )有一套辦法,這套辦法可以借鑒到現在的人工神經(jīng)網(wǎng)絡(luò )來(lái),這個(gè)工作,世界上也有很多機構在做。
      我們一般把計算方法、深度學(xué)習,這兩個(gè)東西如果能夠溝通起來(lái),現在主要做的溝通,這兩個(gè)方法結合起來(lái)就會(huì )把人工智能推廣大大的應用。
      第二個(gè),我一個(gè)文本看起來(lái)洋洋灑灑數萬(wàn)頁(yè),我為什么知道這里面說(shuō)的是什么,因為不同局部的,我怎么從局部的信息,把它整合成為全局的認知,這個(gè)大腦里面也有一套辦法,這里面也涉及到很多研究。如果我們把這些研究移植到這個(gè)地方來(lái),把人工智能往前走一步。
    \
      后深度學(xué)習的計算機
    \
      現在對計算機有這么幾個(gè)批評,一個(gè)你能耗太大,大腦這么大強,才25W,你這一個(gè)計算機得多少?另外一個(gè)批評,就是對馮諾依曼結構,人腦里面是處理跟存儲在一起,你處理跟存儲分開(kāi),所以對對現在的計算機說(shuō)三道四。
      我想給大家吃一個(gè)定心丸,現代的計算機,我們這個(gè)人工智能學(xué)會(huì )(里的人)還是可以靠它維持很長(cháng)時(shí)間的。首先,現在大家討論最熱的一個(gè)是個(gè)量子計算、一個(gè)是類(lèi)腦計算。大家不要量子計算一出來(lái)現在的計算就不行了,不對了。因為量子算法,目前只有一個(gè)算法,它就是因子分解,它可以把指數變成多樣性,其它的都沒(méi)用。其它的,這個(gè)計算機即使它出來(lái),只有涉及到因子分解那些算法,它有可能加快,其他它目前還沒(méi)有算法,算不了。所以量子計算機現在絕對代替不了現在的計算機,就像量子通訊代替不了現在的通訊一樣。
      我想給大家吃的第二個(gè)定心丸,現在講的類(lèi)腦計算,正確地講叫BrainInsoired Computer,而不是Brainlike,大腦你都不知道什么樣子,你like誰(shuí)呢。
      如何建造計算,實(shí)現人工智能的兩種途徑,計算機方式或者學(xué)大腦的方式。數據提高了,加一個(gè)網(wǎng)絡(luò )芯片,目前做這個(gè)工作的人基本上都得保留一些馮諾依曼架構,不能把馮諾依曼立馬取消了。當然也有人直接從右邊往左邊做,這個(gè)是屬于基礎研究的一類(lèi),我們要做的話(huà),這個(gè)類(lèi)腦就需要學(xué)科的交叉,我特別推薦要數學(xué)、認知科學(xué)、心理學(xué)、神經(jīng)科學(xué)和語(yǔ)言學(xué)等。
      最后說(shuō)一下,人工智能究竟有多大的希望呢?取決于我們對認知的世界的認知,取決于我們對自身的了解多少?
    \
      好了,我們把我們對自身的了解分成兩個(gè)部分,左邊部分是“我們知道we know”,右邊那部分叫做“我們不知道”,所以我們把它畫(huà)大一點(diǎn)。
    • 我們知道的東西的白色的部分,這就是“我知道的知道”,這就是知其所以然更知其所以然,這就是白盒。
      比如說(shuō)下國際象棋,就是我們能說(shuō)清楚,我們知其所以然,又知其所以然,這個(gè)用傳統的人工智能模型可以解決它。
    • 我們知道的下方黑色部分,是“我們不知道的知道wo don't know what we know”。
      這是黑箱,感知就是這樣,我們知其所以然,不知其所以然,我們知道那是張三,但我們說(shuō)不清楚張三鼻子多高眼睛多大,那怎么辦,用深度學(xué)習。
      從黑箱到白箱中間有個(gè)灰色地帶,好多問(wèn)題有的說(shuō)清楚,有的說(shuō)不清楚。最典型的就是圍棋,圍棋有一部分能說(shuō)清楚,而象棋都能說(shuō)清楚,馬為什么這么走,卒為什么要向前走,圍棋絕大部分一顆白子為什么要落在這個(gè)地方,大師也說(shuō)不清楚,他會(huì )說(shuō)這是我的棋感。
      棋感怎么做?這就是Alpha Go的重大貢獻,把棋感當作模式識別來(lái)做,你看到這個(gè)版面以后,你就應該知道怎么落子,這個(gè)版面就是一個(gè)模式,現在我們現在可以說(shuō),大師下圍棋下得好,不是因為它太聰明了,而是他的模式識別能力非常強,棋子有一點(diǎn)點(diǎn)變化,他就知道變了,就知道我的策略要變,這個(gè)就是用傳統模型+深度學(xué)習,Alpha Go就是這么做的,蒙特卡洛搜索+深度學(xué)習。這就是我們不知道的知道。
    • 還有藍色的部分,我們是不知道,但是我們(清楚地)知道我們不知道。
      比如情感、意識等等,這個(gè)也能夠用深度學(xué)習的方法來(lái)模擬,至少做到表面模擬。人工智能能做的這么多,這就是人工智能的厲害之處,為什么大家注意到,過(guò)去除了白色的部分,其它部分我們都不能做,人工智能能夠做這一切。
    • 但是唯獨黃色這部分,我們都不知道我們不知道。
      我們都不知道怎的情況下怎么做呢?腦科學(xué)研究覆蓋了所有,所以,我們的信息是建立在這個(gè)基礎上,我們不知道的我們不知道,變成我們知道的我們不知道,再把它變成我們知道的我們知道。傳統的算法只占在白色部分的一小部分,也就是說(shuō)可以建立數學(xué)模型的問(wèn)題,所以,我們?yōu)槭裁凑f(shuō)人工智能寄予這么大的希望,原因就在這兒。
      我說(shuō)這么多,謝謝大家。
     

    專(zhuān)題

    亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 莒南县| 咸丰县| 纳雍县| 思南县| 德清县| 南丹县| 霞浦县| 广州市| 桑植县| 安溪县| 疏勒县| 色达县| 安乡县| 昔阳县| 霍城县| 商丘市| 宝应县| 屏东县| 钟祥市| 金平| 竹山县| 雷山县| 河北区| 麟游县| 尚义县| 肇源县| 宜黄县| 偃师市| 竹山县| 集贤县| 建德市| 德化县| 霍州市| 西吉县| 奇台县| 鄂州市| 津南区| 新兴县| 法库县| 隆化县| 德安县| http://444 http://444 http://444 http://444 http://444 http://444