在2015年6月3日舉行的第七屆中國云計算大會(huì )上,中國電子學(xué)會(huì )云計算專(zhuān)家委員會(huì )名譽(yù)主任委員,中國大數據專(zhuān)家委員會(huì )顧問(wèn)、中國工程院院士李德毅作了《云計算再認識》的演講,他表示:云計算的產(chǎn)業(yè)鏈將曾經(jīng)相隔的微電子、計算機、通信、軟件、家電、穿戴設備、汽車(chē)、機器人等產(chǎn)業(yè)融合為三大板塊。云上形形色色的數據中心、計算中心各服務(wù)中心;異構層疊的網(wǎng)絡(luò );以產(chǎn)品為中心的產(chǎn)業(yè)鏈方式,已經(jīng)轉變?yōu)橐苑⻊?wù)為中心的利益攸關(guān)方的相互滲透,協(xié)商共贏(yíng)方式,云服務(wù)提供商成為產(chǎn)業(yè)鏈的主角。
以下是他的演講全文:
各位來(lái)賓,各位同行,各位代表,今天我們又一次在這里相聚,世界上最浪漫的事情也許就是我們這些人在云計算、大數據中慢慢的變得成熟。今天我們就云計算再談一點(diǎn)新的認識,講三個(gè)方面的問(wèn)題。
第一,天梯:云深不知處
大家知道云是一件很浪漫的事,大家都喜歡云,很多人的名字里面都有“云”。為什么喜歡云呢?在我的一本書(shū)里,曾經(jīng)有這樣一段詩(shī)意的描述,不多談了。大家知道云是在天上的,充滿(mǎn)了想象。我們既要腳踏實(shí)地,又要常常的仰望天空。涌起了多少云?老百姓搞糊涂了,私有云、混合云,到底怎么混合?我在第一屆云計算大會(huì )上曾經(jīng)提出云生態(tài),說(shuō)明云代表了服務(wù)的發(fā)布,水庫可以是私有的,但是天上的云是五彩繽紛的。用戶(hù)主導,依托互聯(lián)網(wǎng),按需服務(wù),導致了無(wú)所不在的互聯(lián)網(wǎng)的在線(xiàn)搜索,實(shí)時(shí)交互,時(shí)刻發(fā)生著(zhù)即時(shí)的協(xié)同。從圖靈計算到網(wǎng)絡(luò )計算,云計算的交互性遠遠超過(guò)圖靈機,我有一個(gè)題目叫超過(guò)圖靈機的云計算,云計算不是一臺虛擬的圖靈機,交互導致眾包。
水、電、交通等實(shí)現了社會(huì )化、集約化和專(zhuān)業(yè)化。后工業(yè)革命時(shí)期,云計算正在讓信息服務(wù)實(shí)現社會(huì )化、集約化和專(zhuān)業(yè)化。信息技術(shù)成為全社會(huì )公共的基礎設施,成為物聯(lián)網(wǎng)的基石。
服務(wù)器托管和積累形成的服務(wù)器農場(chǎng)只是個(gè)暫時(shí)現象,我們現在到各大互聯(lián)網(wǎng)公司去看一看他們的數據中心你會(huì )發(fā)現定制高端服務(wù)群,形成新的服務(wù)器群的新架構將成為高端服務(wù)器的產(chǎn)業(yè)鏈,滿(mǎn)足大數據挖掘的需求。 云的最大特點(diǎn)是不確定。云計算最根本的問(wèn)題處理不確定性,這正是云計算名稱(chēng)的由來(lái)所在。云和所有權無(wú)關(guān),不是什么私有云、公有云、混合云,每朵云里都可能涉及到用戶(hù)的隱私,或者行業(yè)的秘密。安全問(wèn)題已不再是云計算的攔路虎,云安全、數據安全實(shí)際上是服務(wù)和被服務(wù)方與信任管理的問(wèn)題,加強政府監管是最基本的保證。
我們在前幾次會(huì )上,大家都關(guān)注到位置服務(wù)。我們有一句話(huà)叫做位置服務(wù)是最接地氣的云計算,每個(gè)人現在都在享受搖一搖的生活,那就是一個(gè)很大的見(jiàn)證。上次會(huì )議上我曾經(jīng)提到過(guò)計算機發(fā)展的這個(gè)世紀以來(lái),存儲導致我們的搜索時(shí)代,現在的互聯(lián)網(wǎng)又導致了我們的交互時(shí)代。山不轉,水轉,大家還記得那一首歌。
物聯(lián)網(wǎng)的代表是車(chē)聯(lián)網(wǎng),物聯(lián)網(wǎng)的最高境界是機器人聯(lián)網(wǎng),有一個(gè)媒體把這兩個(gè)字去掉了,我很遺憾。移動(dòng)互聯(lián)網(wǎng)和云計算環(huán)境造就了大數據時(shí)代,產(chǎn)業(yè)前沿延伸,新興商業(yè)涌現,傳統意義的學(xué)科兼并,產(chǎn)業(yè)兼并,商業(yè)兼并日趨模糊,包括機器人在內的許多四不象的產(chǎn)品,四不象的商業(yè)、產(chǎn)業(yè)正在成為我們的主要形態(tài),正是它們造就了現代社會(huì )的時(shí)代特征。
于是,我們很高興的看到國務(wù)院2015年的5號文件,七年時(shí)間,七次大會(huì ),白皮書(shū)年年修改,我們走過(guò)了概念清晰,操作模糊,八仙過(guò)海,云里霧里的階段,我記得這16個(gè)字是我在華為的服務(wù)器發(fā)布會(huì )上的發(fā)言。SaaS已經(jīng)成為每個(gè)人實(shí)實(shí)在在的感受,PaaS平臺作為服務(wù)迎來(lái)了“互聯(lián)網(wǎng)+”,導致產(chǎn)業(yè)的新形態(tài)形成的“大眾創(chuàng )業(yè)、萬(wàn)眾創(chuàng )新”的局面。基礎設施正呼喚著(zhù)國家基礎信息設施的大跨步。寬帶建設,再一次成為人人的吶喊,現在是我們總理在吶喊,已經(jīng)不是我在吶喊。有人猛轟油門(mén),有人猛掛空檔,有人踩著(zhù)剎車(chē)不放松,有人開(kāi)著(zhù)空調吹冷風(fēng),運營(yíng)商發(fā)動(dòng)機轟鳴,老百姓感覺(jué)沒(méi)有挪地方。
總理提出“互聯(lián)網(wǎng)+”成為我們現在的一個(gè)熱詞,“互聯(lián)網(wǎng)+”的基礎首先是移動(dòng)寬帶+,沒(méi)有寬帶城市,沒(méi)有寬帶的移動(dòng)通信,沒(méi)有3G、4G、5G的發(fā)展就不會(huì )有“互聯(lián)網(wǎng)+”。5G的移動(dòng)通信,我們更需要光網(wǎng)的寬帶,沒(méi)有光網(wǎng)的寬帶,就沒(méi)有移動(dòng)的寬帶。寬帶是互聯(lián)網(wǎng)的基礎,有了“互聯(lián)網(wǎng)+”,才有了軟件即服務(wù),平臺即服務(wù),基礎設施即服務(wù)的核心基礎的云計算+,有了云計算+,才有物聯(lián)網(wǎng),我曾經(jīng)有一個(gè)報告,叫做云計算、物聯(lián)網(wǎng)的基石,有了物聯(lián)網(wǎng),派生了更多更多的大數據,于是有了大數據+,有了大數據,改變了我們整個(gè)科學(xué)的時(shí)代,現在進(jìn)入一個(gè)數據密集性的科學(xué),所以我們運用大數據有了人工智能加。我想這坐天梯對我們的信息社會(huì )是多么的美好。我們搞IT的同志們,我們看到全社會(huì )各行各業(yè)都要面臨需求,互聯(lián)網(wǎng)+,+的是X,我們看到這樣一個(gè)天氣,一定要加強自身的建設。所以,我提議再加一個(gè)片子,叫做天梯須自強,只有這樣我們才能不負重望,把這個(gè)“互聯(lián)網(wǎng)+”承擔起來(lái)。
我們曾經(jīng)叫做體系,怎么解讀這個(gè)體系呢?就是系統的系統,已有的系統常常是垂直系統,靠什么?靠云計算,這就是云計算的巨大特征。傳統的服務(wù)是垂直行業(yè)的服務(wù),有人把它叫做私有云,實(shí)際上應該叫行業(yè)云,通過(guò)云計算我們有了各種各樣的虛擬服務(wù),跨界的服務(wù)。我們說(shuō)大數據,大數據哪兒來(lái)的?“互聯(lián)網(wǎng)+”、云計算+,物聯(lián)網(wǎng),有了大數據,靠什么發(fā)現價(jià)值?我們靠大數據+,形成了一個(gè)價(jià)值,價(jià)值就是我們的資源。
第二,云計算盤(pán)活大數據資產(chǎn)發(fā)現價(jià)值
大數據認知,我們看看數據是怎么認知的。舉幾個(gè)例子,第一個(gè)例子,寫(xiě)詩(shī)。大家知道唐詩(shī)宋詞一共48150首,總體就是35萬(wàn)字,看看數據認知是怎么寫(xiě)詩(shī)的。規矩越多,越適合計算機寫(xiě),這個(gè)規矩就是形式化。我們搞計算機,搞程序,就是要搞程序化,對押韻有嚴格要求,比如把李白的一首詩(shī)碎片化,變成一個(gè)大數據,實(shí)際上不是一個(gè)大數據,因為才1010首詩(shī),按照平平仄仄,仄仄平平。把李白的詩(shī)按照一定的結構把它結構化,形成一個(gè)縮影,X1,X2,X3,一直到X8,又可以讓李白作為一個(gè)詩(shī)人,毛主席誕辰一百周年,把189326做索引,18,1是羞玉繞靈間,喜虎哀苦寒,鳳樓留不住,夜郎醉不眠。如果毛澤東是12月27號生的,這首詩(shī)變成鳳樓留不住,夜郎見(jiàn)蒼山。
最近網(wǎng)上總是在說(shuō),雷軍說(shuō)了一句英語(yǔ)“I’m Very Good”。我要跟大家說(shuō)How Are You很正常,如果打乒乓球的時(shí)候,對方摔倒了,我會(huì )說(shuō)一句話(huà),Are You OK?這時(shí)候你說(shuō)I’ ok,這就是不確定性,這就是大數據的力量。英語(yǔ)900句,如果變成9000句,甚至變成更多的大數據,做野蠻翻譯,按照語(yǔ)言學(xué)中的二八定律,講80%的時(shí)間用20%的高頻詞匯量。所以,大數據造就了野蠻翻譯。我們現在的科大訊飛,我們的百度大佬,都是在做這樣的事情。當你拿著(zhù)微信,把語(yǔ)言變聲音,聲音變語(yǔ)言的時(shí)候,充分利用了這樣的一個(gè)頻率分布。所以,大數據讓我們思考一個(gè)深刻的問(wèn)題,是形而上,還是形而下,是先有語(yǔ)言學(xué),還是先有語(yǔ)言。
大數據標志著(zhù)一個(gè)新時(shí)代的到來(lái)。這個(gè)時(shí)代的特征不只是追求豐富的物質(zhì)資源,也不只是無(wú)所不在的互聯(lián)網(wǎng)帶來(lái)的方便的多樣化信息服務(wù),同時(shí)還包含區別于物質(zhì)的數據資源的價(jià)值發(fā)現和價(jià)值轉換,以及由大數據帶來(lái)的精神和文化方面的嶄新現象。
大數據來(lái)源于人類(lèi)測量,記錄和分析世界的渴望和無(wú)盡的追求。隨著(zhù)信息技術(shù)、尤其是傳感器、通信、計算機和互聯(lián)網(wǎng)技術(shù)的迅猛發(fā)展和廣泛應用,人類(lèi)獲取數據的手段越來(lái)越多,速度大大加快,成本急劇降低,層次和尺度更為精細,這樣大數據成為網(wǎng)絡(luò )時(shí)代人類(lèi)社會(huì )的重要資產(chǎn)。
所以,我個(gè)人認為,沒(méi)有什么大數據科學(xué),它還沒(méi)產(chǎn)生呢?大數據僅僅是一個(gè)客觀(guān)存在,就其本人而言,既不是科學(xué),也不是技術(shù),各行各業(yè)的大數據都以10的三次方的數量級網(wǎng)上增長(cháng)。你要把這些大數據發(fā)現價(jià)值,你要看一遍嗎?這是人類(lèi)幾千年來(lái)認知世界和社會(huì )的基本能力,是從大數據終發(fā)現價(jià)值必須面對的一個(gè)普遍性。認知科學(xué)要有所突破,首先要在大數據上,聚類(lèi)上有所突破。大家還記得2008年的那篇文章,標題最大的是大數據,還有一個(gè)很重要的標題,ZB時(shí)代的科學(xué)應該怎么做?我認為互聯(lián)網(wǎng)廠(chǎng)商應該關(guān)心這樣一些基本的普遍性的問(wèn)題,那就是聚類(lèi)。
人類(lèi)走過(guò)了幾千年的實(shí)驗科學(xué),幾百年的理論科學(xué),幾十年的計算科學(xué)之后,迎來(lái)了數據密集型的科學(xué)的新時(shí)代。適應科學(xué),理論科學(xué),計算科學(xué)時(shí)代,大定律,大模型,小數據,數據是圍著(zhù)模型和程序轉的。今天模型和程序要圍著(zhù)數據傳,現在是大數據、小模型、小定律交叉學(xué)科,即使是同一個(gè)癌癥病,每個(gè)人身上也都不一樣,所以要關(guān)注對小數據的研究,小群體的研究,因此創(chuàng )新表現在創(chuàng )新交叉學(xué)科的形式化理論上。要更多的關(guān)注小眾,更多的關(guān)注由下而上,而不是做特例發(fā)表論文。
這張片子,我前幾次用過(guò),前面講結構化數據用數據庫,或者數據倉庫來(lái)應對,半結構化數據用網(wǎng)頁(yè)、搜索引擎等技術(shù)應對。非結構化數據用深度學(xué)習、網(wǎng)絡(luò )交互和群體智能應對。云計算的性?xún)r(jià)比要充分確定大數據中不確定性和價(jià)值的隱蔽性,跨界構建基于統計的可變視角和可變尺寸的全新發(fā)展狀態(tài)空間,大數據驅動(dòng)云計算架構中心的演化和進(jìn)化,滿(mǎn)足及時(shí)發(fā)現大數據價(jià)值的需求,這個(gè)互聯(lián)網(wǎng)企業(yè)就是高手。這是我對云計算和大數據關(guān)系的認識。
第三個(gè),云計算支撐機器人認知和機器人聯(lián)網(wǎng)
機器人老百姓想到的機器人一般是人形機器人,其實(shí)不一定是人形的,只要和人的功能相當就行了,有時(shí)候是形似,神不似,互聯(lián)網(wǎng)、云計算、物聯(lián)網(wǎng)和大數據可以有力的支撐機器人如何說(shuō),如何看,如何想,機器人需要工業(yè)革命3.0的支撐,這一點(diǎn)我們是要缺口要補的。認知就是外在表現如何說(shuō),如何看,怎么說(shuō)?語(yǔ)言認知?怎么看,圖像認知,怎么動(dòng)?控制行為。關(guān)鍵是怎么想。圖靈計算機,既然側重于計算機,我們今年要創(chuàng )新開(kāi)辟新的電腦系統,或者叫做真正的機器人腦系統。這種機器人腦系統,不但包括計算智能,還要包括記憶智能和交互智能。在“互聯(lián)網(wǎng)+”、云計算+,大數據+的形態(tài)下,利用云+端的形態(tài)已經(jīng)孕育太多的機器人之雛形。例如導航,我們用林志玲導航,郭德剛導航版,我們游戲機器人,這些機器人在動(dòng)作方面都比較簡(jiǎn)單。英語(yǔ)學(xué)習機器人,這就是整個(gè)的服務(wù)。
所以,云服務(wù)機器人將來(lái)會(huì )更多的出現在社會(huì )的各個(gè)生活層面,例如是超市的語(yǔ)音導游導購機器人,微博健康助手機器人,論文投稿推薦機器人,高考機器人,機器人交警。機器人撰稿也已經(jīng)發(fā)生了,機器人寵物是一個(gè)新的發(fā)現,養一個(gè)機器人,機器狗就換一個(gè)性格,多好。語(yǔ)言、文本、歌曲、劇本,如果都能通過(guò)機器人變得情感、動(dòng)作、語(yǔ)音,我們就會(huì )發(fā)現研發(fā)語(yǔ)言和圖像豐富,頭腦復雜,四肢動(dòng)作簡(jiǎn)單的特定認知域的云機器人,機器人的智商和情商容易取得小眾的共識。比如人臉識別機器人,聊天機器人,機器人汪國真,機器人李白。草品噴淋機器人,是剛研發(fā)的,它還可以研發(fā)一個(gè)戀愛(ài)機器人,培養你談戀愛(ài)的經(jīng)驗。
我們做了一件事情,做了一個(gè)不帶情緒的輪式機器人,汽車(chē)的顛覆性創(chuàng )造,很可能就是輪式機器人。Google公司最近有一個(gè)報道,說(shuō)Google無(wú)人駕駛汽車(chē)有上百萬(wàn)英里的測試經(jīng)驗,大致相當于人類(lèi)75年的駕齡。汽車(chē)的工業(yè)100多年了,為什么人類(lèi)是75年,我覺(jué)得沒(méi)有講清楚。如果我們汽車(chē)研發(fā)的結果,相當于一個(gè)人的75年駕齡,所以我覺(jué)得有一個(gè)問(wèn)題,駕駛認知如何度量,認領(lǐng)75年駕齡的水平究竟是什么?
我們這十年來(lái)做了機器的價(jià)值腦的研發(fā)工作,把情緒扣除,把性格、長(cháng)期記憶,動(dòng)作、短期記憶,學(xué)習和思維,這主要部分進(jìn)行物化,通過(guò)感知,通過(guò)加深腦的認知,再行動(dòng),再感知,再認知,再行動(dòng)。我們提倡不單單要計算,如果一個(gè)人不能遺忘就沒(méi)有智能的表現,沒(méi)有遺忘就沒(méi)有智能,遺忘是人類(lèi)智能的表現。我們記憶中要進(jìn)行抽象,要把記憶、計算和交互三位一體,我們的輪式機器人,包括四大類(lèi)傳感器,雷達的、攝象頭的、汽車(chē)自身還有GPS接收機,我們利用人腦中的地圖,根據動(dòng)機檢驗路徑規劃,擱在當前的記憶時(shí)空,形成決策,控制小腦,小腦就是我們的控制。我們深深體會(huì )到IT行業(yè)一定要跟汽車(chē)行業(yè)緊密的結合,不要小看汽車(chē)行業(yè),100多年汽車(chē)的駕駛已經(jīng)搞得相當成功了,能夠把方向盤(pán),橫向控制,或者縱向的速度控制,分離開(kāi)來(lái),做了很好的解耦。應該學(xué)習騎車(chē)人的經(jīng)驗。于是,我們構造了一個(gè)機器駕駛腦,這一塊,長(cháng)期記憶,短期記憶,動(dòng)機,學(xué)習和思維,小腦,肢體,這部分叫感知。通過(guò)感知認知行動(dòng),再感知,再認知,再行動(dòng)。這就是我們基本的智能駕駛方案。
在這個(gè)方案,我們逐步聚焦它的架構設計、模塊劃分。我們汽車(chē)有20幾個(gè)傳感器,他們按照他們拿到的大數據進(jìn)行數據的檢閱和數據的挖掘,最后變成一個(gè)感知的理解,變成一個(gè)認知的理解。正常的理解,感知的理解,認知的理解,分別代表瞬間記憶,工作記憶以及長(cháng)期記憶。形成的駕駛圖紙,我們發(fā)明了一個(gè)自主的認知箭頭,用認知箭頭實(shí)行自動(dòng)控制,我們希望取代現在汽車(chē)的探頭系統,經(jīng)過(guò)控制控制這個(gè)汽車(chē)的雙駕雙控,駕駛人如果想開(kāi)車(chē),還可以踩油門(mén)實(shí)現駕駛的樂(lè )趣。這樣我們通過(guò)雙駕雙控的功能,這個(gè)智能車(chē)可以作為教練車(chē),也可以作為自學(xué)習車(chē),這就是我們駕駛的方案。我們模塊化的功用模塊,還有底下這些。
這樣的駕駛腦跟云計算怎么結合?我們最近成立了云計算組,板卡組。云計算組我們希望將來(lái)汽車(chē)上裝一個(gè)無(wú)人機,假如前面擠,或者一個(gè)東西看不清楚,我們叫這個(gè)無(wú)人機看看有多深。我們還可以通過(guò)云感知,感知更大的空間,通過(guò)云搜索,得到更好、更新的地圖,通過(guò)云計算和群體智能,可以得到事故險情、路口記憶等。所以,就一個(gè)特定的事情來(lái)說(shuō),在某一個(gè)方面,一個(gè)特定的人群,人工智能是可以做到的。
這是我們課題組在上海汽車(chē)博覽會(huì )研發(fā)的無(wú)人駕駛汽車(chē)演示,這個(gè)車(chē)離那個(gè)標只有幾厘米,人都做不到這么好,有一點(diǎn)駕駛智能的水平。我們還在公交車(chē)上做了試驗,我們的大車(chē),最小一步原來(lái)提20公分,我們的結果最小是5公分,所以你停車(chē)的時(shí)候,最小步可以做到5公分,讓我們很興奮。這是公交車(chē)在一個(gè)廠(chǎng)區正式環(huán)境下怎么過(guò)路口,過(guò)馬路的。這個(gè)道路,紅綠燈我們通過(guò)路網(wǎng)系統來(lái)解決,其他的車(chē)子在周邊照樣開(kāi),這是一個(gè)廠(chǎng)區的廠(chǎng)內班車(chē)。
我們還在想,怎么研發(fā)新興云機器人研究腦認知。能不能研發(fā)機器人再現老年如何癡呆?能不能研發(fā)機器人再現老年癡呆如何康復等。同時(shí)我總結一下,云計算的產(chǎn)業(yè)鏈將曾經(jīng)相隔的微電子、計算機、通信、軟件、家電、穿戴設備、汽車(chē)、機器人等產(chǎn)業(yè)融合為三大板塊。云上形形色色的數據中心、計算中心各服務(wù)中心;異構層疊的網(wǎng)絡(luò );以產(chǎn)品為中心的產(chǎn)業(yè)鏈方式,已經(jīng)轉變?yōu)橐苑⻊?wù)為中心的利益攸關(guān)方的相互滲透,協(xié)商共贏(yíng)方式,云服務(wù)提供商成為產(chǎn)業(yè)鏈的主角。我們要更加關(guān)注客戶(hù)體驗和大數據價(jià)值發(fā)現,更加關(guān)注以車(chē)聯(lián)網(wǎng)為代表的物聯(lián)網(wǎng),更加關(guān)注機器人認知,或機器人聯(lián)網(wǎng),謝謝大家!