• <strike id="fdgpu"><input id="fdgpu"></input></strike>
    <label id="fdgpu"></label>
    <s id="fdgpu"><code id="fdgpu"></code></s>

  • <label id="fdgpu"></label>
  • <span id="fdgpu"><u id="fdgpu"></u></span>

    <s id="fdgpu"><sub id="fdgpu"></sub></s>
    您當前的位置是:  首頁(yè) > 新聞 > 文章精選 >
     首頁(yè) > 新聞 > 文章精選 >

    百度云首席數據科學(xué)家沈志勇:百度云ABC戰略

    2017-07-26 14:28:48   作者:   來(lái)源:CTI論壇   評論:0  點(diǎn)擊:


      
      謝謝,非常榮幸來(lái)到這里跟大家分享百度云的ABC戰略。
      我先破一下題,這個(gè)ABC戰略跟剛才徐總有點(diǎn)英雄略同,A是人工智能AI,B是Big Data大數據,C是Cloud Computing云計算。大家知道云計算其實(shí)在一定程度上一開(kāi)始的時(shí)候,像亞馬遜出現的時(shí)候是作為一個(gè)能力共享的方式出來(lái)的,這里面互聯(lián)網(wǎng)公司為什么會(huì )具備三位一體這三個(gè)能力,我個(gè)人稍微解讀一下,它其實(shí)跟一個(gè)產(chǎn)業(yè)的發(fā)展或者需求的演進(jìn)有關(guān)系,一開(kāi)始一個(gè)行業(yè)一個(gè)產(chǎn)業(yè)要經(jīng)歷信息化的過(guò)程,像互聯(lián)網(wǎng)行業(yè)天生就是信息化的,解決的是信息的服務(wù)可用性,就像百度搜索引擎能讓用戶(hù)搜到東西。往后走發(fā)現,信息化以后自然而然會(huì )產(chǎn)生很多數據,自然而然會(huì )去想,這數據能用來(lái)干嗎。尤其是到了Web 2.0以后出現用戶(hù)的概念,怎么樣讓用戶(hù)體驗更好,讓他們在產(chǎn)品上停留更多時(shí)間。這個(gè)時(shí)候我們會(huì )去考慮怎么樣使用用戶(hù)行為的歷史數據,或者UGC數據比如類(lèi)似評論數據。這個(gè)時(shí)候其實(shí)是我們在做數據驅動(dòng)的事情。再往上走會(huì )發(fā)現,互聯(lián)網(wǎng)公司很多產(chǎn)品出現多樣化的交互形式,你不光可以通過(guò)文字輸入,還可以通過(guò)語(yǔ)音輸入,這個(gè)時(shí)候我們會(huì )用到人工智能的東西,其他還有機器翻譯等等。互聯(lián)網(wǎng)公司經(jīng)歷過(guò)這樣一個(gè)發(fā)展過(guò)程,別的行業(yè)也在經(jīng)歷這個(gè)發(fā)展過(guò)程,慢慢從信息化再到數據驅動(dòng)的需求,再往上走就是智能化。有些行業(yè)可能剛剛進(jìn)入信息化的過(guò)程,有些行業(yè)可能發(fā)達一些,怎么把百度作為互聯(lián)網(wǎng)公司在發(fā)展中積累的能力分享出來(lái),百度云是這樣一個(gè)很好的載體。接下來(lái)按照C-B-A的順序仔細闡述一下,我們到底有哪些東西已經(jīng)具備了,可以拿出來(lái)跟整個(gè)行業(yè)分享。
      首先是云Cloud基礎架構這一塊,我們要分享的主要一個(gè)是計算,第二是存儲,還有網(wǎng)絡(luò )這塊的架構,其他還包括一些像安全等方面。
      計算這塊,在百度我們有非常多的產(chǎn)品線(xiàn),我們要支持非常多形式的而且高強度的計算場(chǎng)景,所以會(huì )形成不同的軟硬件為基礎的計算服務(wù)都在里面。需要特別強調的是人工智能,也是百度的戰略方向,人工智能背后用到的服務(wù)器主要是GPU集群,積累比較深厚,可以做一些規模化的部署,在業(yè)界應該是比較領(lǐng)先的。另外一塊,存儲,大家都用百度網(wǎng)盤(pán),它是一個(gè)對象存儲的存儲架構,當然我們還有其他的存儲形式可以提供。網(wǎng)絡(luò ),每個(gè)網(wǎng)絡(luò )服務(wù)的環(huán)節基本上都是TB級的帶寬。
      這是跟今天會(huì )議主題比較契合的頁(yè)面,我們在安全這塊是比較重視的,這是百度云具備的各種安全的資質(zhì)和證書(shū),我們一直在努力營(yíng)造安全的云服務(wù)環(huán)境。
      剛才講的是外部對我們百度云安全方面的認可,這一頁(yè)是我們內部技術(shù)努力,我們在很多方面都有技術(shù)積累沉淀,包括DDoS攻擊的防護等等。
      接下來(lái)講Big Data,我是數據科學(xué)家,主要從事這塊多一些。百度在數據方面不光有數據能力,像數據存儲、分析等等這塊,還有很多的數據資源包括一些用戶(hù)產(chǎn)生的數據。這兩塊我們都在想法怎么樣利用它。
      先看一下百度的大數據到底大到什么程度,我們有大概6億用戶(hù),每天會(huì )產(chǎn)生大概100億次的檢索,檢索里面包含了用戶(hù)的關(guān)注還有用戶(hù)的需求等等這樣一些信息,而且覆蓋的興趣面是非常廣的。還有一個(gè)比較大的我們的產(chǎn)品是百度地圖,會(huì )有很多別的相關(guān)的應用來(lái)用百度地圖的接口,這樣會(huì )產(chǎn)生每天大概720億次的地圖上的定位請求,里面的信息基本上是用戶(hù)用腳投票的信息,也有非常高的價(jià)值。我講到這里必須強調一個(gè),這些數據里的原始數據信息我們是不可能拿來(lái)共享的,我們會(huì )對這些數據進(jìn)行加工,得到一些不侵犯隱私的數據資源。
      用戶(hù)畫(huà)像產(chǎn)品是我們針對自有產(chǎn)品的改善,利用剛才講的地圖和搜索的數據,再加上百度別的產(chǎn)品線(xiàn)的數據構造的。它實(shí)質(zhì)上是一個(gè)標簽體系,百度的的標簽體系維度非常大,體現出非常多樣的興趣的信息。
      剛才講的是數據資源,有些不包含隱私的加工后產(chǎn)品可以共享。但我們更重要的想分享的是我們處理這些數據的能力,這里分了很多層次,最底下是數據采集的能力,甚至包括了物聯(lián)網(wǎng)的數據采集能力。再往上是數據的存儲,包含關(guān)系數據庫,包括對象存儲數據庫以及NoSQL數據庫。再往上進(jìn)行處理與分析,這塊是百度技術(shù)優(yōu)勢比較大的地方,基本上我們所有產(chǎn)品都是數據驅動(dòng)的,有很多產(chǎn)品在里面,包括傳統的日志分析MapReduce相關(guān)的,深度學(xué)習的paddlepaddle平臺,還有機器學(xué)習的工具包BML等等。到了服務(wù)層,我們針對語(yǔ)音識別、智能客服用的智能問(wèn)答等等,再往上是相關(guān)的服務(wù)組合起來(lái)能夠服務(wù)到的一些行業(yè),這樣一來(lái)大家對百度的數據能力有一個(gè)大概的了解,這整套能力構成的平臺,我們稱(chēng)之為天算平臺。
      具體的,比方說(shuō)里面有日志的分析,互聯(lián)網(wǎng)產(chǎn)品為什么能夠做的很貼心,用戶(hù)體驗比較好,離不開(kāi)用戶(hù)歷史數據的分析,用來(lái)做用戶(hù)體驗和產(chǎn)品的優(yōu)化。針對用戶(hù)體驗的另外一個(gè)非常重要的工具叫推薦系統,大家可能體會(huì )過(guò),在買(mǎi)東西的時(shí)候旁邊會(huì )出來(lái)你可能想買(mǎi)什么,百度音樂(lè )會(huì )有你喜歡聽(tīng)的音樂(lè )的推薦。這個(gè)技術(shù)能力我們也可以往外開(kāi)放出來(lái),做一個(gè)接口形式給大家使用。營(yíng)銷(xiāo)這塊,可能在座的會(huì )更加熟悉一點(diǎn),里面會(huì )有很多的模塊,像DSP、SSP,百度在這塊有相應的模塊對外開(kāi)放,通過(guò)百度云對外開(kāi)放,我們叫營(yíng)銷(xiāo)云。RTB是里面一個(gè)具體的組成部分,營(yíng)銷(xiāo)云里的實(shí)時(shí)競價(jià)的模塊。還有一個(gè)更重要的模塊是DMP,怎么樣知道用戶(hù)別的一些信息,但是我們不會(huì )直接共享我們的用戶(hù)數據,而是怎么往外共享構造DMP的能力,怎么用客戶(hù)自己積累的數據去上面構建DMP。
      剛才講了大數據,我們再來(lái)到人工智能。人工智能百度是多年來(lái)重點(diǎn)投入的方向,也是目前的戰略方向。我個(gè)人作為一個(gè)研究院人員,對人工智能作一個(gè)小小的解讀。我認為人工智能可以分為這樣三個(gè)境界,人工智能說(shuō)白了其實(shí)就是想讓機器幫人干活,在干活的過(guò)程中提高效率和效果。但是為了讓機器具備干活的能力,我們首先讓它具備人的某些功能。第一個(gè)是怎么樣感知這個(gè)世界,怎么樣聽(tīng)明白、看明白、讀懂人說(shuō)的話(huà),這個(gè)我們叫做感知世界的能力。比如像人臉識別、語(yǔ)音識別是最典型的應用,這些技術(shù)隨著(zhù)深度學(xué)習的發(fā)展,基本上從實(shí)驗室走出來(lái),走到可以商用的程度。機器感知到信息以后,能不能進(jìn)行思考,像讓機器參加一些知識競賽。更有挑戰的人工智能體現在機器的自主行為上,能不能在一個(gè)現實(shí)世界的開(kāi)放空間里,讓機器像人一樣真正去行為,自動(dòng)駕駛、無(wú)人車(chē)是最典型的,還有機器人的技術(shù),包括各種垂直行業(yè)的機器人。百度像自動(dòng)駕駛這塊和人機交互機器人這塊已經(jīng)獨立成立事業(yè)部,歸我們的COO陸奇直接領(lǐng)導。前面包括感知世界能力和快速思考能力,百度在里面也都有深厚的積累。這三個(gè)層次的能力,我們也有對外共享的平臺來(lái)提供,我們叫百度云天智平臺。天智平臺對外方式有兩種,一種是可以直接用,還有是通過(guò)API調用。
      剛才講到大數據,我們對應的是百度云天算平臺,人工智能對應的是天智平臺,這兩個(gè)平臺是按照能力劃分的。我們對于典型應用場(chǎng)景還構造了兩個(gè)平臺產(chǎn)品,一個(gè)叫天像,一個(gè)叫天工。天像平臺是針對視頻多媒體這塊,這里面像視頻需要的分發(fā)也好或者視頻里有些簡(jiǎn)單的分析也好,都能在這個(gè)平臺上共享得到,典型應用方包含在線(xiàn)教育、直播平臺等。天工是最近比較火的智能制造與物聯(lián)網(wǎng)相關(guān)的,它主要是針對怎么樣喚醒萬(wàn)物,針對現實(shí)世界,能不能把互聯(lián)網(wǎng)的一些模式也好、能力也好,能夠下沉到現實(shí)世界里面去,給他們做一個(gè)物與物之間的連接,把物與物產(chǎn)生的數據也都記錄下來(lái),怎么樣再優(yōu)化現實(shí)世界的生產(chǎn)流程。典型的應用包括智慧城市、智慧樓宇、智慧生產(chǎn)線(xiàn)等等。
      最后把百度云ABC三塊的能力與資源,細化成大的模塊,怎么樣對外共享,有很多產(chǎn)品。我們不光是作為云自身有包括SaaS層、IaaS層、PaaS層的各種服務(wù),我們還可以作為接口,對接其他百度的能力與服務(wù)。
      謝謝大家!

    相關(guān)閱讀:

    專(zhuān)題

    亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 峨眉山市| 六安市| 安康市| 太仆寺旗| 如皋市| 萨迦县| 醴陵市| 罗平县| 迁安市| 明光市| 海盐县| 绥芬河市| 石首市| 金华市| 贺兰县| 郸城县| 朝阳县| 固阳县| 台东市| 南川市| 古田县| 河北省| 耒阳市| 高雄县| 桦南县| 大理市| 休宁县| 大埔县| 云安县| 砚山县| 朝阳市| 岱山县| 绥阳县| 德阳市| 庆阳市| 榆中县| 桃园市| 甘谷县| 河北省| 博湖县| 岳普湖县| http://444 http://444 http://444 http://444 http://444 http://444