• <strike id="fdgpu"><input id="fdgpu"></input></strike>
    <label id="fdgpu"></label>
    <s id="fdgpu"><code id="fdgpu"></code></s>

  • <label id="fdgpu"></label>
  • <span id="fdgpu"><u id="fdgpu"></u></span>

    <s id="fdgpu"><sub id="fdgpu"></sub></s>
    您當前的位置是:  首頁(yè) > 資訊 > 文章精選 >
     首頁(yè) > 資訊 > 文章精選 >

    DCN 學(xué)院派丨智能無(wú)損DCN,釋放AI算力巔峰

    2020-03-27 16:28:35   作者:王 雷 | 華為數據中心網(wǎng)絡(luò )總裁   來(lái)源:CTI論壇   評論:0  點(diǎn)擊:


      人類(lèi)社會(huì )正在進(jìn)入數字經(jīng)濟增長(cháng)周期。根據華為GCI調研結論,數字經(jīng)濟的增長(cháng)率是全球經(jīng)濟增長(cháng)率的2.5倍,數字經(jīng)濟的投資收益率為非數字經(jīng)濟的6.7倍,當數據成為驅動(dòng)經(jīng)濟增長(cháng)的核心生產(chǎn)要素,誰(shuí)掌握領(lǐng)先“數據基礎設施”才能贏(yíng)得未來(lái)!我們知道,數據流動(dòng)起來(lái)才能產(chǎn)生價(jià)值,而數據中心網(wǎng)絡(luò )就是數據流動(dòng)的管道。那么,什么樣的數據中心網(wǎng)絡(luò )才能讓數據高效地流動(dòng)起來(lái),這就是本文的出發(fā)點(diǎn)。
      企業(yè)數字化轉型升級
      AI點(diǎn)石成金
      人類(lèi)社會(huì )的發(fā)展在經(jīng)歷了農業(yè)時(shí)代、工業(yè)時(shí)代后,隨著(zhù)信息化技術(shù)的發(fā)展,終于迎來(lái)了數字經(jīng)濟時(shí)代。據Gartner調研,75%的大型企業(yè)已經(jīng)將數字化轉型作為企業(yè)核心戰略。與農業(yè)經(jīng)濟關(guān)注土地和勞動(dòng),工業(yè)經(jīng)濟關(guān)注資本和技術(shù)截然不同,數字經(jīng)濟的核心生產(chǎn)要素已經(jīng)轉變?yōu)閿祿椭悄堋F髽I(yè)數字化轉型過(guò)程中產(chǎn)生大量的數據,已經(jīng)成為企業(yè)核心資產(chǎn)的一部分,然而數據本身不是目的,知識和智慧才是永恒的價(jià)值。通過(guò)AI從數據中挖掘智慧,實(shí)現數據的商業(yè)價(jià)值變現,成為當前企業(yè)數字化轉型的主題。AI成為企業(yè)重塑商業(yè)模式、提升客戶(hù)體驗和開(kāi)創(chuàng )未來(lái)的關(guān)鍵推動(dòng)力。+AI,標志著(zhù)企業(yè)數字化轉型進(jìn)入了智能化新階段。
      過(guò)去的幾年來(lái)企業(yè)對AI的采用率爆發(fā)式增長(cháng),據華為GIV(Global Industry Vision)預測,到2025年大企業(yè)對AI的采用率將達到97%。作為企業(yè)數據金礦的煉金術(shù),AI點(diǎn)石成金,成為企業(yè)數字化轉型到智能化升級成敗的關(guān)鍵。AI技術(shù)的大量使用,驅動(dòng)企業(yè)數據中心使命發(fā)生顛覆性變革。
      企業(yè)數據中心邁入AI時(shí)代
      釋放AI算力是關(guān)鍵
      企業(yè)智能化升級驅動(dòng)數據中心從云時(shí)代邁入了AI時(shí)代。相比而言,云數據中心更像是個(gè)業(yè)務(wù)支撐中心,以應用為中心,通過(guò)云平臺實(shí)現IT資源的快速發(fā)放。而AI數據中心在云數據中心基礎上真正演進(jìn)成為商業(yè)價(jià)值中心,以數據為中心,聚焦于如何基于A(yíng)I對數據進(jìn)行高效處理。
      AI驅動(dòng)DC重構
      隨著(zhù)數據中心AI時(shí)代到來(lái),算力作為AI三大關(guān)鍵要素之一,需求更加旺盛和多樣化。算力貴、算力不足,已經(jīng)成為時(shí)代挑戰,更高算力的GPU、AI芯片相繼涌現。而另一方面,由于網(wǎng)絡(luò )丟包的原因導致昂貴的算力在實(shí)際應用中不能有效的發(fā)揮。如果說(shuō)衡量一個(gè)云數據中心的關(guān)鍵指標是業(yè)務(wù)發(fā)放的效率,那么衡量AI數據中心的關(guān)鍵指標就是AI運行效率。
      如何提升AI數據中心的運行效率?
      充足AI算力是前提。我們知道,深度學(xué)習的神經(jīng)網(wǎng)絡(luò )算法突破引爆了新一輪的AI浪潮,而深度學(xué)習需要到巨大的算力支撐,比如一次語(yǔ)音識別的AI訓練涉及到20E(1E=1018次方)次的浮點(diǎn)計算,而谷歌機器翻譯算力需求量達到103E,即便用全世界最高性能的超級計算機Summit來(lái)計算,也需要較長(cháng)的時(shí)間。保證有充足的算力成為提升AI運行效率基本前提,以AWS、華為等為代表的公有云廠(chǎng)商領(lǐng)導者正在采用x86/ARM CPU,GPU,NPU構建業(yè)界最高性能的算力池。
      釋放算力是關(guān)鍵。以深度學(xué)習為特征的AI計算也依賴(lài)海量的數據的輸入(無(wú)論是AI訓練樣本算據還是AI推理涉及到原始算據的輸入)。裝載算力的GPU/AI服務(wù)器只有獲得完整算據后才能進(jìn)行AI處理,否則只能空閑等待,因而數據的存取速度將直接影響算力的發(fā)揮。比如根據AWS公開(kāi)數據顯示,公有云訓練實(shí)例P3采用100GE的優(yōu)化網(wǎng)絡(luò ),要比25G的TCP網(wǎng)絡(luò )在Mask R-CNN訓練中性能提升5倍;而在推理實(shí)例G4中,利用100GE優(yōu)化網(wǎng)絡(luò ),RestNet50模型推理性能提升4倍,Bert-Base模型推理性能提升多達34倍。同樣算力條件下,如何保證算力100%釋放甚至更為關(guān)鍵。
      AI數據中心架構重塑
      0丟包的無(wú)損網(wǎng)絡(luò )成為基本訴求
      當前的云數據中心建設基本思路是采用虛擬化技術(shù)對IT資源池化管理,通過(guò)Software Defined Everything思路完成資源的統一的按需自助/自動(dòng)化發(fā)放,最終實(shí)現Everything as a Service的云化服務(wù)形態(tài)。而為了滿(mǎn)足數據中心充分釋放AI算力從而使得AI高效運行的訴求,面向AI時(shí)代的數據中心架構正在重塑。業(yè)界提出構建以全閃存存儲數據湖為核心,以GPU/AI多樣化計算為算力底座的AI時(shí)代數據中心架構,越來(lái)越得到廣泛認可。
      AI數據中心架構
      在A(yíng)I數據中心新架構中,作為數據中心核心組成的存儲和計算正在發(fā)生顛覆性的變革:全閃存化存儲介質(zhì)使得存儲時(shí)延降低百倍,GPU/AI智能計算使得計算性能提升百倍。計算和存儲的性能百倍提升導致傳統以太網(wǎng)的擁塞易丟包帶來(lái)的網(wǎng)絡(luò )瓶頸問(wèn)題開(kāi)始凸顯。根據業(yè)界統計,即便在低于<10%鏈路帶寬的低負載流量環(huán)境下,突發(fā)流量引起的網(wǎng)絡(luò )的丟包率也接近1‰,而這1‰的丟包在A(yíng)I時(shí)代會(huì )直接導致算力下降接近50%。隨著(zhù)業(yè)務(wù)負載的增加,分布式多打一流量的增多,網(wǎng)絡(luò )丟包問(wèn)題將更為嚴重。
      如何構建一個(gè)0丟包的無(wú)損數據中心網(wǎng)絡(luò )成為面向AI時(shí)代的數據中心網(wǎng)絡(luò )的基本要求。
      業(yè)界首款內置AI芯片的交換機
      構筑智能無(wú)損DCN
      我們知道大規模網(wǎng)絡(luò )中,當流量超過(guò)交換機的處理和緩存能力時(shí),傳統以太網(wǎng)基本的處理機制就是丟棄報文。無(wú)損網(wǎng)絡(luò )基本思路就是通過(guò)系列流量調度機制和措施,但其核心都在于控制發(fā)送端的發(fā)送速度,從而避免超過(guò)交換機處理能力的擁塞形成。
      如何根據交換機當前的擁塞情況控制源端的發(fā)送速度?當前業(yè)界基本的做法是在交換機端口設置隊列報文排隊,一旦超過(guò)某一個(gè)閾值(臨界水線(xiàn)),則意味著(zhù)即將發(fā)生擁塞,需要緊急向源端反送反壓降速信號,從而降低發(fā)送速度規避擁塞。可以看出閾值非常關(guān)鍵,它決定發(fā)送反壓信號的時(shí)機,成為網(wǎng)絡(luò )中是否會(huì )發(fā)生擁塞的決定性因素,如何設置閾值是無(wú)損網(wǎng)絡(luò )技術(shù)創(chuàng )新的焦點(diǎn)。
      AS-IS傳統以太網(wǎng):靜態(tài)設置,粗暴反壓
      最早的無(wú)損以太交換機的基本實(shí)現依賴(lài)網(wǎng)絡(luò )管理員靜態(tài)設置閾值,特別考驗管理員能力,一旦設置的太保守,可能降速太多,吞吐率很差;設置太激進(jìn)則無(wú)法起到無(wú)損的效果。為了調整好閾值往往需要有經(jīng)驗的工程師調測1~2天,而網(wǎng)絡(luò )無(wú)法根據流量的變化動(dòng)態(tài)調整參數,流量模型一旦發(fā)生變化則最優(yōu)參數失效,基本無(wú)法在大規模、多業(yè)務(wù)的AI數據中心中使用。
      TO-BE智能無(wú)損DCN:智能預測,精準控制
      網(wǎng)絡(luò )擁塞控制的未來(lái)在于智能化,智能預測流量的變化,并自動(dòng)設置相關(guān)的網(wǎng)絡(luò )參數,從而實(shí)現最佳網(wǎng)絡(luò )調度。2019年初,華為發(fā)布了業(yè)界首款面向AI時(shí)代的CloudEngine數據中心交換機,最大的創(chuàng )新點(diǎn)在于率先將AI芯片內嵌交換機中,基于神經(jīng)網(wǎng)絡(luò )首創(chuàng )的iLossless擁塞控制算法,完成網(wǎng)絡(luò )的自調參、自?xún)?yōu)化,從而克服了依賴(lài)人工參與配置參數,無(wú)法動(dòng)態(tài)適應網(wǎng)絡(luò )流量模型變化的關(guān)鍵問(wèn)題,真正實(shí)現網(wǎng)絡(luò )0丟包,構筑智能無(wú)損的數據中心網(wǎng)絡(luò )。
      智能無(wú)損DCN
      釋放AI算力巔峰
      基于CloudEngine交換機構筑的智能無(wú)損DCN,網(wǎng)絡(luò )性能已經(jīng)無(wú)限逼近了理論最優(yōu)值,可以確保在任意擁塞鏈路0丟包的基礎上接近100%吞吐,全面釋放AI算力潛能。根據權威第三方測試機構Tolly測試,在同樣GPU集群下,通過(guò)采用華為智能無(wú)損DCN,AI業(yè)務(wù)的訓練效率比采用當前業(yè)界其他網(wǎng)絡(luò )提升27%以上。
      華為智能無(wú)損DCN
      華為智能無(wú)損DCN,助力Atlas900沖擊全球算力巔峰。作為全球性能最快的AI訓練集群Atlas 900由數千顆昇騰910 AI處理器組成的上百臺服務(wù)器節點(diǎn)互聯(lián)構成。而其中互聯(lián)網(wǎng)絡(luò )采用由華為數據中心的CloudEngine系列交換機組成的智能無(wú)損DCN,單端口提供100Gbps的交換速率,將集群內的所有AI服務(wù)器接入高速交換網(wǎng)絡(luò )。
      0丟包的智能無(wú)損DCN使得數據中心網(wǎng)絡(luò )實(shí)現三網(wǎng)融合成為可能,目前華為智能無(wú)損數據中心網(wǎng)絡(luò )AI Fabric已經(jīng)在全球互聯(lián)網(wǎng)、金融、制造等行業(yè)數字化領(lǐng)導者客戶(hù)的47個(gè)數據中心商用部署,成為面向AI時(shí)代的最佳數據中心網(wǎng)絡(luò )解決方案。
      DCN 學(xué)院派
      網(wǎng)絡(luò )面臨的挑戰與云計算、人工智能等新技術(shù)的創(chuàng )新是相生相伴的。數據中心網(wǎng)絡(luò )(DCN)一直是網(wǎng)絡(luò )新技術(shù)的前沿陣地和實(shí)驗場(chǎng),最新的網(wǎng)絡(luò )架構、最優(yōu)的網(wǎng)絡(luò )協(xié)議和最硬核的黑科技都在這里誕生并走向成熟,輻射并帶動(dòng)產(chǎn)業(yè)的發(fā)展。
      DCN學(xué)院派將精選優(yōu)質(zhì)內容,分享數據中心網(wǎng)絡(luò )最新的前沿趨勢、產(chǎn)業(yè)觀(guān)點(diǎn)和技術(shù)創(chuàng )新。




     
    【免責聲明】本文僅代表作者本人觀(guān)點(diǎn),與CTI論壇無(wú)關(guān)。CTI論壇對文中陳述、觀(guān)點(diǎn)判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。

    專(zhuān)題

    CTI論壇會(huì )員企業(yè)

    亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 雅江县| 兴山县| 南宫市| 平江县| 华宁县| 平山县| 宣武区| 雅安市| 抚州市| 手游| 临漳县| 遵义市| 德惠市| 桃源县| 特克斯县| 南充市| 溧阳市| 元阳县| 蛟河市| 庐江县| 兴海县| 鲁山县| 乌恰县| 星子县| 揭东县| 铜梁县| 舟曲县| 尉氏县| 西华县| 盐边县| 泸州市| 阳朔县| 武义县| 中牟县| 乳山市| 乌拉特中旗| 两当县| 东乡族自治县| 和林格尔县| 闵行区| 温州市| http://444 http://444 http://444 http://444 http://444 http://444