近日,華為超融合數據中心網(wǎng)絡(luò )智能無(wú)損技術(shù)論文《ACC: Automatic ECN Tuning for High-Speed Datacenter Networks》(高性能數據中心網(wǎng)絡(luò )中的ECN動(dòng)態(tài)調優(yōu))入選ACM SIGCOMM 2021,表明超融合數據中心網(wǎng)絡(luò )的智能無(wú)損技術(shù)得到業(yè)內專(zhuān)家的一致認可,具有世界級技術(shù)影響力。
SIGCOMM是美國計算機協(xié)會(huì )在通信網(wǎng)絡(luò )領(lǐng)域的旗艦型會(huì )議,也是目前國際通信網(wǎng)絡(luò )領(lǐng)域的頂尖會(huì )議。SIGCOMM對論文的質(zhì)量和數量要求極高,質(zhì)量方面要求具有基礎性貢獻、領(lǐng)導性影響和堅實(shí)系統背景。SIGCOMM錄用的論文大多數會(huì )被廣泛引用,具有非常大的影響力。

全無(wú)損以太核心算法:獨創(chuàng )Automatic ECN
本次入選的ACC(Automatic ECN)技術(shù)是華為全無(wú)損以太網(wǎng)絡(luò )智能無(wú)損技術(shù)的代表。當今,隨著(zhù)AI和云業(yè)務(wù)發(fā)展,數據中心承載著(zhù)諸多需要高帶寬和低延遲的應用,包括大數據處理、分布式存儲和高性能計算。而在已經(jīng)廣泛部署的擁塞控制方案中,顯示擁塞通知(ECN: Explicit Congestion Notification)在保障網(wǎng)絡(luò )和業(yè)務(wù)高帶寬低時(shí)延中起到關(guān)鍵作用。但是傳統的靜態(tài)ECN參數配置,無(wú)法自適應數字時(shí)代種類(lèi)繁多的動(dòng)態(tài)業(yè)務(wù)流量模型。
例如,在不同廠(chǎng)商交換機、網(wǎng)卡等組成大型異構數據中心網(wǎng)絡(luò )中,協(xié)同聯(lián)調靜態(tài)ECN參數變得非常困難;尤其在云多租戶(hù)網(wǎng)絡(luò )中,存在不同時(shí)空流量模型,導致網(wǎng)絡(luò )工作負載動(dòng)態(tài)變化,需要不同時(shí)間點(diǎn)適配ECN參數,事先配置的ECN參數則無(wú)法滿(mǎn)足動(dòng)態(tài)業(yè)務(wù)流量的性能需求。因此,在大規模高速組網(wǎng)和多租戶(hù)業(yè)務(wù)流量等復雜場(chǎng)景下,人工調整全網(wǎng)適配ECN參數成為巨大挑戰。
基于此,華為聯(lián)合南京大學(xué)設計和實(shí)現ACC。ACC通過(guò)在超高速數據中心交換機中首次成功應用深度強化學(xué)習(DRL:Deep Reinforcement Learning)技術(shù),自適應流量模型來(lái)動(dòng)態(tài)調整ECN參數,從而簡(jiǎn)化網(wǎng)絡(luò )運營(yíng),實(shí)現網(wǎng)絡(luò )高利用率和低延遲。同時(shí), ACC設計分布式多智能體技術(shù)實(shí)現大規模組網(wǎng)下可擴展性、基于商用交換芯片Telemetry能力實(shí)現快速可部署性、結合在線(xiàn)和離線(xiàn)訓練方式提高場(chǎng)景的可泛化性,從而最終達到大規模高速網(wǎng)絡(luò )的高吞吐和低時(shí)延性能目標,并且從業(yè)務(wù)層面保障應用性能表現最優(yōu)。
華為超融合數據中心網(wǎng)絡(luò )CloudFabric 3.0,新以太釋放新算力
在A(yíng)CC理論研究基礎上,華為推出了超融合數據中心網(wǎng)絡(luò )CloudFabric 3.0解決方案,保障網(wǎng)絡(luò )高吞吐低時(shí)延,100%釋放算力。
在A(yíng)CC理論研究基礎上,華為推出了超融合數據中心網(wǎng)絡(luò )CloudFabric 3.0解決方案,保障網(wǎng)絡(luò )高吞吐低時(shí)延,100%釋放算力。

華為超融合數據中心網(wǎng)絡(luò )CloudFabric 3.0解決方案基于全以太架構構建0丟包的計算和存儲網(wǎng)絡(luò ),助力算力100%釋放。該方案打破通用計算、存儲、高性能計算三套網(wǎng)絡(luò )架構的限制,統一使用以太網(wǎng)架構實(shí)現流量承載融合。該方案在業(yè)界率先實(shí)現L3自動(dòng)駕駛網(wǎng)絡(luò )能力、全生命周期自動(dòng)化與全網(wǎng)智能運維,OPEX降低30%,使能企業(yè)智能化升級。
華為數據中心網(wǎng)絡(luò )已經(jīng)在全球包括金融、政府、互聯(lián)網(wǎng)、制造、能源等各大行業(yè)客戶(hù)的數據中心部署。華為將持續投入智能無(wú)損技術(shù)研究,持續提升網(wǎng)絡(luò )能力,充分釋放算力,使能企業(yè)智能化升級。
查看論文:https://dl.acm.org/doi/10.1145/3452296.3472927