在過(guò)去的十年中,數據中心業(yè)務(wù)已從以WEB服務(wù)為中心走向以云服務(wù)為中心,今天,數據中心正從云計算時(shí)代走向智能時(shí)代。數字化過(guò)程中不斷產(chǎn)生的海量數據,如何完成海量數據的篩選和有用信息的自動(dòng)重組,通過(guò)AI從海量數據中挖掘智慧成為智能時(shí)代不變的主題,云智能時(shí)代已經(jīng)到來(lái)。華為GIV(Global Industry Vision)預測,到2025年,97%的大企業(yè)將采用AI,人機協(xié)創(chuàng )無(wú)所不在, AI成為企業(yè)數字化轉型的下一站,利用AI助力決策、重塑商業(yè)模式與生態(tài)系統、重建客戶(hù)體驗的能力將是數字化轉型計劃取得成功的關(guān)鍵推動(dòng)力。

數字化過(guò)程中將產(chǎn)生大量的數據,華為GIV預測,2025年全球存儲數據量將高達180ZB,其中非結構化數據(比如原始采集的語(yǔ)音、視頻、圖片等未加工數據)比例持續提高,未來(lái)將達到95%以上,基于人工處理的大數據分析處理方法無(wú)法應對如此的海量數據,而基于機器運算進(jìn)行深度學(xué)習的AI算法,可以完成海量無(wú)效數據的篩選和有用信息的自動(dòng)重組,從而提供更加高效的決策建議和更加智慧化的行為指引。云和智能時(shí)代企業(yè)DC的使命正在從聚焦業(yè)務(wù)快速發(fā)放向聚焦數據高效處理進(jìn)行轉變。

伴隨著(zhù)AI的熱潮 ,深度學(xué)習服務(wù)器集群涌現,以及各種SSD等高性能新型存儲介質(zhì)的發(fā)展,對通信時(shí)延提出了更高的要求(us級)。例如金融領(lǐng)域高頻交易(HFT)的性能敏感型環(huán)境中,低時(shí)延是處理巨大交易容量的關(guān)鍵。NASDAQ一筆訂單的最快成交速度是100微秒左右,通信時(shí)延成為數據中心網(wǎng)絡(luò )建設需要考慮的首要因素,需要從兩個(gè)方面降低時(shí)延:
- 服務(wù)器內部通信協(xié)議棧變革首當其沖。在A(yíng)I數據運算和SSD分布式存儲系統中,傳統的TCP/IP協(xié)議棧處理所需的數十微秒固定時(shí)延成為明顯的瓶頸,RDMA替代TCP/IP成為大勢所趨。采用RDMA可以將計算的效率同比提升6~8倍,而服務(wù)器內1us的傳輸時(shí)延也使得SSD分布式存儲的時(shí)延從ms級降低到us級成為可能,所以在最新的NVMe接口協(xié)議中,RDMA成為主流的默認網(wǎng)絡(luò )通信協(xié)議棧。
- 為減少光纖傳輸時(shí)延,需要考慮針對時(shí)延敏感應用的物理位置就近設立數據中心,分布式數據中心成為新的趨勢。如何快速而有節奏地提升DCN/DCI帶寬,并在帶寬提升的同時(shí)保證無(wú)損網(wǎng)絡(luò )的“0丟包、低時(shí)延、高吞吐”要求,以匹配業(yè)務(wù)快速發(fā)展的訴求,成為數據中心DCN/DCI方案首先要面對的問(wèn)題。摩爾定律支撐了數據中心帶寬的增長(cháng),數據中心內部互聯(lián)DCN接口即將進(jìn)入單端口100G+時(shí)代,而作為DC互聯(lián)及DCN出口承載的DCI網(wǎng)絡(luò )也已發(fā)展到10T級的波分互聯(lián)。
劃重點(diǎn)
- 面向AI的數據運算要求“0丟包、低時(shí)延、高吞吐”的無(wú)損網(wǎng)絡(luò ),需要從服務(wù)器內部通信協(xié)議變革及數據中心互聯(lián)兩方面同時(shí)考慮。
- 數據中心互聯(lián)快速部署、智能簡(jiǎn)化運維成為趨勢,以支撐彈性數據中心網(wǎng)絡(luò )運營(yíng)與擴展。
- AI、HPC等高性能業(yè)務(wù)對網(wǎng)絡(luò )的依賴(lài)度逐漸增強,無(wú)損網(wǎng)絡(luò )的擁塞控制算法需要網(wǎng)卡和網(wǎng)絡(luò )進(jìn)行協(xié)作,網(wǎng)絡(luò )從設計開(kāi)始就需要考慮到后期運維時(shí)如何能夠快速、精準地掌握全網(wǎng)設備、鏈路的實(shí)時(shí)狀態(tài),用于支撐業(yè)務(wù)的平穩運行與擴展。多波長(cháng)復用的光纖傳輸系統廣泛應用于DCI,而光模擬信號的業(yè)務(wù)發(fā)放及維護模式不同于普通的數字網(wǎng)絡(luò ),運營(yíng)商往往配有較為龐大的光網(wǎng)絡(luò )專(zhuān)業(yè)維護團隊,而ISP及金融行業(yè)數據中心網(wǎng)絡(luò )均由IT人員建設和維護,人員與經(jīng)驗相對電信運營(yíng)商有較大差距,快速開(kāi)通業(yè)務(wù)、快速精準排障成為關(guān)鍵挑戰。隨著(zhù)數據中心建設規模的海量增長(cháng),數據中心互聯(lián)需求倍增,這一挑戰已成為數據中心發(fā)展的關(guān)鍵瓶頸之一。
云業(yè)務(wù)快速發(fā)展和上線(xiàn),網(wǎng)絡(luò )頻繁改造擴容,傳統波分的安裝、連纖、配置、調測等需要專(zhuān)業(yè)的規劃與配置,自動(dòng)規劃與配置工具可以讓運維人員從繁瑣專(zhuān)業(yè)的開(kāi)局中解放,自動(dòng)高效不出錯,支撐業(yè)務(wù)云化快速上線(xiàn),和頻繁擴容。相對人工配置,自動(dòng)工具除了大幅提升上線(xiàn)效率,還大幅提高配置準確率。例如傳統人工連纖出錯概率高,據統計甚至高達5%,如果一不小心連錯,業(yè)務(wù)不通從上至下排查原因,重新檢查校驗就更加耗時(shí)費力。
2、智能運維系統取代傳統網(wǎng)絡(luò )管理系統,實(shí)現數據中心主動(dòng)運維
越來(lái)越多的應用運行在云上,數據中心做為數字化的基礎架構重要性不言而喻,而DCI作為支撐性的基礎,一旦故障影響嚴重。DCI引入高效智能運維,實(shí)現從人工到自動(dòng),從被動(dòng)到主動(dòng)的運維轉變是必然的選擇。相對傳統的網(wǎng)絡(luò )監控系統 ,智能運維系統通過(guò)內置光Sensor,實(shí)現光纖網(wǎng)與光系統網(wǎng)絡(luò )全局可視,光網(wǎng)絡(luò )健康度特別是光功率衰減、光波長(cháng)漂移等物理參數的變化提前預警,自動(dòng)分析過(guò)濾告警,基于經(jīng)驗庫自動(dòng)判斷故障根因,以減少網(wǎng)絡(luò )故障率,大幅提升網(wǎng)絡(luò )可用率。
劃重點(diǎn)
數據中心網(wǎng)絡(luò )運維亟須引入自動(dòng)化配置與維護工具,以實(shí)時(shí)調整配置,快速定位故障,實(shí)現無(wú)損網(wǎng)絡(luò )運維智簡(jiǎn)化,以支持云智能時(shí)代的數據中心業(yè)務(wù)快速發(fā)展。
2019年9月18日~20日,2019華為全聯(lián)接大會(huì )將在上海舉行。誠邀各位蒞臨上海世博展覽館Hall2 #406~407,了解更多關(guān)于數據中心網(wǎng)絡(luò )互聯(lián)最前沿的方案和技術(shù)!