但隨著(zhù)越來(lái)越多的應用集中部署在總行云計算環(huán)境中,比如新郵件、公文、網(wǎng)絡(luò )學(xué)院等,一級分行訪(fǎng)問(wèn)這些系統時(shí)會(huì )大量占用一級骨干網(wǎng)的帶寬,每家分行僅通過(guò)雙線(xiàn)上聯(lián)總行,無(wú)論是帶寬容量還是線(xiàn)路冗余度都面臨嚴峻的挑戰,因此農行啟動(dòng)了一級骨干網(wǎng)“二變三”的架構優(yōu)化工程,引入第三家運營(yíng)商和線(xiàn)路,充分利用骨干網(wǎng)SRv6 Policy的智能調度能力,將業(yè)務(wù)流量均衡分布在三條線(xiàn)路上,并大幅提升了一級骨干網(wǎng)的災備能力。
總體拓撲
農行骨干網(wǎng)分為“核心”和“一級”兩層,核心骨干網(wǎng)由ABC三個(gè)總行節點(diǎn)組成,一級骨干網(wǎng)由數十個(gè)與一級分行對應的節點(diǎn)組成,隨著(zhù)“二變三”項目的順利收官,實(shí)現了每個(gè)一級節點(diǎn)“三線(xiàn)三運營(yíng)商”上聯(lián)三核心節點(diǎn)的高度冗余架構,總體拓撲如圖1所示。

圖1 總體拓撲圖
由于三條線(xiàn)分屬于三家運營(yíng)商,并連接不同的核心節點(diǎn),因此能自如應對線(xiàn)路級、運營(yíng)商級、園區級的各種災難,確保分行用戶(hù)的業(yè)務(wù)訪(fǎng)問(wèn)連續性。
架構升級
骨干網(wǎng)全面部署SRv6 Policy以后,形成了Underlay+Overlay的兩層網(wǎng)絡(luò )架構,Underlay對應物理組網(wǎng)結構,由節點(diǎn)和鏈路組成,Overlay對應邏輯組網(wǎng)結構,由SRv6 Policy隧道和VPN組成,上下兩層是完全解耦的,中間通過(guò)基于意圖Color的自動(dòng)引流技術(shù)將業(yè)務(wù)流量映射到合適的SRv6 Policy上,并由Underlay網(wǎng)絡(luò )根據SRv6 Policy攜帶的路徑信息逐跳轉發(fā),如圖2所示。

圖2 網(wǎng)絡(luò )架構示意圖
一級骨干網(wǎng)“二變三”優(yōu)化主要涉及Underlay層面,基本上不影響SRv6 Policy策略,更無(wú)關(guān)VPN,但還是要考慮SRv6 Policy與底層鏈路的映射關(guān)系,也就是鏈路的管理組參數設置,具體如圖3所示。

圖3 鏈路管理組示意圖
分行至核心節點(diǎn)A和節點(diǎn)B鏈路的管理組分別為X、Y,為了保護分行至核心節點(diǎn)B的關(guān)鍵生產(chǎn)業(yè)務(wù)帶寬,分行至核心節點(diǎn)A的SRv6 Policy的親和屬性設置為排除管理組=Y的鏈路,避免流量調度到核心節點(diǎn)B的線(xiàn)路上,但故障逃生場(chǎng)景例外。同時(shí)通過(guò)鏈路管理組染色,還可以將總行間SRv6 Policy流量限制在核心骨干網(wǎng)內,否則會(huì )嚴重影響一級分行線(xiàn)路安全。增加分行至核心節點(diǎn)C的線(xiàn)路后,新鏈路的管理組設置為X,這樣分行至核心節點(diǎn)A、B的流量都有機會(huì )調度到該鏈路上,可以明顯緩解核心節點(diǎn)A線(xiàn)路的流量壓力。
調優(yōu)策略
一級骨干網(wǎng)升級為三線(xiàn)結構后,正常情況下分行至三個(gè)核心的SRv6 Policy都優(yōu)選最短路徑,也就是直連的廣域網(wǎng)線(xiàn)路,下面分閾值調優(yōu)和故障調優(yōu)兩個(gè)場(chǎng)景介紹一級骨干網(wǎng)的調優(yōu)策略。
閾值調優(yōu),假設分行至核心節點(diǎn)A的鏈路利用率超閾值,便會(huì )觸發(fā)控制器的定期全局調優(yōu)計算,以降低利用率至閾值范圍內為目標,結合帶寬和親和屬性等約束條件,計算結果為分裂出經(jīng)過(guò)核心節點(diǎn)C的分段列表,業(yè)務(wù)流量以UCMP非等價(jià)負載均衡方式哈希到兩條轉發(fā)路徑上,控制器還會(huì )定期檢查原鏈路是否具備路徑回收的條件,防止業(yè)務(wù)流量長(cháng)時(shí)間迂回,具體如圖4所示。

閾值調優(yōu)示意圖
故障調優(yōu),假設分行至核心節點(diǎn)A的線(xiàn)路中斷,首先會(huì )觸發(fā)路由器本地的TI-LFA拓撲無(wú)關(guān)快速重路由,將分行至核心節點(diǎn)A的SRv6 Policy報文切換至核心節點(diǎn)C轉發(fā),然后路由器的SRv6 Policy頭端檢測功能生效,將分行至核心節點(diǎn)A的業(yè)務(wù)流量切換至SRv6 BE轉發(fā),最后控制器通過(guò)BGP-LS獲悉鏈路故障,進(jìn)行故障調優(yōu)計算,將路徑更新為分行-核心節點(diǎn)C-核心節點(diǎn)A,整個(gè)過(guò)程不超過(guò)3秒鐘,業(yè)務(wù)基本無(wú)感知,故障恢復后過(guò)程同全局調優(yōu),具體如圖5所示。

故障調優(yōu)示意圖
總結展望
一級骨干網(wǎng)架構優(yōu)化后,兼顧多線(xiàn)冗余和流量調度,最大程度發(fā)揮了骨干網(wǎng)IPv6+1.0技術(shù)底座的價(jià)值,并初步嘗試了華為iFit隨流檢測技術(shù),體驗了IPv6+2.0技術(shù)的魅力。未來(lái)的網(wǎng)絡(luò )規劃建設過(guò)程中,還要進(jìn)一步研究利用網(wǎng)絡(luò )切片、iFit等更高階的IPv6+技術(shù),打造集智能調度、流量可視、輔助決策于一體的全功能IPv6+骨干承載網(wǎng),為全行業(yè)務(wù)提供統一融合、靈活安全、智能穩固的網(wǎng)絡(luò )平臺。
文 / 中國農業(yè)銀行數據中心專(zhuān)家 許青邦
中國農業(yè)銀行數據中心資深專(zhuān)員 馬超