利用主動(dòng)/被動(dòng)保障改進(jìn)故障隔離
當網(wǎng)絡(luò )中的某個(gè)地方出問(wèn)題時(shí),我們通常稱(chēng)之為“事件”或“缺陷”,這聽(tīng)起來(lái)似乎沒(méi)什么危害,畢竟只是發(fā)生了一些“事件”而已,沒(méi)什么大不了的,不是嗎?但出于某種原因,客戶(hù)并不會(huì )如此看待問(wèn)題。服務(wù)遭受的一次小干擾或不怎么好的體驗都可能讓客戶(hù)存疑。隨著(zhù)5G帶來(lái)爆炸性的需求、更高的客戶(hù)期待以及更甚于從前的復雜性,挑戰只會(huì )變得越來(lái)越嚴峻。那么,您又如何確保自己能夠準確捕捉性能問(wèn)題,并在問(wèn)題升級成危機之前排除缺陷隱患呢?
希望您通過(guò)我們的“5G變革需要自動(dòng)化保障”系列連載與我們共同踏上探索的旅程,并共同理解5G所帶來(lái)的挑戰以及一些有效的全新測試方法,如:自動(dòng)化保障、5G網(wǎng)絡(luò )切片的質(zhì)量監控,以及自動(dòng)化變化管理等。現在,我們將了解一下可以幫助運營(yíng)商探測和隔離自動(dòng)化網(wǎng)絡(luò )中各類(lèi)缺陷的多種方法。
自動(dòng)化保障的兩種模式
在之前的文章中,我們已經(jīng)介紹了自動(dòng)化保障,此篇會(huì )講解另外層面的細節。自動(dòng)化保障包含兩個(gè)主要的虛擬化保障功能類(lèi)別:主動(dòng)保障和被動(dòng)保障。從設計上來(lái)說(shuō),兩個(gè)類(lèi)別的虛擬化功能都能與網(wǎng)絡(luò )無(wú)縫集成(即編排),實(shí)現缺陷探測和解決過(guò)程的自動(dòng)化。先來(lái)了解每種方法的優(yōu)點(diǎn)和弱點(diǎn),以及為什么兩種方法對于5G都具有至關(guān)重要的意義。

被動(dòng)保障
是確認網(wǎng)絡(luò )健康情況的傳統方法。虛擬和物理網(wǎng)絡(luò )功能、DPI(深層包檢測)探測器和協(xié)議探測器可以被動(dòng)監控網(wǎng)絡(luò )中的信令和用戶(hù)流量,而被動(dòng)保障正是通過(guò)它們來(lái)采集遙測數據。我們還可以從其它的用戶(hù)數據源采集數據,例如向運營(yíng)商通報用戶(hù)狀態(tài)及使用網(wǎng)絡(luò )情況的記賬記錄等。
優(yōu)點(diǎn):被動(dòng)保障會(huì )從所有使用服務(wù)的運營(yíng)商客戶(hù)那里采集數據。這種方法尤其適用于確定有多少客戶(hù)受到了問(wèn)題的影響。由于此方法要處理海量的數據,因此最適合探測關(guān)聯(lián)統計數據所指示的問(wèn)題,這些數據來(lái)自多種數據源,如信令流量、用戶(hù)層分組報頭和網(wǎng)絡(luò )組件計數器等。當某項新功能、切片或服務(wù)已經(jīng)啟動(dòng),而流量水平仍保持最低水平時(shí),被動(dòng)保障最能發(fā)揮自身的效力。
局限性:被動(dòng)保障能夠為探測重大問(wèn)題提供有價(jià)值的深入認知。但網(wǎng)絡(luò )的真實(shí)使用情況千差萬(wàn)別,網(wǎng)絡(luò )或服務(wù)性能中的微小變化都可能源于出現差異的流量水平、地理流量分布中的變化,或是所用應用組合的差別。這些微小的性能變化也可能源于一些其它的網(wǎng)絡(luò )缺陷,而這些缺陷在被動(dòng)保障所依賴(lài)的關(guān)聯(lián)高級別數據中并未顯現出來(lái),直到升級為嚴重問(wèn)題時(shí)才可能為人所知。
由于被動(dòng)保障的安裝和分析過(guò)程都非常昂貴,運營(yíng)商需要權衡將監控功能布置在何處,通常是將探測器部署在網(wǎng)絡(luò )的關(guān)鍵組成部分中。如果想在任何時(shí)間對所有的流量、網(wǎng)絡(luò )中的所有部署進(jìn)行監控,則不符合成本效益原則。因此,當問(wèn)題在某個(gè)特定的時(shí)間發(fā)生時(shí),運營(yíng)商可能并沒(méi)有將問(wèn)題的所在點(diǎn)涵蓋在內。
要想準確地體會(huì )真實(shí)的用戶(hù)體驗,僅依靠信令和統計數據并非完全不可能,但卻非常困難。例如,如果只收集網(wǎng)絡(luò )核心數據,無(wú)法準確理解客戶(hù)在遙遠端點(diǎn)處的真實(shí)體驗。
更重要的是,被動(dòng)保障依靠的是網(wǎng)絡(luò )和服務(wù)使用時(shí)生成的數據。正如其名,它是“被動(dòng)”的,只會(huì )等到客戶(hù)使用網(wǎng)絡(luò )時(shí)才能發(fā)揮作用,在用戶(hù)創(chuàng )建流量前的啟動(dòng)階段,或對于那些關(guān)鍵且始終在線(xiàn)但大多處于非活動(dòng)狀態(tài)的服務(wù)(如物聯(lián)網(wǎng)警報和公共安全網(wǎng)絡(luò )),此方法并不是很有幫助。
主動(dòng)保障
是被動(dòng)保障的一種完美補充。主動(dòng)保障也被稱(chēng)為主動(dòng)測試,它包含一個(gè)主動(dòng)保障控制器和一些虛擬測試代理(VTA)。在控制器的指導下,這些VTA可以仿真出網(wǎng)絡(luò )的某些部分、終端用戶(hù)設備和具體應用的使用情況,創(chuàng )建出少量合成流量并將其注入網(wǎng)絡(luò )中。這些合成流量使主動(dòng)保障系統能夠在網(wǎng)絡(luò )中不存在實(shí)際用戶(hù)流量的情況下對網(wǎng)絡(luò )的性能進(jìn)行評估。因此,當您首次啟動(dòng)某項功能,希望確保公共安全網(wǎng)絡(luò )的正確運行,或者需要隔離某項復雜的問(wèn)題時(shí),主動(dòng)保障便是最理解的選擇。

在使用主動(dòng)保障時(shí),可以向網(wǎng)絡(luò )中嵌入已知數量的合成流量,可以容易地測量端點(diǎn)輸出的流量。還記得嗎?我們已經(jīng)知道用戶(hù)流量變化多端的特性會(huì )導致不確定性,其中的微小性能波動(dòng)既可能是正常現象,也可能是真實(shí)問(wèn)題的前兆。通過(guò)向網(wǎng)絡(luò )中嵌入已知流量,主動(dòng)保障便可以幫助執行基準測試,并在一定的時(shí)間里對性能的精細變化加以跟蹤,將正常的變化與重大問(wèn)題區分開(kāi)。
此外,我們可以將VTA實(shí)例化到網(wǎng)絡(luò )中的某個(gè)特定部分中運行測試,然后取消該代理的實(shí)例。整個(gè)過(guò)程都非常簡(jiǎn)單且成本效益極高。VTA可以嵌入網(wǎng)絡(luò )中的任意位置,可以在不同的位置執行類(lèi)似的測試。通過(guò)VTA的連續運行,確保關(guān)鍵鏈路和服務(wù)的可用性和性能水平。
由于使用的是已知合成流量,主動(dòng)保障不僅可以幫助運營(yíng)商查找復雜的問(wèn)題,還可以提供用戶(hù)層性能的完整可視性,以及客戶(hù)真實(shí)的端對端服務(wù)體驗,而這在被動(dòng)保障中都是無(wú)法想象的。
- 在網(wǎng)絡(luò )搭建完成并開(kāi)始運行時(shí)對性能進(jìn)行監控
- 跟蹤包含連貫流量流的服務(wù)和鏈路
- 探測重大問(wèn)題并確定有多少用戶(hù)受到了影響
- 查找網(wǎng)絡(luò )中高優(yōu)先級部分的問(wèn)題
主動(dòng)保障為被動(dòng)保障提供補充:
- 在客戶(hù)使用開(kāi)始之前對啟動(dòng)后的性能加以評估
- 連續檢查關(guān)鍵服務(wù)和鏈路,如:物聯(lián)網(wǎng)警報傳感器、冗余網(wǎng)絡(luò )鏈路或公共安全網(wǎng)絡(luò ),無(wú)需考慮使用水平如何
- 以前瞻方式查明微小問(wèn)題,防止升級為重大問(wèn)題
- 獲得用戶(hù)端對端性能和服務(wù)體驗的完整可視性
- 在網(wǎng)絡(luò )中任意部分查找復雜的問(wèn)題,采用虛擬化方式并注入流量
- 性能挑戰不斷增長(cháng),測試工具持續更新
的確,網(wǎng)絡(luò )自動(dòng)化、5G,以及饑渴的消費者使用的高帶寬占用的數據密集型應用都使數據需求如滾雪球般地增長(cháng),對業(yè)界帶來(lái)了前所未有的挑戰。通過(guò)深思熟慮的組合方式使用被動(dòng)保障和主動(dòng)保障,運營(yíng)商可以確保自己滿(mǎn)足客戶(hù)的需求,并且兌現高質(zhì)量體驗的承諾。