• <strike id="fdgpu"><input id="fdgpu"></input></strike>
    <label id="fdgpu"></label>
    <s id="fdgpu"><code id="fdgpu"></code></s>

  • <label id="fdgpu"></label>
  • <span id="fdgpu"><u id="fdgpu"></u></span>

    <s id="fdgpu"><sub id="fdgpu"></sub></s>
     首頁 > 新聞 > 專家觀點(diǎn) >

    故障域隔離方法有效避免網(wǎng)絡(luò)事故的“互相推諉”

    2015-04-10 16:24:11   作者:Emulex公司Endace業(yè)務(wù)全球培訓(xùn)總監(jiān) Jeff Brown   來源:CTI論壇   評論:0  點(diǎn)擊:


      當(dāng)網(wǎng)絡(luò)問題并不復(fù)雜,并且當(dāng)大家都來自同一個組織的時候,專家團(tuán)隊(duì)方法能夠有效地對事故作出響應(yīng)。但近年來,隨著基礎(chǔ)架構(gòu)云端化,相關(guān)利益主體分布在不同的部門、公司和地理區(qū)域,針對網(wǎng)絡(luò)事故和業(yè)務(wù)應(yīng)用性能問題的根本原因分析(RCA)變得越發(fā)困難。

      為滿足服務(wù)水平協(xié)議(SLA)要求并防止客戶流失,快速查明根本原因已成為許多企業(yè)的首要任務(wù)。但是,據(jù)《Emulex可視性調(diào)查》表明,79%的企業(yè)曾經(jīng)將事故發(fā)生的原因錯誤地歸咎于某個IT部門,這不僅增添了混亂程度,還推遲了解決問題的時間。

      針對以上問題,本文將介紹一個由數(shù)據(jù)包分析驅(qū)動的故障域隔離(FDI)方法,幫助企業(yè)進(jìn)行故障檢修并解決網(wǎng)絡(luò)和應(yīng)用性能問題。

      外包成為主流

      即使整個基礎(chǔ)架構(gòu)由一家企業(yè)所有,要充分了解整個基礎(chǔ)架構(gòu)的實(shí)際狀態(tài)也會非常困難。更何況,當(dāng)外包業(yè)務(wù)迅速擴(kuò)張時,端到端業(yè)務(wù)應(yīng)用就會逐漸出現(xiàn)許多盲點(diǎn)。如果整個技術(shù)層都被外包出去,就會出現(xiàn)一個巨大的盲點(diǎn),導(dǎo)致您無法在該技術(shù)域內(nèi)進(jìn)行RCA。為了順應(yīng)技術(shù)外包的趨勢,企業(yè)必須清楚地區(qū)別事故響應(yīng)工作流程中FDI階段與RCA階段的目的和要求。

      什么是FDI?

      FDI的理念很簡單,任何看過病的人都不難理解,它跟醫(yī)療保健領(lǐng)域的“事故調(diào)查”流程在本質(zhì)上相似。首先,一名全科醫(yī)生會進(jìn)行初步評估、安排診斷測試并評估結(jié)果。然后,患者將接受專科醫(yī)生的檢查,而且只有在證據(jù)充分、可以確定病情時才會進(jìn)行其他診斷和治療。診斷過程以事實(shí)而不是以猜測作為依據(jù)。

      部署FDI的企業(yè)希望最大限度地減少參與每次事故調(diào)查的技術(shù)專家的人數(shù)和類型,這就是FDI需要在RCA之前進(jìn)行的原因。這樣做的目的是為了在開始深入分析根本原因之前找到一個可疑的技術(shù)層。為什么要按技術(shù)進(jìn)行隔離呢?一是因?yàn)镮T部門和外包業(yè)務(wù)通常是按技術(shù)劃分的,二是因?yàn)檫@樣有助于快速減少參與人員的數(shù)量。由于只會牽涉到一個故障域,技術(shù)隔離可以避免整個部門及外部企業(yè)由于接受調(diào)查而導(dǎo)致業(yè)務(wù)停頓。這就好比您不會讓一名神經(jīng)外科醫(yī)生來檢查腳趾骨折一樣。

      FDI的一個主要目的是防止調(diào)查過程中“相互推諉”的現(xiàn)象。要使FDI更為有效,必須提供確鑿的證據(jù),證實(shí)某個“可疑”子系統(tǒng)或技術(shù)層是導(dǎo)致問題的根本原因。同時,還需要確認(rèn)任何其他子系統(tǒng)或技術(shù)層不可能是問題的根源所在。當(dāng)故障域位于外包技術(shù)中時,這一點(diǎn)尤為重要。

      在將問題移交給負(fù)責(zé)的團(tuán)隊(duì)或服務(wù)提供商處理的時候,有效的FDI還有助于提供與特定技術(shù)相關(guān)、可付諸行動的數(shù)據(jù),這將為技術(shù)團(tuán)隊(duì)提供相關(guān)情景、癥狀和信息,以便他們立即針對其所負(fù)責(zé)的系統(tǒng)進(jìn)行深入的根本原因分析。

      圖1:事故響應(yīng)流程

      只需要一組事實(shí)

      為保證其效率及有效性,F(xiàn)DI需要根據(jù)在技術(shù)層之間交換的實(shí)際數(shù)據(jù)包進(jìn)行分析。數(shù)據(jù)包不會“撒謊”,它們也不會掩蓋平均值或統(tǒng)計數(shù)據(jù)中的關(guān)鍵細(xì)節(jié)。以基本數(shù)據(jù)包作為證據(jù)可以確保FDI流程找到對于事故具有不可推卸責(zé)任的故障技術(shù)層。

      “首要FDI”指的是將事故交予特定技術(shù)團(tuán)隊(duì)或外包服務(wù)提供商。它的目標(biāo)相對簡單,即在少數(shù)部門、團(tuán)隊(duì)以及外包服務(wù)商中分配事故,因而是一種極為經(jīng)濟(jì)的實(shí)施方法。在實(shí)際操作中,它涉及的技術(shù)層、網(wǎng)絡(luò)中的分路點(diǎn)以及在每個技術(shù)層之間進(jìn)行監(jiān)控的網(wǎng)絡(luò)記錄器均相對較少。

      什么原因?qū)е铝搜舆t?

      當(dāng)人們認(rèn)真地進(jìn)行RCA并且有自信確定問題所在的時候,人們就可以降低成本并縮短解決問題的時間。當(dāng)負(fù)責(zé)處理問題的人員擁有正確評估原因及解決問題的專業(yè)技能時,RCA就能達(dá)到最佳效果。

      在前文,我們提到以數(shù)據(jù)包為導(dǎo)向的FDI流程能夠有效加快事故調(diào)查并減少參與人員數(shù)量。此外,F(xiàn)DI不需要很多分路器和設(shè)備即可對主要技術(shù)層進(jìn)行隔離,從而實(shí)現(xiàn)其首要目標(biāo)--僅指派相關(guān)的人員參與事故調(diào)查。那么,為什么很多重大事故調(diào)查仍然需要召開專家小組會議呢?

      問題在于,有的人認(rèn)為,僅僅依靠若干分路器和網(wǎng)絡(luò)記錄器不足以完全解決復(fù)雜的事故。您知道嗎?他們的看法是正確的。但是,這并不是事故調(diào)查流程FDI階段的目標(biāo),該階段的目標(biāo)是隔離故障。通過基本數(shù)據(jù)包以及數(shù)據(jù)包分析的流程,您可以簡單有效地實(shí)現(xiàn)這一目標(biāo)。

      分而治之

      首要/一級FDI流程會將事故隔離到由企業(yè)內(nèi)部結(jié)構(gòu)和外包安排所定義的單一技術(shù)層。要達(dá)到首要FDI的最佳效果,我們需要:1) 使用網(wǎng)絡(luò)記錄工具監(jiān)控和儲存技術(shù)層之間產(chǎn)生的網(wǎng)絡(luò)流量;2) 通過應(yīng)用事務(wù)分析(Application Transaction Analysis)來進(jìn)行故障隔離。數(shù)據(jù)包存儲對于高效的FDI所依賴的回顧性分析(Back-in-time Analysis)至關(guān)重要。

      您可能已經(jīng)猜到,F(xiàn)DI是一個可以分層部署的“分治”流程。您還可以在每個技術(shù)層次中進(jìn)行FDI,從而進(jìn)一步隔離問題,直到高效完成RCA。這個過程可以稱為“層內(nèi)FDI”或“輔助FDI”。

      輔助FDI工作流程尤其適用于網(wǎng)絡(luò)事故調(diào)查。同理,為達(dá)到FDI的最佳效果,我們需要監(jiān)控并儲存關(guān)鍵網(wǎng)絡(luò)組件之間的實(shí)際數(shù)據(jù)包流,從而進(jìn)行有效的回顧性分析。

      如果以網(wǎng)絡(luò)內(nèi)FDI作為目標(biāo),則需要了解應(yīng)在哪些位置部署網(wǎng)絡(luò)分路器和網(wǎng)絡(luò)記錄工具。首要FDI與網(wǎng)絡(luò)內(nèi)FDI之間的主要區(qū)別在于觀察點(diǎn)的位置更多與物理位置、技術(shù)、員工專業(yè)技能以及外包程度和外部提供商有關(guān),與組織問題關(guān)系不大。但是,F(xiàn)DI流程較為類似:執(zhí)行基于數(shù)據(jù)包的分析以提供確鑿證據(jù),從而確定哪些技術(shù)或服務(wù)提供商存在問題、哪些不存在問題。

      始終運(yùn)行還是始終可用?

      我們不希望等到發(fā)生重大事故時才開始部署執(zhí)行FDI所需的分路器和監(jiān)控工具,這將與FDI的初衷背道而馳。因此,我們應(yīng)部署并始終運(yùn)行執(zhí)行主要/一級FDI所需的分路器和網(wǎng)絡(luò)記錄工具。

      但是,如何執(zhí)行輔助/技術(shù)內(nèi)FDI呢?如何處理遠(yuǎn)程站點(diǎn)、地區(qū)性數(shù)據(jù)中心和非關(guān)鍵性應(yīng)用呢?您不可能四處進(jìn)行分路,也無法儲存一切內(nèi)容。

      幸運(yùn)的是,人們開發(fā)了許多網(wǎng)絡(luò)記錄工具,以滿足主要技術(shù)層之間的“始終運(yùn)行”記錄需求,以及通過網(wǎng)絡(luò)數(shù)據(jù)包代理連接到眾多二級分路點(diǎn)的“始終可用”記錄需求。始終可用的設(shè)備不一定能夠保證長期的回顧可視性,但您可以在需要時快速配置這些設(shè)備,根據(jù)當(dāng)前事故調(diào)查的特定可視性需求進(jìn)行監(jiān)控。

      如此簡單?

      那么,F(xiàn)DI真的像我們所說的那么簡單嗎?我們需要辯證地回答這個問題。很顯然,在現(xiàn)代企業(yè)聯(lián)網(wǎng)業(yè)務(wù)應(yīng)用基礎(chǔ)架構(gòu)這樣復(fù)雜的動態(tài)系統(tǒng)中,可能會出現(xiàn)各種反常、復(fù)雜甚至是匪夷所思的問題。您始終需要對這些類型的問題進(jìn)行深入調(diào)查,并利用專家的技能和知識來加以解決。但這并不能說明FDI與有效解決這些負(fù)載問題無關(guān)。事實(shí)上,這些問題使一個嚴(yán)格、可重復(fù)、由數(shù)據(jù)驅(qū)動的FDI流程更為重要了。要解決復(fù)雜問題,為什么不采用FDI這種久經(jīng)考驗(yàn)的“分治”方法呢?

      關(guān)于Emulex

      Emulex為高性能網(wǎng)絡(luò)提供連接、監(jiān)控和管理解決方案,為下一代軟件定義、電信公司和Web-scale數(shù)據(jù)中心交付預(yù)配置(provisioning)、端到端應(yīng)用可視性、優(yōu)化和加速功能。公司的I/O連接產(chǎn)品系列被廣泛用于全球主要OEM和ODM的服務(wù)器及存儲解決方案中,可幫助企業(yè)有效管理帶寬、延遲、安全性和虛擬化。Emulex的網(wǎng)絡(luò)可視性產(chǎn)品系列可幫助全球企業(yè)監(jiān)控并改進(jìn)應(yīng)用和網(wǎng)絡(luò)性能管理。Emulex總部設(shè)在美國加州Costa Mesa。

    分享到: 收藏

    專題

    亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 清原| 靖宇县| 互助| 漠河县| 夏津县| 鸡东县| 新蔡县| 马山县| 南充市| 阜宁县| 天水市| 晴隆县| 册亨县| 林周县| 边坝县| 乐都县| 汝州市| 临清市| 理塘县| 英山县| 佛坪县| 额尔古纳市| 冀州市| 南乐县| 偃师市| 贵州省| 万源市| 介休市| 武义县| 饶河县| 大同市| 磐安县| 工布江达县| 五原县| 满城县| 正安县| 汾阳市| 绥阳县| 敦化市| 黄骅市| 双柏县| http://444 http://444 http://444 http://444 http://444 http://444