—.探針式BOSS業(yè)務(wù)監(jiān)控系統(tǒng)實(shí)戰(zhàn)分析
運(yùn)營商當(dāng)前的業(yè)務(wù)運(yùn)營支撐系統(tǒng)(BOSS)存在先天不足,既沒有能力感知BOSS系統(tǒng)的運(yùn)營狀態(tài),也沒有能力預(yù)知故障的發(fā)生。3G時代,BOSS系統(tǒng)如何才能告別“無知”,先于用戶發(fā)現(xiàn)問題,變被動為主動,提高運(yùn)營商業(yè)務(wù)質(zhì)量?
3G的正式運(yùn)營,帶來了國內(nèi)三大運(yùn)營商(中國移動、中國聯(lián)通、中國電信)之間白熱化的競爭。用戶的持有量是各運(yùn)營商實(shí)力的一個重要衡量指標(biāo),而網(wǎng)絡(luò)質(zhì)量和業(yè)務(wù)能力則決定著運(yùn)營商能否持有較多用戶。對網(wǎng)絡(luò)質(zhì)量和業(yè)務(wù)能力的保障涉及到運(yùn)營商內(nèi)部多個部門以及工作環(huán)節(jié),其中業(yè)務(wù)支撐是十分重要的一環(huán):業(yè)務(wù)運(yùn)營支撐系統(tǒng)(BOSS)故障會導(dǎo)致營業(yè)廳關(guān)門、客戶投訴升級等重大問題的發(fā)生,嚴(yán)重影響公司業(yè)務(wù)的正常運(yùn)營。BOSS系統(tǒng)如何實(shí)現(xiàn)對業(yè)務(wù)能力的保障?如何使運(yùn)營商業(yè)務(wù)支撐運(yùn)營工作全面提升?
BOSS系統(tǒng)的先天不足
當(dāng)前運(yùn)營商的BOSS系統(tǒng)普遍存在著先天不足:既沒有能力感知BOSS系統(tǒng)的運(yùn)營狀態(tài),也沒有能力預(yù)知故障的發(fā)生。很多地方運(yùn)營商的BOSS系統(tǒng)不同于傳統(tǒng)的電信設(shè)備系統(tǒng),并不具備電信級的能力標(biāo)準(zhǔn),而是附加了很多具有中國特色、甚至各省特色的IT系統(tǒng),在可靠性與可維護(hù)性上都與電信級產(chǎn)品相差甚遠(yuǎn)。這種先天不足主要體現(xiàn)在“可監(jiān)控性差”上。各個運(yùn)營商都經(jīng)歷過或正在經(jīng)歷著被動的BOSS維護(hù)模式三部曲:“客戶投訴—發(fā)現(xiàn)故障—故障修復(fù)”。
如何讓BOSS運(yùn)維人員能夠快速發(fā)現(xiàn)、有效解決業(yè)務(wù)問題,全面了解業(yè)務(wù)運(yùn)營系統(tǒng)的各種運(yùn)營信息以及用戶的感知呢?
幾大運(yùn)營商都在千方百計尋求自身BOSS業(yè)務(wù)支撐運(yùn)營能力的提升。以中國移動為例,中國移動集團(tuán)公司曾經(jīng)下發(fā)過相關(guān)業(yè)務(wù)技術(shù)規(guī)范,多家省移動公司都做過相關(guān)的嘗試。其中,上海移動曾在BOSS系統(tǒng)改進(jìn)和提升方面取得了一定的突破,其具體方式是:直接在BOSS系統(tǒng)中增加維護(hù)代碼模式。這種做法的優(yōu)點(diǎn)是時效性強(qiáng),缺點(diǎn)是維護(hù)代碼與BOSS系統(tǒng)捆綁過于密切,難以實(shí)現(xiàn)大范圍普及。
BOSS也能實(shí)現(xiàn)監(jiān)控
中國移動浙江公司在借鑒了上海移動BOSS改進(jìn)模式的經(jīng)驗(yàn)之后,經(jīng)過為期二年的探索及驗(yàn)證,構(gòu)建了探針式BOSS業(yè)務(wù)監(jiān)控系統(tǒng)。探針式BOSS業(yè)務(wù)監(jiān)控系統(tǒng)提出了“以BOSS業(yè)務(wù)監(jiān)控為核心”的理念,采用“探針式提取、指標(biāo)引導(dǎo)、建模驅(qū)動”的方式,打造一站式BOSS業(yè)務(wù)監(jiān)控系統(tǒng),既實(shí)現(xiàn)了對現(xiàn)有實(shí)際業(yè)務(wù)系統(tǒng)的有效監(jiān)控,也滿足了BOSS運(yùn)營管理的需要。
探針式BOSS業(yè)務(wù)監(jiān)控系統(tǒng)由五層組成:數(shù)據(jù)采集層、業(yè)務(wù)建模層、數(shù)據(jù)聚集層、告警管控層、分析展示層。這五個不同的層次在運(yùn)營商業(yè)務(wù)能力的提升和運(yùn)營管理水平的提高上都起到了什么作用呢?
數(shù)據(jù)采集層: 是整個監(jiān)控系統(tǒng)的基礎(chǔ),用來提供核心的業(yè)務(wù)健康度建模和可用性建模所需要的平臺、應(yīng)用、業(yè)務(wù)等數(shù)據(jù)。
系統(tǒng)數(shù)據(jù)采集共采用了三類探針:A式探針直接模擬BOSS前臺業(yè)務(wù)操作,采集BOSS門戶各種業(yè)務(wù)應(yīng)用的可用狀態(tài); B式探針負(fù)責(zé)采集A式探針發(fā)起的前臺業(yè)務(wù)所觸發(fā)的BOSS后臺數(shù)據(jù)操作日志統(tǒng)計值,以及BOSS后臺系統(tǒng)運(yùn)營狀態(tài),并將其發(fā)送業(yè)務(wù)監(jiān)控系統(tǒng); C式探針從BOSS接入交換機(jī)中全量采集BOSS交易記錄,即第一時間采集到實(shí)際BOSS運(yùn)營的狀態(tài)。
綜上所述,這三類探針能夠獲取到從業(yè)務(wù)發(fā)起、業(yè)務(wù)處理、業(yè)務(wù)交易到業(yè)務(wù)完成全過程的用戶能夠感知到的所有業(yè)務(wù)數(shù)據(jù),為從用戶感知角度進(jìn)行業(yè)務(wù)監(jiān)控提供了堅(jiān)實(shí)的基礎(chǔ)。
業(yè)務(wù)建模層: 是整個監(jiān)控系統(tǒng)的核心,是將業(yè)務(wù)進(jìn)行有形化管理、量化衡量的高效手段。該業(yè)務(wù)建模層中涵蓋了幾乎所有的BOSS管理資源要素,包括業(yè)務(wù)、應(yīng)用、服務(wù)及其他平臺類資源,這些信息都建立并實(shí)時更新于企業(yè)集中建設(shè)的符合ITIL標(biāo)準(zhǔn)的CMDB(配置資源數(shù)據(jù)庫,其中每一子項(xiàng)便是一個CI配置資源項(xiàng))中。基于CMDB中動態(tài)調(diào)整的實(shí)時CI項(xiàng)和相互關(guān)系,關(guān)聯(lián)上能夠反映業(yè)務(wù)當(dāng)前狀況的KPI指標(biāo),以結(jié)構(gòu)化的模型框架為指導(dǎo),建立完整的業(yè)務(wù)CI/KPI指標(biāo)體系,繪制出以業(yè)務(wù)為中心的BOSS系統(tǒng)視圖,全面展現(xiàn)其健康度和可用性。
CI/KPI指標(biāo)體系的建立是以業(yè)務(wù)為主線,按照“CI業(yè)務(wù)-應(yīng)用-平臺”的分層結(jié)構(gòu),針對每一層設(shè)定支撐域、運(yùn)營域和服務(wù)域的指標(biāo)分類標(biāo)準(zhǔn),并在這些指標(biāo)的基礎(chǔ)上通過關(guān)系推導(dǎo)和加權(quán)計算創(chuàng)建業(yè)務(wù)健康度和可用性量化模型,將業(yè)務(wù)的層層嵌套、互相關(guān)聯(lián)與后臺軟硬件平臺之間的關(guān)系都量化出來,并綜合為直觀有效的業(yè)務(wù)運(yùn)營狀況指標(biāo); 作為監(jiān)控系統(tǒng)的核心,業(yè)務(wù)建模層為告警管控層的預(yù)警和故障定位提供了衡量基礎(chǔ)和分析邏輯,如果健康指標(biāo)超出經(jīng)驗(yàn)化閾值,業(yè)務(wù)預(yù)警可幫助維護(hù)人員將業(yè)務(wù)隱患消除于萌芽之中。
CI/KPI模型的建立,成功地將傳統(tǒng)監(jiān)控系統(tǒng)的監(jiān)控難點(diǎn)轉(zhuǎn)變?yōu)榱咙c(diǎn),通過對模型中父子業(yè)務(wù)間關(guān)系、業(yè)務(wù)與后臺資源間關(guān)系的結(jié)構(gòu)化梳理,多維度數(shù)據(jù)的采集計算,有效量化了業(yè)務(wù)健康度指標(biāo)。同時,模型中所綜合的業(yè)務(wù)可用性、業(yè)務(wù)辦理量、后臺資源使用情況等全方位信息,尤為適合公司管理人員了解業(yè)務(wù)通體運(yùn)營情況。
數(shù)據(jù)聚集層: 在這一層,系統(tǒng)將經(jīng)過CI/KPI模型、按不同業(yè)務(wù)規(guī)則結(jié)構(gòu)化之后的三類用戶體驗(yàn)數(shù)據(jù)進(jìn)行匯聚:業(yè)務(wù)監(jiān)控數(shù)據(jù)(業(yè)務(wù)可用性、業(yè)務(wù)量、業(yè)務(wù)辦理時長、業(yè)務(wù)的后臺服務(wù)器負(fù)載情況等)、配置數(shù)據(jù)(從CMDB中定時同步配置項(xiàng)信息和配置關(guān)聯(lián)信息),業(yè)務(wù)感性數(shù)據(jù)(業(yè)務(wù)量、積壓量和投訴等信息),使得運(yùn)維人員不僅能夠從IT支撐視角掌握業(yè)務(wù)運(yùn)行狀況,還能直觀了解到在當(dāng)前業(yè)務(wù)運(yùn)行情況之下客戶層面的使用感知。

圖:探針式BOSS業(yè)務(wù)監(jiān)控系統(tǒng)架構(gòu)圖

圖: 采集層探針
告警管控層: 本層提供基于預(yù)警模型的預(yù)警管理和追根溯源的告警定位處理。

圖:業(yè)務(wù)三維立體分析展示
共 2 頁:1 2
計算機(jī)世界報