商業(yè)銀行做容災備份已經(jīng)有很多年了,但業(yè)務(wù)連續性、容災備份一直是國內銀行信息化的短板。因此,雖是老生常談,但卻歷久彌新,不斷有新的話(huà)題、新的關(guān)注點(diǎn)出現。目前在容災備份領(lǐng)域,商業(yè)銀行比較關(guān)注的話(huà)題是“雙活”容災中心的建立。
何為“雙活”數據中心?
所謂“雙活”數據中心,區別于一個(gè)數據中心、一個(gè)災備中心的模式,前者兩個(gè)數據中心都處于運行當中,所以稱(chēng)為“雙活”,且互為備份;后者是一個(gè)數據中心投入運行,另外一個(gè)數據中心處在不工作狀態(tài),只有當災難發(fā)生時(shí),生產(chǎn)數據中心癱瘓,災備中心才啟動(dòng)。
“雙活”數據中心最大的特點(diǎn)是:一、充分利用資源,避免了一個(gè)數據中心常年處于閑置狀態(tài)而造成浪費。通過(guò)資源整合,“雙活”數據中心的服務(wù)能力是雙倍的。二、“雙活”數據中心如果斷了一個(gè)數據中心,另外一個(gè)數據中心還在運行,對用戶(hù)來(lái)說(shuō)是不可感知的。而一個(gè)災備中心的模式,如果生產(chǎn)數據中心癱瘓,需要半個(gè)小時(shí)、甚至兩個(gè)小時(shí)、甚至更長(cháng)時(shí)間才能啟動(dòng)災備中心,在啟動(dòng)災備中心的時(shí)間里,用戶(hù)交易會(huì )嚴重受損。
“雙活”與“云”不謀而合
在國內的商業(yè)銀行當中,部署了雙活數據中心的銀行還為數甚少,光大銀行是最早開(kāi)始這方面探索的銀行之一。光大銀行災備體系是典型的“兩地三中心”模式,目前在北京有兩個(gè)規模相當的雙活中心,在武漢有一個(gè)異地災備中心。
光大銀行的“雙活”數據中心的模式始建于2002年。當時(shí)還沒(méi)有出現云計算的概念,但是這個(gè)思路和今天云計算的思路不謀而合。“云”的目的就是把數據中心的所有資源整合成一個(gè)資源,成為一朵云,這樣用戶(hù)就不知道是哪個(gè)數據中心為其提供服務(wù)。“雙活”數據中心的效果也是一樣的。
“雙活”模式依賴(lài)于虛擬化和云計算技術(shù),要把應用從A數據中心遷移到B數據中心只需點(diǎn)一下鼠標,拖拽一下,遷移就可以完成。這項被稱(chēng)為“一鍵切換平臺”技術(shù)的實(shí)現,有賴(lài)于兩個(gè)數據中心必須是“雙活”的。傳統的災備中心模式采用備份模式,兩個(gè)數據中心的地址是一樣的,或者利用域名進(jìn)行切換,系統間關(guān)系復雜,切換影響較大,一般都需要停機窗口,通常是必須生產(chǎn)中心倒掉,災備中心才能起來(lái),兩個(gè)中心同時(shí)起來(lái)會(huì )發(fā)生沖突。“雙活”數據中心可以規避這個(gè)問(wèn)題。
在傳統的災備中心模式中,為保證備份中心隨時(shí)可用,銀行科技部門(mén)每年都要耗費大量經(jīng)歷組織演練,通常為了規避業(yè)務(wù)風(fēng)險,演練都是模擬性質(zhì)的。這樣大費周章的演練在“雙活”模式中也是不必要的,因為每個(gè)數據中心每時(shí)每刻都是“活著(zhù)”的。
“雙活”數據中心的優(yōu)勢
“雙活”數據中心的最大優(yōu)勢是有效利用資源。災備中心建設的投資巨大及每年運維成本極高,如果資源處于閑置狀態(tài),資源是相當浪費的,有了虛擬化,能夠把閑置的資源整合,服務(wù)能力會(huì )提高一倍。銀行系統中很多資源都是彈性需求,如基金、貴金屬交易、電子支付、和網(wǎng)銀交易,在交易火爆時(shí)一天交易量可能達到全年交易量總和。故銀行系統容量規劃時(shí)是充分考慮到交易峰值的,但這樣在正常時(shí)間就有很大的交易浪費,以淘寶“雙十一”活動(dòng)為例,交易量在幾分鐘內就可能達到全年交易量的總和,需要系統服務(wù)能力提高十倍,這時(shí)雙活數據中心和靈活快速的資源調度就充分發(fā)揮出了作用。云計算技術(shù),讓IT系統有了資源整合的能力,讓系統有了充分的彈性,隨時(shí)可以調度十臺機器來(lái)提高服務(wù)能力,來(lái)保證交易的突發(fā)需求,以及各種突發(fā)因素造成的交易量猛增。
有了云計算技術(shù),不代表投入會(huì )更少,但是資源利用率會(huì )更高,系統但抗沖擊能力會(huì )更強,自由調度能力會(huì )更強。
自動(dòng)化是“雙活”與“云計算”必不可少的前提條件
云計算需要自動(dòng)化手段來(lái)幫助系統維護人員進(jìn)行自動(dòng)的資源調配。比如,通過(guò)虛擬化技術(shù)虛擬出了上萬(wàn)臺虛擬機器,白天需要50臺機器給網(wǎng)銀系統提供web服務(wù),晚上網(wǎng)銀交易少了,貴金屬交易多了,這50臺機器要調配到另一個(gè)系統上。這五十臺不可能一個(gè)人一臺臺調配,那可能配一晚上都配不完,就需要自動(dòng)化的軟件來(lái)自動(dòng)調整資源分配。
光大銀行目前采用的是雙數據中心同時(shí)工作的資源模式,同城的兩個(gè)數據中心都投入生產(chǎn)系統。光大銀行信息科技部系統運維處高級經(jīng)理牟健君介紹說(shuō),“假如這個(gè)數據中心有5臺機器工作,另外一個(gè)數據中心有5臺機器處于空閑狀態(tài),我想做一個(gè)操作:讓這邊的5臺機器停下來(lái)做日常的運維、審檢,讓另外一邊的5臺投入生產(chǎn)。有自動(dòng)化工具以后,我點(diǎn)一下鼠標,這5臺機器上的應用就可以立即切換到那5臺空閑的資源上去,整個(gè)業(yè)務(wù)不間斷,調度靈活。如果沒(méi)有自動(dòng)化手段,過(guò)去的切換過(guò)程需要至少半個(gè)小時(shí)。”因此,自動(dòng)化是云計算、“雙活”數據中心應用必不可少的前提條件。
異地“雙活”難度大
當然,部署“雙活”數據中心的難度也非常大,尤其是異地“雙活”,涉及到數據同步效率問(wèn)題。如果數據同步效率達不到要求,在災難發(fā)生時(shí)就會(huì )造成一段時(shí)間的交易丟失。在異地“雙活”的模式中,兩地數據中心同時(shí)接納交易,技術(shù)難度很大,需要更改眾多底層程序。異地“雙活”模式目前在國內的商業(yè)銀行中還鮮見(jiàn)成功案例,但只有做到異地“雙活”才能提供真正無(wú)誤的服務(wù)。
隨著(zhù)云計算技術(shù)的日漸成熟,越來(lái)越多的銀行開(kāi)始考慮部署“雙活”、乃至“多活”數據中心。