1、背景
隨著(zhù)企業(yè)業(yè)務(wù)數據的激增,傳統備份方式下,要保存生產(chǎn)數據的多個(gè)副本拷貝,導致備份容量會(huì )越來(lái)越大,造成對備份系統管理困難和成本上升。
然而,備份系統中存在的多個(gè)生產(chǎn)數據副本之間,存在著(zhù)大量的冗余重復數據。因此,對于備份系統,重刪技術(shù)的應用可以很好的消除冗余數據,極大節省備份空間,從而降低采購和運維成本。
2、華為OceanStor VTL6900重刪方案
華為集中備份解決方案采用OceanStor VTL6900作為備份設備, VTL6900通過(guò)FC SAN或者IP SAN連接備份服務(wù)器,應用組網(wǎng)如圖1所示。
圖1 VTL集中備份方案
華為 OceanStor VTL6900虛擬帶庫是業(yè)界唯一的集群重刪備份系統,同時(shí)支持Post processing和Inline的重復數據刪除技術(shù),其重刪引擎為SIR(Single Instance Repository)。
2.1 Post processing重復數據刪除方案
VTL6900所支持的Post processing重復數據刪除技術(shù),其數據比較方法為索引比較方法。
Post processing重復數據刪除技術(shù)原理
圖1 VTL集中備份方案
在Post processing重復數據刪除模式中,VTL6900軟件包含兩個(gè)模塊:VTL模塊和SIR模塊。VTL6900的存儲空間邏輯上被劃分為兩部分,分別為VTL模塊和SIR模塊所用,稱(chēng)之為VTL存儲空間(又稱(chēng)為Cache)和SIR存儲空間(又稱(chēng)為Repository)。VTL6900接收到備份數據后,首先將其存放于VTL存儲空間,此后的某個(gè)時(shí)刻(如某時(shí)間點(diǎn)、備份結束、達到存儲水位等),SIR模塊會(huì )讀取這些數據,并將其和SIR存儲空間中的已有不同數據塊進(jìn)行比較:SIR模塊將原始備份數據劃分為大小為若干KB的數據塊,然后使用SHA-1算法為每個(gè)數據塊計算出一個(gè)哈希值(又稱(chēng)為索引/Index),通過(guò)比較新數據塊和已有數據塊的哈希值以確定新數據塊是否重復,重復的數據塊將被丟棄,而僅保留其數據塊指針,全新的數據塊才會(huì )被存放到SIR存儲空間。
2.2 Inline重復數據刪除方案
VTL6900所支持的Inline重復數據刪除技術(shù),其數據比較方法也為索引比較方法。數據重復數據刪除執行過(guò)程,如圖2所示。
Inline重復數據刪除技術(shù)原理
圖2 VTL集中備份方案
在Inline重復數據刪除模式中,VTL6900軟件包含兩個(gè)模塊:VTL模塊和SIR模塊。VTL6900在接收到備份數據時(shí),Inline Parser會(huì )同步將內存中的原始備份數據劃分為大小為若干KB的數據塊,然后使用SHA-1算法為每個(gè)數據塊計算出一個(gè)哈希值(又稱(chēng)為索引/Index)。同時(shí),SIR模塊會(huì )在內存中同步的比較新數據塊和已有數據塊的哈希值以確定新數據塊是否重復,重復的數據塊將被丟棄,而僅保留其數據塊指針,全新的數據塊才會(huì )被存放到SIR存儲空間。
3、華為OceanStor VTL6900系統亮點(diǎn)
高性能:滿(mǎn)足用戶(hù)對備份窗口的需求。單VTL引擎配置時(shí),VTL6900備份性能可達9TB/hr,8小時(shí)內可支持備份63TB數據;雙引擎配置時(shí),VTL6900實(shí)測備份性能高達31TB/hr,8小時(shí)內可支持備份239TB數據。對于一次備份數據量不超過(guò)239TB的用戶(hù),VTL6900可以很好地滿(mǎn)足其對備份窗口的要求。
大容量:滿(mǎn)足用戶(hù)對存儲容量的需求。雙VTL引擎配置時(shí),VTL6900最大支持1728TB裸容量(可用容量為1230TB),提供重復數據刪除功能時(shí),VTL6900最大可提供220TB存儲容量用于存放重復數據刪除后的數據,以20:1重復數據刪除比計算,VTL6900可存放4PB備份數據,滿(mǎn)足中高端用戶(hù)對備份容量的需求。
重復數據刪除:極大節約系統能耗和存儲投資。VTL6900支持重復數據刪除和磁盤(pán)休眠,可顯著(zhù)減少備份系統需要配置的磁盤(pán)存儲,極大節省系統能耗和存儲投資。
集群架構:滿(mǎn)足用戶(hù)高可用需求。雙VTL引擎HA集群配置下,VTL6900的兩個(gè)VTL引擎一般都獨立工作,當任何一個(gè)VTL引擎出現故障導致其無(wú)法支持備份業(yè)務(wù)時(shí),另一個(gè)引擎將自動(dòng)接管該故障引擎,VTL6900又恢復正常工作,滿(mǎn)足用戶(hù)對備份系統的高可用需求。3個(gè)(2+1)SIR引擎HA集群配置下,當VTL6900任何一個(gè)SIR引擎出現故障導致其無(wú)法支持重復數據刪除業(yè)務(wù)時(shí),Standby SIR引擎將自動(dòng)接管該故障引擎,VTL6900又恢復正常工作,滿(mǎn)足用戶(hù)對備份系統的高可用需求。
4、VTL6900重刪備份系統給客戶(hù)帶來(lái)的價(jià)值
基于重復數據刪除的遠程復制,顯著(zhù)降低用戶(hù)網(wǎng)絡(luò )帶寬需求,節約網(wǎng)絡(luò )帶寬投資。各個(gè)站點(diǎn)的備份數據首先在本地VTL中完成重復數據刪除后,再通過(guò)WAN復制到數據中心VTL,復制過(guò)程中僅傳輸重復數據刪除后,且在數據中心不存在的那些數據塊,相比直接傳輸未經(jīng)重復數據刪除的備份數據,此舉可大幅節約復制帶寬,顯著(zhù)降低用戶(hù)網(wǎng)絡(luò )帶寬需求,節約網(wǎng)絡(luò )帶寬投資。
全局重復數據刪除,進(jìn)一步降低用戶(hù)存儲投資。VTL6900支持全局重復數據刪除功能,即復制過(guò)程中僅傳輸重復數據刪除后的、在數據中心不存在的那些數據塊,因此各個(gè)分支節點(diǎn)VTL之間的,以及各個(gè)分支節點(diǎn)VTL和數據中心VTL之間的重復數據均可得到消除,全局重復數據刪除的重復數據消除效率更高,進(jìn)一步降低用戶(hù)存儲投資。