文/Veritas公司全球銷(xiāo)售高級副總裁Mark Nutt
數據也許是點(diǎn)石成金的“神器”,但也是把雙刃劍。
數據也許是點(diǎn)石成金的“神器”,但也是把雙刃劍。
數據洞察的黃金時(shí)代正悄然到來(lái),蘊含著(zhù)無(wú)數的可能性。通過(guò)數據,零售商可以更好地預測用戶(hù)的購買(mǎi)習慣, 并在規定時(shí)效內把商品送達指定地點(diǎn);醫生可以根據更詳細的醫療記錄,進(jìn)行更為精確的診斷;衛星導航系統能幫助我們避開(kāi)交通事故,讓大家準時(shí)上班;娛樂(lè )軟件可以預測我們的喜好,通過(guò)大數據推薦符合我們審美的音樂(lè )或電影。數據帶領(lǐng)我們從無(wú)到有,其蓬勃發(fā)展的寫(xiě)照,將無(wú)數想象孕育成現實(shí)。
“水滿(mǎn)則溢”
但是當許多企業(yè)初嘗到數據的甜頭時(shí),才發(fā)現數據說(shuō)到底也是把雙刃劍。企業(yè)發(fā)現,只有當數據準確時(shí)才能發(fā)揮作用,如果數據缺失、損壞或不可用,整個(gè)系統就會(huì )崩潰。此外,數據管理難度和其數量成正比,數據越多意味著(zhù)管理難度越高。這就像我們在手機上玩的俄羅斯方塊游戲:一開(kāi)始很容易,但隨著(zhù)方塊下降的速度越來(lái)越快,數量越來(lái)越多,我們最終會(huì )慌亂而不知所措。
業(yè)務(wù)的正常運行離不開(kāi)數據,但如今企業(yè)創(chuàng )造了太多的數據,而彌合數據威脅和數據安全間的溝壑,即使是當今世界上最優(yōu)秀的數據管理團隊都心有余而力不足。
對企業(yè)來(lái)說(shuō),最簡(jiǎn)單的選擇是專(zhuān)注于那些關(guān)乎企業(yè)發(fā)展的關(guān)鍵數據。至于其余的數據,將他們“安置”在云存儲中,并評估其重要性以方便后期處理即可。這與Veritas的一項研究結果相印證——只有16%的企業(yè)數據是“可操作”且被使用的,其余的要么是“ROT”(冗余、過(guò)時(shí)或瑣碎的數據),要么是“暗數據”,存儲數據的團隊很可能不知道它是什么。
然而,存儲這些未被使用的數據不僅會(huì )給公司帶來(lái)財務(wù)壓力,還會(huì )帶來(lái)諸多環(huán)保問(wèn)題。世界范圍的存儲服務(wù)會(huì )消耗大量電力,產(chǎn)生大量碳污染。 據Veritas 統計數據顯示,僅2020 年,存儲暗數據就產(chǎn)生了580萬(wàn)噸碳排放,相當于80個(gè)國家的碳足跡總和。
于此,我們該如何改變這一局面? 其實(shí)只有在面臨重大調整或行動(dòng)時(shí),重新評估被“安置”數據的計劃才適用。對于公司來(lái)說(shuō),要么阻止數據的流入,要么配置更多的資源來(lái)處理它們。但據 IDC 統計,現如今數據量遠未減少。情況恰恰相反,分析機構預測,數據將以23%的年復合增長(cháng)率持續增長(cháng)。Veritas 最近的研究也強調,即使是那些最關(guān)鍵的行動(dòng),很多企業(yè)也缺乏 IT 專(zhuān)家的支持。很多企業(yè)表示,他們需要額外雇用 22 名員工才能加快數據保護速度,更不用說(shuō)解決更廣泛的數據管理問(wèn)題了。
技術(shù)賦能
這些暗數據堆積得如此之快,以至于似乎員工得擁有“三頭六臂”才能應付。但事實(shí)上,在處理暗數據方面,企業(yè)更需要訴諸擁有專(zhuān)業(yè)技能的團隊,而非技能超群的個(gè)人。術(shù)業(yè)有專(zhuān)攻,人們更擅長(cháng)創(chuàng )造力和決策,而技術(shù)則更擅長(cháng)快速處理大量信息。“察勢者智,馭勢者贏(yíng)”,充分利用人工智能(AI)和機器學(xué)習(ML)來(lái)增強現有IT團隊的技能,不僅是保留良好的數據驅動(dòng)決策的方式,也是減少數據存儲對環(huán)境影響的有效途徑。
這便是數據自治,依賴(lài)于學(xué)習數據管理實(shí)踐并將其獨立應用于新數據集的技術(shù)平臺。這些策略曾離不開(kāi)人力操作——必須有人操作系統以決定數據該存儲在何處、如何使用以及最終何時(shí)刪除等問(wèn)題。但考慮到細節層面的逐項執行非常耗時(shí),企業(yè)往往最終會(huì )采用更全面的數據管理方法,例如建立一個(gè)“統一的數據空間”。這就是獲得未使用的,或是不能使用的數據的方法。而將這些數據一直存放在不會(huì )被訪(fǎng)問(wèn)的服務(wù)器上,可以一定程度上降低耗電速度,節省不必要的用電。
數據自治接替人力時(shí),人工智能便可以更精細地實(shí)現主動(dòng)決策和策略應用。AI可以學(xué)習不同數據類(lèi)型的特性,并執行適合的意義的存儲、保護或刪除策略。因此,當新數據被創(chuàng )建時(shí),不論是自動(dòng)保護,還是安全存儲、訪(fǎng)問(wèn)權限,又或是在合適的時(shí)間內進(jìn)行清除,都能夠得到有效執行。
減少數據負載
從可持續性的角度來(lái)看,這有助于從根本上減少存儲的數據量以及與之相關(guān)的污染。企業(yè)不僅可以清除他們不需要的數據,還可以通過(guò)優(yōu)化數據的儲存方式來(lái)減少所需的存儲空間。
舉例來(lái)說(shuō),其實(shí)企業(yè)持有的大量信息都是多次重復的。以合同為例,如果我們把合同通過(guò)郵件發(fā)送給同事,那我們擁有的不僅是合同的原始文檔,還會(huì )有存在于電子郵箱已發(fā)送的文件夾中的副本,而且同事的收件箱里也會(huì )有一個(gè)。同樣地,如果將這封郵件抄送給法律部門(mén)、財務(wù)部門(mén)以及團隊中為該帳戶(hù)工作的三個(gè)同事,那么情況很可能是同一文件的八個(gè)副本,多年來(lái)都存儲在公司的服務(wù)器上。
在暗數據環(huán)境中,上述提及的每一個(gè)文件都需要單獨保存,因為沒(méi)人知道它們是否是同一個(gè)文件。這就像八個(gè)盲盒,除非將他們全部拆開(kāi),否則我們無(wú)法獲知里面的內容是否相同。但其實(shí)這個(gè)看似繞不過(guò)的難題,在拿出數據自治策略后,便能迎刃而解。數據自治可為技術(shù)賦能,進(jìn)而監測整個(gè)企業(yè)的文件。具體來(lái)說(shuō),技術(shù)完成索引相同的數據后會(huì )僅取其一,以原始版本的鏈接取代重復的數據,為存儲“減負”。
從環(huán)保角度來(lái)看,上述的“重復數據刪除”功能的作用在備份數據中格外明顯,其中數據自治驅動(dòng)的解決方案有時(shí)能夠將存儲這些數據所需的電量及其帶來(lái)的二氧化碳排放量減少約 95%。
從業(yè)務(wù)角度來(lái)看,網(wǎng)絡(luò )中的數據風(fēng)險可以最大限度地被規避乃至消除。那些企業(yè)沒(méi)有能力解決的數據洪流是脆弱的。Veritas研究表明,疫情期間,對于那些實(shí)施數字化轉型項目的企業(yè)來(lái)說(shuō),部署新的應用程序和擁有保護措施以確保其安全之間預計存在兩年的滯后期。
缺乏數據保護的兩年,無(wú)疑為勒索攻擊以及潛在的數據違規提供了溫床。好在數據自治恰能對付這些潛藏著(zhù)的“灰犀牛”事件,為數據管理澆筑安全基礎。
一言以蔽之,數據自治將使企業(yè)重新掌舵,牢牢把握數據的決策權,也昭示著(zhù)新的數據“黃金時(shí)代”的到來(lái)。
關(guān)于Veritas
Veritas Technologies是多云數據管理領(lǐng)域的領(lǐng)導者。超過(guò)八萬(wàn)家企業(yè)級客戶(hù), 包括95%的全球財富100強企業(yè),均依靠Veritas確保其數據的保護、可恢復性和合規性。Veritas在規模化的可靠性方面享有盛譽(yù),可為企業(yè)提供抵御勒索軟件等網(wǎng)絡(luò )攻擊威脅所需的彈性。Veritas通過(guò)統一的平臺,支持超過(guò)800種數據源,100多種操作系統,1400多種存儲設備以及60多類(lèi)云平臺。在云級技術(shù)的支持下,Veritas現正在實(shí)踐其自治數據管理戰略,在提供更大價(jià)值的同時(shí),降低運營(yíng)成本。
Veritas中國官方網(wǎng)站 https://www.veritas.com/zh/cn/
Veritas官方微信平臺:VERITAS_CHINA(VERITAS中文社區)