現如今的數據量增長(cháng)以大爆炸的速度迅猛增長(cháng)。據調研顯示,2006年至2011年之間,全球范圍內的數字數據量呈指數級增長(cháng)趨勢,已經(jīng)從200艾字節增長(cháng)到近2澤字節(10倍的增長(cháng)),而預計到2015年,可用數字數據將逾8澤字節。有近70%的雇員總數超過(guò)500名的企業(yè)均聲稱(chēng),他們正管理著(zhù)超過(guò)100TB的數據,而有近40%的企業(yè)表示他們目前管理的總數據量超過(guò)了1PB。
即使如此,這些數據量與那些世界領(lǐng)先的公司所正在生產(chǎn)和管理著(zhù)的驚人數據量相比較仍然是蒼白的,而這都要歸功于云計算、Web2.0、高性能計算和大數據的出現。現如今的數據量是如此的驚人以至于傳統的數據中心如果沒(méi)有巨額投資迅速的升級到靈活的、可擴展的解決方案的話(huà),正在變得過(guò)時(shí)。
數據分析的重要性
除了可擴展性的問(wèn)題,企業(yè)還面臨一系列其他的挑戰,這包括對大量數據信息的組織、備份和恢復等。但也許其中最重要的挑戰是如何分析和關(guān)聯(lián)數據,來(lái)改善企業(yè)的決策和促進(jìn)利潤的增長(cháng)。數據分析是企業(yè)在模擬用戶(hù)行為方面進(jìn)行的模型努力,以便改進(jìn)生產(chǎn),銷(xiāo)售和營(yíng)銷(xiāo)決策,并避免用戶(hù)對企業(yè)產(chǎn)生消極的印象和發(fā)生其他欺詐活動(dòng)。
通過(guò)數據整理,找出規律和趨勢,以采取相關(guān)的行動(dòng)是至關(guān)重要的。那些成功進(jìn)行數據分析的企業(yè)很可能在未來(lái)站在領(lǐng)先決策的制高點(diǎn)。
數據中心的演變
隨著(zhù)數據量的飆升和企業(yè)試圖適應這一迫切需要分析如此海量數據的趨勢,數據中心被迫已經(jīng)經(jīng)歷了一系列的演變以應對不斷變化的需求。除了不斷調整數據中心的存儲容量來(lái)處理如此龐大的數據量之外,數據中心體系結構必須適應更快和更強大的數據分析需求。
要理解這一演變,探索一下數據中心從其最基本的根源發(fā)展到今天擁有巨大設施的歷史,以及在這一過(guò)程中所經(jīng)歷的基本技術(shù)原理的變化是相當有用的。
最早版本的數據中心只不過(guò)是一臺電腦包含一個(gè)CPU、內存緩存和存儲的主機。彼時(shí)尚未有網(wǎng)絡(luò )的概念,所以數據中心的所有功能都包含在一個(gè)中心位置。
而隨著(zhù)網(wǎng)絡(luò )被引入,將存儲元件從網(wǎng)絡(luò )上的計算組件進(jìn)行分離變得普及。這較之與CPU捆綁在一起,可以讓專(zhuān)用的存儲的優(yōu)勢得到充分的利用。
圖1:原始數據中心架構
然而,在過(guò)去十年,數據量的增加以及隨之導致的數據分析需求的相應的增加再次改變了典型的數據中心的結構。現有互連技術(shù)過(guò)于緩慢,無(wú)法適應實(shí)時(shí)(甚至相當快)的處理大批量的數據需求,以及分析信息相關(guān)應對措施的要求。大多數數據分析的請求需要幾周的時(shí)間來(lái)完成,屆時(shí)信息利用為時(shí)已晚。
為了解決互連性能較差的問(wèn)題,數據中心解決方案開(kāi)始提供將存儲捆綁到計算服務(wù)器。通過(guò)將計算和存儲之間的距離降低到接近零,使得企業(yè)獲得了立即訪(fǎng)問(wèn)數據的能力,從而實(shí)現更快的分析和提高他們的業(yè)務(wù)決策能力。