大數據變成大業(yè)務(wù)了,它不僅會(huì )在近十年大放異彩,而且還會(huì )象企業(yè)資源規劃、供應鏈和客戶(hù)管理以及企業(yè)計算領(lǐng)域中的其他部分那樣成為企業(yè)的常規業(yè)務(wù)。
但是那有一個(gè)前提,即我們必須讓更多的人參與進(jìn)來(lái),并且培養出一大批相關(guān)領(lǐng)域的數據科學(xué)家和專(zhuān)家。
IT市場(chǎng)調查公司Gartner正在佛羅里達奧蘭多市召開(kāi)其Symposium/ITxpo大會(huì ),與往年一樣,Gartner在今年的大會(huì )上也發(fā)布了一些預測。
Gartner首先給出了它對今年全球IT開(kāi)支的最新預測,你可能不會(huì )購買(mǎi)太多此類(lèi)股票的股票,而且IT廠(chǎng)商和你們公司的IT部門(mén)受到這類(lèi)關(guān)乎整個(gè)IT開(kāi)支的數據和預測的間接影響其實(shí)是很小的。當企業(yè)的CEO和CFO聽(tīng)到全球IT開(kāi)支將下降的時(shí)候,你可能不會(huì )覺(jué)得有什么問(wèn)題。
好消息是,Gartner預測全球IT開(kāi)支將增長(cháng)3.8%,達到3.7萬(wàn)億美元。在其最新預測中,Gartner將今年的硬件、軟件和服務(wù)(包含電信設備和服務(wù))開(kāi)支預期下降了3%,調至3.63萬(wàn)億美元。
與前幾次的做法一樣,Gartner重新修正了2011年的開(kāi)支數據并調整了2012年的預測數據。實(shí)際上,大多數經(jīng)理記住的只是變化率或百分比,而不是前后的數據一直在變化。
順便提一句,這些數據之所以在今年不斷被修正和變化,其中一個(gè)原因是美元的匯率一直在變動(dòng),而Gartner在作研究和預測時(shí),它將所有的外幣都轉換成了美元。
預計大數據市場(chǎng)的增長(cháng)速度將明顯快于整個(gè)IT市場(chǎng),大數據市場(chǎng)銷(xiāo)售額將在2012年增長(cháng)21.4%,達到340億美元。Gartner在聲明中稱(chēng),今年的大數據總開(kāi)支中,只有43億美元或12.6%的總開(kāi)支將流向新軟件許可證,而大部分的開(kāi)支仍將流向比較傳統的解決方案,以滿(mǎn)足客戶(hù)們對速度、多樣性和數據容量的需求。正是因為這些需求的關(guān)系,大數據才與數據倉儲和聯(lián)機事務(wù)處理(oltp)不同。
你也許會(huì )想,社交網(wǎng)和點(diǎn)擊流分析將占據今年的大數據開(kāi)支的大頭,在340億美元的開(kāi)支中占45%左右的份額。風(fēng)險分析和其他財經(jīng)服務(wù)也開(kāi)始越來(lái)越多地采用Hadoop和其他數據分析工具,同時(shí)從批工具向實(shí)時(shí)工具轉移,就象幾十年前事務(wù)處理從批向聯(lián)機轉移一樣。
雖然大數據的發(fā)展前景似乎是非常明確的,但Gartner認為我們大多數人認為這項業(yè)務(wù)與云計算一樣是虛擬的。我們所說(shuō)的大數據指的是利用現代工具 去快速完成一些工作量巨大的任務(wù),而常規的關(guān)系數據庫是做不到這一點(diǎn)的。就象云計算是分布式計算的新階段一樣,大數據也是另一種形式的計算。
大數據可以巧妙地利用你認為沒(méi)有用的日志文件信息來(lái)窺探你的客戶(hù),并且嘗試為他們提供更好的服務(wù)。它可以將你的運營(yíng)數據與其他數據關(guān)聯(lián)在一起,嘗試建立相關(guān)性。 這些工作如果讓人來(lái)做的話(huà),那將是費時(shí)費力的大工程,而且還會(huì )因為我們可能會(huì )將數據錯誤地關(guān)聯(lián)在一起或沒(méi)有關(guān)閉環(huán)路而導致災難性的后果。 不要說(shuō)互聯(lián)網(wǎng)連續幾個(gè)月嘗試讓我給我的妻子買(mǎi)衣服,而實(shí)際上我已經(jīng)給她買(mǎi)過(guò)衣服了。我不但關(guān)注那些超級cookie,而且我還購買(mǎi)它們,只是你可能沒(méi)有注意到而已。
Gartner研究副總裁馬克拜耳(Mark Beyer)解釋說(shuō):“盡管現在對于大數據的宣傳已經(jīng)很多,但大數據并不是一個(gè)界限清楚、獨立的市場(chǎng),它實(shí)際上代表著(zhù)一種行業(yè)領(lǐng)域的市場(chǎng)力量,必須融入產(chǎn)品、實(shí)務(wù)和解決方案的交付之中。”
拜耳稱(chēng):“在2011年,大數據幾乎推動(dòng)了每一種IT分類(lèi)項目的開(kāi)支增長(cháng)。然而,從現在起直到2018年,大數據的要求將逐漸演變成信息管理實(shí)務(wù)和技術(shù)的基本要求。 預計到2020年的時(shí)候,大數據的功能將成為傳統企業(yè)廠(chǎng)商和它們的部分產(chǎn)品的無(wú)差別、常規功能。”
因此Gartner認為,大數據將在未來(lái)十年內成為新的常規標準,十年后我們應該會(huì )在研究超大規模的系統了,如果一切進(jìn)展順利的話(huà),屆時(shí)我們將見(jiàn)到 Exaflop級的計算、EB級的存儲、十兆瓦級的電力和巨額的成本。但是Gartner同時(shí)也指出,分析師們將提醒人們注意,現在我們非常缺乏對所有數 據以及數據的使用方法都很了解的數據科學(xué)家。
Gartner的高級副總裁兼全球研究主管彼得桑德加德(Peter Sondergaard)在聲明中表示,從現在到2015年,IT行業(yè)將創(chuàng )造440萬(wàn)就業(yè)機會(huì ),其中有190萬(wàn)個(gè)就業(yè)機會(huì )在美國。
每一個(gè)大數據任務(wù)都有倍增的效果,可以為下游供應鏈創(chuàng )造好幾個(gè)就業(yè)機會(huì )。如果照這樣計算的話(huà),美國的190萬(wàn)個(gè)大數據就業(yè)機會(huì )將在IT部門(mén)之外再創(chuàng )新570萬(wàn)個(gè)就業(yè)機會(huì )。 El Reg可能會(huì )說(shuō),由于現在的自動(dòng)化程度已經(jīng)非常高,因此IT部門(mén)的就業(yè)機會(huì )可能很難傳遞到營(yíng)銷(xiāo)和銷(xiāo)售部門(mén)。
桑德加德稱(chēng):“但是這里還有一個(gè)問(wèn)題,這個(gè)行業(yè)現在沒(méi)有足夠的人才。 我們的公共和私有教育系統都不能滿(mǎn)足我們在這方面的需求。因此,我估計只有三分之一的職位會(huì )被填滿(mǎn)。 數據專(zhuān)家將是一種稀有和寶貴的商品。”
我們再一次陷入尷尬的境地了。IT行業(yè)的很多人還是找工作,但他們顯然不具備大數據創(chuàng )造的那些就業(yè)機會(huì )所要求的技術(shù)才能。
從現在的情況來(lái)看,如果企業(yè)能夠少回購一些股票以及在其他方面少浪費一些財力的話(huà),而是去投資培養他們認為他們以后會(huì )需要的大數據專(zhuān)業(yè)人才,這個(gè)問(wèn)題才能得到解決。企業(yè)永遠在哀嘆沒(méi)有優(yōu)質(zhì)的人才,真不知道它們是怎么堅持下去的。
El Reg預計:正如企業(yè)讓SAP和甲骨文通過(guò)各自的軟件接管了它們的業(yè)務(wù)的運營(yíng)工作一樣,大數據領(lǐng)域也會(huì )出現一些應用和服務(wù)供應商來(lái)解決企業(yè)在大數據方面的問(wèn)題。
除非有絕對的必要,否則企業(yè)不會(huì )投資去培養大數據專(zhuān)業(yè)人才。而且只有財力最雄厚的大公司才能得到專(zhuān)業(yè)人才。正如你必須為一名優(yōu)秀的Java程序員或 了解貴公司業(yè)務(wù)的數據庫管理員支付高薪一樣,你必須用高薪來(lái)挽留住了解貴公司業(yè)務(wù)以及那些對貴公司很有用的數據的大數據科學(xué)家。