在上周末舉辦的2013中國(深圳)IT領(lǐng)袖峰會(huì )上,“大數據”成為嘉賓們熱議的話(huà)題之一。中國國際金融有限公司總裁兼首席執行官朱云來(lái)表示,新的數據產(chǎn)生是個(gè)很自然的過(guò)程,最關(guān)鍵的是如何處理數據。
近日,騰訊、華為、華大基因、宇龍、金蝶、深圳清華大學(xué)研究院、中科院深圳先進(jìn)技術(shù)研究院、深圳市南山科技事務(wù)所等16個(gè)單位發(fā)起的深圳大數據產(chǎn)學(xué)研聯(lián)盟宣告成立,該聯(lián)盟聚集了深圳產(chǎn)學(xué)研各界的優(yōu)秀代表。搶抓大數據時(shí)代的機遇已被提上日程,協(xié)作共贏(yíng)的探索也已展開(kāi)。
大數據時(shí)代,深圳多類(lèi)企業(yè)迎來(lái)巨大機遇
在全球信息化高速發(fā)展的今天,數據走向極大豐富,如何利用好這些數量龐大、傳播速度快、多樣性、價(jià)值高的數據就成為新的課題。據中科院院士、北京航空航天大學(xué)校長(cháng)懷進(jìn)鵬介紹,2009年谷歌就曾通過(guò)用戶(hù)搜索及網(wǎng)頁(yè)數據提前預測了H1N1流感的傳播,通過(guò)對社會(huì )網(wǎng)絡(luò )數據的挖掘能及時(shí)反映社會(huì )動(dòng)態(tài)與情緒,大數據同時(shí)也為科學(xué)研究提供了新的途徑。
具體到深圳來(lái)看,大數據對深圳的網(wǎng)絡(luò )基礎設施提供商、互聯(lián)網(wǎng)企業(yè)、軟件公司、科研機構等也意味著(zhù)巨大的改變,這也是深圳大數據產(chǎn)學(xué)研聯(lián)盟能吸引深圳各界精英關(guān)注的原因。近日在深圳南山區舉辦的中國大數據產(chǎn)業(yè)峰會(huì )上,清華大學(xué)教授鄭緯民就表示,大數據是信息技術(shù)的下一個(gè)發(fā)展重點(diǎn),對深圳的發(fā)展具有戰略意義,推動(dòng)政府基礎數據的開(kāi)放共享,將產(chǎn)生巨大的社會(huì )價(jià)值。
“大數據時(shí)代,網(wǎng)絡(luò )基礎設施先行,是深圳的網(wǎng)絡(luò )基礎設施提供商如華為、中興、UIT的商業(yè)機會(huì )。深圳眾多的互聯(lián)網(wǎng)企業(yè)如騰訊等可以深入挖掘海量的大數據資源、創(chuàng )造對用戶(hù)有價(jià)值的應用,開(kāi)拓新的互聯(lián)網(wǎng)業(yè)務(wù)。”鄭緯民稱(chēng),大數據時(shí)代,企業(yè)商務(wù)智能將廣泛用于客戶(hù)關(guān)系管理及改進(jìn)、企業(yè)經(jīng)營(yíng)風(fēng)險管控、預測,對深圳ERP軟件公司如金蝶等是重大發(fā)展機遇。
深圳大數據產(chǎn)學(xué)研聯(lián)盟在3月28日正式揭牌成立,16個(gè)發(fā)起單位囊括了深圳多個(gè)領(lǐng)域的“尖端部隊”,包括深圳清華大學(xué)研究院、中科院深圳先進(jìn)技術(shù)研究院、國家超級計算深圳中心(深圳云計算中心)、深圳大學(xué)、清華大學(xué)深圳研究生院、深圳市南山科技事務(wù)所、金蝶國際軟件集團有限公司、華為技術(shù)有限公司、宇龍計算機通信科技(深圳)有限公司、華大基因、騰訊公司等企業(yè)、高校、科研單位及科技服務(wù)機構。
據深圳大學(xué)教授、中科院院士陳國良介紹,大數據被認為是下一個(gè)發(fā)展階段的石油和金礦,深圳大數據產(chǎn)學(xué)研聯(lián)盟成立集聚了深圳乃至全國的優(yōu)秀大數據研究機構和企業(yè),在大數據領(lǐng)域有相當豐富的研究基礎和技術(shù)成果,未來(lái)聯(lián)盟將充分發(fā)揮產(chǎn)業(yè)聯(lián)動(dòng)作用,打造完整的大數據產(chǎn)業(yè)鏈,促進(jìn)同行業(yè)間信息溝通、業(yè)務(wù)合作、資源共享、優(yōu)勢互補。
深圳市科技創(chuàng )新委副主任朱建平在中國大數據產(chǎn)業(yè)峰會(huì )上表示,深圳科技創(chuàng )新委將大數據作為重點(diǎn)扶持的領(lǐng)域之一,在政策和具體行動(dòng)上都支持大數據的發(fā)展。據他透露,國家超算深圳中心2014年也將在大數據方面向國家申請一些重大課題,并聘請國內外優(yōu)秀專(zhuān)家加入。
大數據中如何挖出“寶藏”?
提及大數據的利用,很多人會(huì )想到“尿布+啤酒”的經(jīng)典案例。早在1969年,全球零售巨頭沃爾瑪便利用計算機對消費者的購物行為進(jìn)行數據分析,發(fā)現男性顧客在購買(mǎi)嬰兒尿布時(shí),常常會(huì )順便“搭配”幾瓶啤酒來(lái)犒勞自己,于是推出了將啤酒與尿布捆綁銷(xiāo)售的促銷(xiāo)手段。
如今,人們對大數據的重要性認知已經(jīng)清晰,如何使用好大數據則是現實(shí)層面更需要考慮的內容。鄭緯民教授表示,數據的關(guān)鍵問(wèn)題和技術(shù)是大數據的獲取、表示及傳輸、存儲、處理及查詢(xún)分析。
據騰訊開(kāi)放平臺部與云平臺總經(jīng)理陳磊介紹,海量、精準和實(shí)時(shí)是處理大數據時(shí)的最大挑戰,比如騰訊每天有2億多用戶(hù)使用20萬(wàn)應用,每天新增100TB的統計數據,可以用來(lái)分析用戶(hù)使用應用傾向的維度有100多萬(wàn)個(gè)等等很多因素,分析的因素越多,為用戶(hù)推薦的精準能力就越好。
從大數據的精準角度來(lái)看,面臨的挑戰則更大。比如一些網(wǎng)絡(luò )注冊用戶(hù)的年齡、學(xué)歷、職業(yè)等信息,很多時(shí)候都是明顯虛假,一個(gè)玩復雜電子游戲非常厲害的人注冊年齡可能只是幾歲,這時(shí)只能通過(guò)關(guān)系鏈來(lái)推測。
寬帶資本董事長(cháng)田溯寧在中國(深圳)IT領(lǐng)袖峰會(huì )的“大數據”分論壇上表示,如今技術(shù)上已經(jīng)可以隨時(shí)記錄一個(gè)人每一天的脈搏等生理指標,大部分疾病都可以預防,大部分的治療可以更加個(gè)性化,人的壽命有望延長(cháng)。
田溯寧指出,圍繞著(zhù)大數據,很多創(chuàng )新正在發(fā)生,這種創(chuàng )新和商業(yè)模式的轉換比互聯(lián)網(wǎng)還要更快。他認為,三年到五年左右,人們就會(huì )看到大數據在各個(gè)方面的應用。
中興通訊大數據總工葉云認為,大數據是端、管、云發(fā)展的產(chǎn)物,云計算為降低大數據的處理和分析成本提供了基礎,大數據為云計算落地提供了機會(huì ),并提出新發(fā)展需求,如實(shí)時(shí)流處理。大數據將越來(lái)越成為熱點(diǎn)問(wèn)題,將對生活、工作產(chǎn)生深遠影響。
葉云舉例說(shuō),采集移動(dòng)的電信用戶(hù)的實(shí)時(shí)動(dòng)態(tài)位置信息,通過(guò)對海量匿名數據進(jìn)行分析,可以提供類(lèi)似“云圖”的海量人口位置信息,這就可以為政府公共管理、城市規劃、交通規劃提供數據,為零售商提供人群分布、流向、熱點(diǎn)等,提供大型活動(dòng)比如運動(dòng)會(huì )、展會(huì )或者集會(huì )的人群分布、流向等分析。
大數據時(shí)代,用戶(hù)隱私怎樣得到保護?
人們在網(wǎng)絡(luò )上留下的注冊、郵件、微博等各種信息越來(lái)越多,利用大數據的需求越來(lái)越高,呼吁一些擁有大數據的公司將部分數據開(kāi)放出來(lái)供研發(fā)或商用的聲音也有出現,但在這個(gè)過(guò)程中如何保護用戶(hù)的隱私,是每個(gè)人都不得不關(guān)注的問(wèn)題。
“第一,用戶(hù)一定要保護自己的隱私,不要把微博當成QQ;第二,我們使用數據的時(shí)候絕對不會(huì )把數據傳遞給第三方,我們的確是用很多用戶(hù)的行為,但所做的事情一定是幫助用戶(hù)提供價(jià)值,絕對不能泄露用戶(hù)的數據,絕對不能為了商業(yè)價(jià)值使用用戶(hù)數據。”騰訊開(kāi)放平臺部與云平臺總經(jīng)理陳磊在中國大數據產(chǎn)業(yè)峰會(huì )上表示,即便如此,有一些用戶(hù)數據是絕對不能用的,比如QQ、微信的聊天記錄是永遠不能碰的,除非用戶(hù)自己存儲,否則騰訊也是不會(huì )存的。
對于大數據時(shí)代的隱私問(wèn)題,中興通訊大數據總工葉云在大數據產(chǎn)業(yè)峰會(huì )上表示,這不光是廠(chǎng)商或數據源擁有者的問(wèn)題,也是政府、社會(huì )都應該來(lái)討論的問(wèn)題。據葉云介紹,中興通訊對全球主要國家在大數據隱私方面的法律法規都進(jìn)行了掃描,目前了解到的是歐盟在大數據方面的隱私保護更為嚴格,其中又以德語(yǔ)區的法規最為嚴格,目前國內還沒(méi)有相應的法律法規,但隨著(zhù)大數據引起的關(guān)注越來(lái)越多,未來(lái)隱私安全的法律法規完善應該會(huì )得到推動(dòng)。
Gartner數據中心系統研究總監曾劭清3月30日在IT領(lǐng)袖峰會(huì )上發(fā)布該機構預測稱(chēng),很多企業(yè)一窩蜂沖進(jìn)大數據領(lǐng)域,到2016年,由于缺乏處理信息的信任邊界的經(jīng)驗,使用消費者大數據決策的25%的企業(yè)將會(huì )面臨信譽(yù)受損的情況。
田溯寧在IT領(lǐng)袖峰會(huì )期間表示,隱私問(wèn)題不會(huì )成為大數據發(fā)展的障礙,但大數據隱私問(wèn)題需要國家立法來(lái)規范。他說(shuō),互聯(lián)網(wǎng)在剛開(kāi)始時(shí)也面臨著(zhù)不安全、暴露隱私等問(wèn)題,隨著(zhù)互聯(lián)網(wǎng)向日常生活的深入,這些問(wèn)題都再以技術(shù)、法律等形式的方法得到完善,大數據也會(huì )經(jīng)歷這樣的過(guò)程。