• <strike id="fdgpu"><input id="fdgpu"></input></strike>
    <label id="fdgpu"></label>
    <s id="fdgpu"><code id="fdgpu"></code></s>

  • <label id="fdgpu"></label>
  • <span id="fdgpu"><u id="fdgpu"></u></span>

    <s id="fdgpu"><sub id="fdgpu"></sub></s>

    定義大數據:淺顯易懂的大數據入門(mén)

    2012-08-23 15:36:09   作者:Teradata行業(yè)執行顧問(wèn)王隆生   來(lái)源:CTI論壇   評論:0  點(diǎn)擊:


      當前,眾多企業(yè)都面對從四面八方涌來(lái)的數據流的沖擊。涓涓細流匯成大河,而科技企業(yè)、專(zhuān)家、分析師和技術(shù)顧問(wèn)們紛紛將這條數據之河定義為大數據。但是,在這些眾說(shuō)紛紜的大數據定義中,不乏大量的常見(jiàn)誤解。大量的企業(yè)都面臨著(zhù)挑戰,需要辨別具有價(jià)值的數據流,挖掘這些價(jià)值,協(xié)助企業(yè)做出最佳決策以形成強大的競爭優(yōu)勢。
     
      “大數據”這一術(shù)語(yǔ)的內涵遠遠超越了“大”或是“數據”的含義。大數據的確體現為數量龐大,但它仍有更多特性有待了解。在Forrester分析師布賴(lài)恩·霍普金斯(Brian Hopkins)和鮑里斯·埃韋爾松(Boris Evelson)撰寫(xiě)的《首席信息官,請用大數據擴展數字視野》報告中,他們提出大數據的4項典型特征——海量(Volume)、多樣性(Variety)、高速(Velocity)和易變性(Variability)。下文將簡(jiǎn)要介紹這些特性,并重點(diǎn)闡述大數據對前瞻性商界領(lǐng)袖的重大意義。
     
    海量
     
      企業(yè)面臨著(zhù)數據量的大規模增長(cháng)。例如,IDC最近的報告預測稱(chēng),到2020年,全球數據量將擴大50倍。目前,大數據的規模尚是一個(gè)不斷變化的指標,單一數據集的規模范圍從幾十TB到數PB不等。簡(jiǎn)而言之,存儲1PB數據將需要兩萬(wàn)臺配備50GB硬盤(pán)的個(gè)人電腦。
     
      此外,各種意想不到的來(lái)源都能產(chǎn)生數據。例如,從巴塞羅那至沙特首府利雅得的單程航行中,一架商用噴氣飛機上收集的傳感器數據量將超過(guò)1PB。當用一次飛行的數據量乘以每天所有飛行的航班數,數據總量將非常驚人。
     
    多樣性
     
      一個(gè)普遍觀(guān)點(diǎn)認為,人們使用互聯(lián)網(wǎng)搜索是形成數據多樣性的主要原因,這一看法部分正確。然而,數據多樣性的增加主要是由于新型多結構數據,以及包括網(wǎng)絡(luò )日志、社交媒體、互聯(lián)網(wǎng)搜索、手機通話(huà)記錄及傳感器網(wǎng)絡(luò )等數據類(lèi)型造成。其中,部分傳感器安裝在火車(chē)、汽車(chē)和飛機上,每個(gè)傳感器都增加了數據的多樣性。
     
    高速
     
      高速描述的是數據被創(chuàng )建和移動(dòng)的速度。在高速網(wǎng)絡(luò )時(shí)代,通過(guò)基于實(shí)現軟件性能優(yōu)化的高速電腦處理器和服務(wù)器,創(chuàng )建實(shí)時(shí)數據流已成為流行趨勢。企業(yè)不僅需要了解如何快速創(chuàng )建數據,還必須知道如何快速處理、分析并返回給用戶(hù),以滿(mǎn)足他們的實(shí)時(shí)需求。
     
      根據IMS Research研究機構關(guān)于數據創(chuàng )建速度的調查,通過(guò)跟蹤可聯(lián)網(wǎng)設備的激活量,發(fā)現聯(lián)網(wǎng)設備增長(cháng)的第二波浪潮正在加速到來(lái)。本輪增長(cháng)后,將涌現更多新型可聯(lián)網(wǎng)設備增長(cháng)的浪潮。據預測,到2020年全球將擁有220億部互聯(lián)網(wǎng)連接設備。
     
    易變性
     
      大數據具有多層結構,這意味著(zhù)大數據會(huì )呈現出多變的形式和類(lèi)型。相較傳統的業(yè)務(wù)數據,大數據存在不規則和模糊不清的特性,造成很難甚至無(wú)法使用傳統的應用軟件進(jìn)行分析。傳統業(yè)務(wù)數據隨時(shí)間演變已擁有標準的格式,能夠被標準的商務(wù)智能軟件識別。目前,企業(yè)面臨的挑戰是處理并從各種形式呈現的復雜數據中挖掘價(jià)值。
     
    新型分析法
     
      “大數據”這一術(shù)語(yǔ)也與從數據中獲得價(jià)值所采用的分析法類(lèi)型相關(guān)。由于出現從既有及新興數據類(lèi)型中獲得商業(yè)智能的需求,對現有應用系統造成極大壓力,迫使企業(yè)尋求新的解決方案。創(chuàng )建新的分析應用進(jìn)行多結構數據分析,通常需要進(jìn)行專(zhuān)業(yè)資源和工具的戰略性投資。
     
      對于企業(yè),大數據既是機遇也是威脅。那些能夠管理復雜數據并從中獲得精準商業(yè)洞察力的企業(yè)將擁有超越競爭對手的重要優(yōu)勢。反之,那些不能精明管理數據的企業(yè)將在競爭中處于劣勢。

    相關(guān)閱讀:

    分享到: 收藏

    專(zhuān)題

    亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 同心县| 建阳市| 信阳市| 平乡县| 绩溪县| 兴安盟| 敖汉旗| 盐津县| 比如县| 沂水县| 泽州县| 大荔县| 玉山县| 旬阳县| 恩平市| 望都县| 廉江市| 丹凤县| 靖州| 淄博市| 宜昌市| 荥经县| 靖州| 正定县| 临洮县| 西乌| 山阴县| 两当县| 理塘县| 虞城县| 秭归县| 舒兰市| 平遥县| 温泉县| 富源县| 邵阳县| 会昌县| 宁夏| 资溪县| 台南市| 绩溪县| http://444 http://444 http://444 http://444 http://444 http://444