亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩,日本久久久久,日本-区二区三区免费精品,中文字幕日本亚洲欧美不卡

您當前的位置是:  首頁 > 資訊 > 人物 >
 首頁 > 資訊 > 人物 >

梅宏院士等發(fā)布最新論文《大數據技術前瞻》指出大數據技術的四大挑戰(zhàn)與十大趨勢

2023-01-31 15:57:37   作者:   來源:通信世界網   評論:0  點擊:


  中科院院士梅宏聯合中國人民大學、華中科技大學、中科院計算技術研究所、中國科學院大學、北京理工大學多位專家,發(fā)布最新論文《大數據技術前瞻》。該文在計算體系重構的背景下,指出了大數據技術發(fā)展的四大技術挑戰(zhàn)和十大發(fā)展趨勢。

  新型大數據系統(tǒng)技術的四大挑戰(zhàn)

  挑戰(zhàn)一:如何構建數據為中心的計算體系

  全球大數據規(guī)模增長快速,2020年全球新增數據規(guī)模為64ZB,是2016年的400%,2035年新增數據將高達2140ZB1,大數據呈現指數級增長。隨著數字經濟的發(fā)展和數字化轉型的深入,愈來愈多的數據資源正以數據要素的形態(tài)獨立存在并參與數字經濟活動全過程。因此構建以數據為中心的新型計算體系,以適用新的應用環(huán)境。如何組織和管理超大規(guī)模的數據要素已經成為一項難題:例如,針對大數據管理,面臨數據跨域訪問帶來的各種問題、系統(tǒng)規(guī)模持續(xù)增大帶來的可用性下降、維護大規(guī)模數據帶來的成本和能耗持續(xù)增高等嚴峻挑戰(zhàn)。

  挑戰(zhàn)二:如何滿足大數據高效處理的需求

  數據規(guī)模呈指數級增長,數據動態(tài)傾斜、稀疏關聯、應用復雜,傳統(tǒng)大數據處理架構數據處理成本高企、時效性差,如何滿足規(guī)模海量、格式復雜、需求多變的大數據高效處理需求是大數據處理面臨的重要挑戰(zhàn)。

  挑戰(zhàn)三:如何實現多源異構大數據的可解釋性分析

  隨著數據量持續(xù)地爆炸式增長和各類應用的不斷拓展與深化,基于深度學習的主流方法因其僅關注單源單模態(tài)數據且模型只知其然不知其所以然的特性已無法滿足發(fā)展需求。如何打破數據多源異構造成的隔閡,融合多域甚至全域數據中蘊含的知識,實現分析結果的可解釋,從而提升其可用性,是當前大數據分析面臨的主要挑戰(zhàn)。

  挑戰(zhàn)四:如何形成系統(tǒng)化大數據治理框架與關鍵技

  針對大數據應用過程中的對數據匯聚融合、質量保障、開放流通、標準化和生態(tài)系統(tǒng)建設的需求,大數據治理技術逐漸成為發(fā)展熱點,然而當前系統(tǒng)化的大數據治理框架尚未形成,開放共享、質量評估、價值預測等關鍵技術遠未成熟,成為制約大數據發(fā)展的主要瓶頸。

  大數據技術十大未來發(fā)展趨勢

  趨勢一:數據與應用進一步分離,實現數據要素化

  數據從一開始是依附于具體應用的。數據庫技術的出現使得數據與應用實現了第一次分離。數據存儲在數據庫中,不再依賴具體的應用而存在。數據要素化的需求將推動數據與應用進一步分離,數據不再依賴于具體的業(yè)務場景,數據以獨立的形態(tài)而存在于數據庫中,并通過數據服務向不同的業(yè)務場景提供服務。例如,人口數據庫,可以向全部的涉及人口信息的業(yè)務場景提供服務。

  趨勢二:數聯網作為數字化時代的新型信息基礎設施

  將形成一套完整的數聯網基礎軟件理論、系統(tǒng)軟件架構、關鍵技術體系,包括:針對數聯網軟件以數據為中心的特點,需要從復雜網絡和復雜系統(tǒng)等復雜性理論出發(fā),研究數聯網軟件的結構組成、行為模式和外在性質;針對數聯網軟件的數據傳存算一體化需求,需要采用數據互操作技術和軟件定義思想,研究數聯網軟件運行機理、體系結構與關鍵機制;針對數聯網軟件跨層級、跨地域、跨系統(tǒng)運行帶來的可靠性、可用性、安全性等質量挑戰(zhàn),需要以數據驅動為手段,研究數聯網環(huán)境下保障服務質量與保護質量的原理、機制與方法。

  趨勢三:從單域到跨域數據管理,促進數據要素的共享與協(xié)同

  數據為中心計算的核心目標是數據價值的最大化,關鍵要打破“數據孤島”,實現數據要素的高效共享與協(xié)同。傳統(tǒng)數據管理局限在單一企業(yè)、業(yè)務、數據中心等內部,未來大數據管理將從傳統(tǒng)的單域模式發(fā)展到跨域模式,跨越空間域、管轄域和信任域。但跨空間域造成網絡時延較高且不穩(wěn)定;跨管轄域造成數據與應用異構,數據管理復雜度大大提升;跨信任域則要求具備容忍各類惡意錯誤的能力,跨域帶來的這些變化將為大數據技術帶來了新的機遇和挑戰(zhàn)。

  趨勢四:大數據管理與處理系統(tǒng)體系結構異構化日趨明顯

  體系結構創(chuàng)新進入“黃金十年”,圍繞不同數據處理特征的新型加速器(GPU、TPU、APU 等各種xPU)層出不窮,存儲器件快速發(fā)展,高速SSD、新型非易失內存、新型計算網絡等成為大數據處理系統(tǒng)的重要硬件配置,計算與存儲的融合趨勢明顯。為極大程度發(fā)揮數據管理能力,大數據管理系統(tǒng)在存儲、網絡、計算等硬件上最大化挖掘新型硬件的處理能力。在處理上針對不同數據處理需求,配置不同計算與存儲硬件成為大數據處理系統(tǒng)的主流架構。數據驅動的計算架構快速發(fā)展,從控制流到數據流到系統(tǒng)設計切換成為大數據處理系統(tǒng)從微觀到宏觀的重要體系結構設計理念。

  趨勢五:擴展性優(yōu)先設計到性能優(yōu)先設計

  數據規(guī)模急劇增長,大數據處理需求越來越走向深度價值挖掘,數據處理計算愈發(fā)密集,數據管理與處理的成本成為大數據管理與處理系統(tǒng)的重要考量因素,傳統(tǒng)“以擴展性優(yōu)先”的大數據處理系統(tǒng)設計將會被“以性能優(yōu)先”的系統(tǒng)設計所替代。Spark、Flink 等系統(tǒng)在大數據處理生態(tài)系統(tǒng)中的占有率明顯體現了這一趨勢,圖計算(圖加速器、圖計算框架等)、深度學習框架(Tensorflow、PyTorch 等)等領域專用大數據處理系統(tǒng)的崛起也是這一系統(tǒng)設計理念在技術生態(tài)上的表現。智能化數據管理、近似計算等新興管理與處理方法成為性能優(yōu)先設計的重要技術手段。

  趨勢六:近數處理成為突破大數據處理系統(tǒng)性能瓶頸的重要途徑

  存算一體類體系結構技術快速發(fā)展,新型SSD等新型存儲贏家功能愈發(fā)豐富,分布式計算系統(tǒng)邊緣能力迅速發(fā)展,以上三種體系結構技術發(fā)展為大數據近數處理提供了良好的發(fā)展契機。近數處理體現在“存儲上移”(如在GPU、FPGA 等計算設備上集成HBM)、“算力下沉”(如在DRAM 內存或者SSD 存儲設備上集成處理能力)、“分布擴展”(如在云、邊、端分布式處理數據,降低數據處理中心壓力)。

  趨勢七:從單域單模態(tài)分析到多域多模態(tài)融合,實現廣譜關聯計算

  傳統(tǒng)大數據分析技術大多僅聚焦于單一來源單一模態(tài)數據,而實際應用中往往要對來自不同來源不同模態(tài)(如文本、圖像、音視頻等)的數據進行聯合分析,從而實現不同來源與不同模態(tài)數據之間的信息互補。此外,諸多領域的大數據往往具有重要的時空屬性,當前研究對這類信息的利用還不太充分。因此,探究能夠跨模態(tài)關聯、跨時空關聯的廣譜關聯技術是大數據分析處理的一個重要趨勢。

  趨勢八:從聚焦關聯到探究因果,實現分析結果可解釋

  如何讓大數據分析模型更加穩(wěn)定且具有可解釋性,從而使其分析結果對用戶而言變得更加可信、更為可用最好還能具備一定的可回溯性是大數據分析面臨的巨大挑戰(zhàn)。雖然已有因果推斷與可解釋性分析技術取得了一定進展,但總體來說尚處于起步階段,離實際應用還有很長一段距離。因此,從關聯到因果也是未來大數據分析技術的重要研究方向。

  趨勢九:高能效大數據技術是可持續(xù)發(fā)展的關鍵

  全球大數據的持續(xù)高速增長,尤其是碳達峰、碳中和目標的提出,要求大數據技術棧必須走低碳高效、可持續(xù)發(fā)展的路線。例如云數據管理系統(tǒng)以資源共享、節(jié)能高效為主要特點,將是未來大數據管理的主要基礎形態(tài);在云數據管理基礎上的全國一體化高能效大數據管理,可以進一步由于算力和數據要素的大規(guī)模調度與流通,將成為未來大數據管理的主要方向,形成低碳發(fā)展新格局。

  趨勢十:大數據標準規(guī)范和以開源社區(qū)為核心的軟硬件生態(tài)系統(tǒng)將成為發(fā)展的重點

  隨著大數據在各個領域應用的迅速普及,標準化需求將不斷增長,與大數據流動融合、質量評估,及與行業(yè)、領域應用密切相關的大數據標準將成為發(fā)展重點。開源社區(qū)在大數據軟硬件生態(tài)建設中的地位不斷加強,對開源社區(qū)的主導權爭奪將成為各國技術、產品和市場競爭的重要戰(zhàn)場。

【免責聲明】本文僅代表作者本人觀點,與CTI論壇無關。CTI論壇對文中陳述、觀點判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。

相關閱讀:

專題

CTI論壇會員企業(yè)

庆云县| 辉县市| 大丰市| 沙田区| 蒙城县| 兴城市| 德阳市| 湘潭县| 宽城| 岚皋县| 大悟县| 稷山县| 习水县| 宁城县| 日照市| 冕宁县| 铅山县| 宁国市| 恩施市| 三门峡市| 西乡县| 区。| 天祝| 宜宾市| 四平市| 炎陵县| 阿拉善盟| 河津市| 炉霍县| 台东县| 西吉县| 南溪县| 宜兴市| 囊谦县| 宜黄县| 博罗县| 两当县| 嵊泗县| 平乐县| 马公市| 伊吾县|