全球已步入大數據時(shí)代,作為繼云計算后的新一代信息技術(shù),大數據技術(shù)和產(chǎn)業(yè)的發(fā)展和應用已經(jīng)對政府、企業(yè)決策和人們的生活方式產(chǎn)生深遠的影響。
當前,各種大數據存產(chǎn)品和面向各行業(yè)的大數據應用層出不窮,急需通過(guò)標準化的途徑規范認知,整合資源,促進(jìn)各方達成共識,為我國大數據產(chǎn)業(yè)的健康發(fā)展打下基礎,為數據安全應用提供保障,同時(shí)促進(jìn)大數據交易等新興服務(wù)模式規范發(fā)展。加強大數據標準化研制工作,對推動(dòng)我國大數據產(chǎn)業(yè)進(jìn)程,加快技術(shù)與標準的相互融合,落實(shí)大數據國家戰略具有重要意義。
自2012年起,ITU-T、ISO/IEC、CCSA等國內外標準化組織相繼開(kāi)展大數據標準化工作,目前已發(fā)布了多項大數據標準。本文從大數據標準體系框架出發(fā),介紹了當前國內外大數據標準化領(lǐng)域的重點(diǎn)方向及取得的成果,并分析了這些方向未來(lái)的標準化發(fā)展方向。
大數據標準化體系框架
標準化工作需要科學(xué)的頂層設計,大數據標準化也不例外。制定體現大數據技術(shù)特點(diǎn)的、完善的標準體系框架對制定高質(zhì)量、體系化的大數據標準至關(guān)重要。基于這一認識,在工信部和國標委的領(lǐng)導下,我國在2014年成立了全國信息技術(shù)標準化技術(shù)委員會(huì )大數據標準工作組(以下簡(jiǎn)稱(chēng)“信標委大數據標準工作組”),統籌開(kāi)展我國大數據標準化工作。該工作組結合國內外大數據標準化情況、國內大數據技術(shù)發(fā)展現狀、大數據參考架構及標準化需求,提出了我國的大數據標準體系框架。
該大數據標準體系總體上由七個(gè)類(lèi)別的標準組成,分別為:基礎標準、數據標準、技術(shù)標準、平臺和工具標準、管理標準、安全和隱私標準、行業(yè)應用標準。
在大數據不同的發(fā)展階段,有著(zhù)不同的標準化需求與工作重點(diǎn)。總的來(lái)說(shuō),在標準化的起步階段,以術(shù)語(yǔ)、參考架構等基礎性標準為研究重點(diǎn)。而隨著(zhù)大數據技術(shù)的發(fā)展和應用的普及深入,其它類(lèi)別的標準的重要性也不斷顯現出來(lái),同時(shí)不同國家的標準化重點(diǎn)也會(huì )有不同側重。例如,隨著(zhù)“中國制造2025”規劃的提出,工業(yè)大數據相關(guān)應用在我國呈現出快速發(fā)展的勢頭,相應的與工業(yè)大數據相關(guān)的標準化工作也成為行業(yè)應用標準的熱點(diǎn)。
當前國內外大數據標準化熱點(diǎn)領(lǐng)域
(1)基礎標準
基礎標準為整個(gè)標準體系提供包括總則、術(shù)語(yǔ)、參考模型等基礎性標準,是整個(gè)標準體系的基石,其重要性不言而喻。在這一領(lǐng)域,ISO/IEC制定了ISO/IEC 20546—《信息技術(shù)-大數據-概覽與術(shù)語(yǔ)》以及ISO/IEC 20547—《信息技術(shù)-大數據-參考架構》系列標準,參考架構系列標準包括框架與應用、用例與需求、參考架構、安全和隱私、標準化路線(xiàn)圖等5個(gè)分冊,作為大數據基礎性標準考慮得相當全面。而ITU-T的SG13也發(fā)布了ITU-T Y.3600—《基于云計算的大數據需求與能力》,作為該研究組大數據系列標準的基礎,該標準定義了大數據生態(tài)系統中的相關(guān)角色及其活動(dòng),并規范了基于云計算的大數據的需求和能力。遺憾的是,ISO/IEC與ITU-T這兩大國際標準化組織并沒(méi)有像當初制定云計算標準時(shí)那樣聯(lián)合制定術(shù)語(yǔ)和參考架構這樣的基礎性標準,聯(lián)合制定的標準無(wú)疑具備更大的影響力和更高的可參考性。在國內,信標委大數據標準工作組也發(fā)布了《信息技術(shù) 大數據 術(shù)語(yǔ)》和《信息技術(shù) 大數據 技術(shù)參考模型》等基礎性標準。可以說(shuō),在基礎標準方面,國內外都已取得了相當多的成果,為大數據標準工作的進(jìn)一步發(fā)展打下了良好的基礎。
(2)數據標準
數據標準主要針對底層數據相關(guān)要素進(jìn)行規范。包括數據資源和數據交換共享兩部分,其中數據資源包括元數據、數據元素、數據字典和數據目錄等,數據交換共享包括數據交易和數據開(kāi)放共享相關(guān)標準。
大數據的核心價(jià)值在于對多個(gè)不同來(lái)源的數據進(jìn)行關(guān)聯(lián)分析,因此包括數據交易、數據開(kāi)放共享在內的相關(guān)標準就顯得尤為重要。只有參與方遵循共同的標準,數據的交易與開(kāi)放共享才能更為高效。在這一領(lǐng)域,ITU-T已發(fā)布了Y.3601—《大數據-數據交換框架與需求》,同時(shí)以此為基礎正在制定《大數據-數據溯源需求》、《大數據-數據集成概覽和功能需求》、《大數據-數據保留概覽與需求》、《大數據-元數據框架與概念模型》等一系列數據標準。而在國內,由于政務(wù)信息開(kāi)放、貴陽(yáng)大數據交易所成立等事件的驅動(dòng),數據資源和數據交換共享標準成為數據標準領(lǐng)域的熱點(diǎn),包括《信息技術(shù) 大數據開(kāi)放共享》系列標準(包括總則、政府數據開(kāi)放共享基本技術(shù)要求、開(kāi)放程度評價(jià)、政府資源目錄體系等多個(gè)分冊)、《信息技術(shù) 數據交易服務(wù)平臺》系列標準(包括通用功能要求、交易數據描述等)在內的多個(gè)標準正在研制,未來(lái)還將研制大數據開(kāi)放數據集基本要求和標識管理,數據交易的交易流程、數據管理、風(fēng)險評估及交易質(zhì)量評估等方面的標準。
(3)管理標準
管理標準作為數據標準的支撐體系,貫穿于數據生命周期的各個(gè)階段,主要對數據管理、運維管理和評估三個(gè)層次進(jìn)行規范。
數據是企業(yè)的寶貴資產(chǎn)已成為業(yè)內共識,但如何對數據資產(chǎn)進(jìn)行有效管理目前還處在非常原始的階段,業(yè)界急需數據資產(chǎn)管理標準對相關(guān)工作進(jìn)行規范指導。ITU-T SG16在今年7月剛剛立項了一個(gè)國際標準《數據資產(chǎn)管理框架》,該標準主要定義了數據資產(chǎn)的基本概念,梳理了數據資產(chǎn)管理的需求,提出了數據資產(chǎn)管理的框架。在國內,CCSA成立了大數據技術(shù)標準推進(jìn)委員會(huì )(CCSA TC601),其中的數據資產(chǎn)管理工作組專(zhuān)門(mén)從事數據資產(chǎn)管理方面的標準化研究工作,已發(fā)布了《數據資產(chǎn)管理實(shí)踐白皮書(shū)(2.0)》,目前正在編寫(xiě)3.0版本。未來(lái)TC601將繼續進(jìn)行主數據、數據標準和數據質(zhì)量等標準制訂,并研究數據資產(chǎn)管理評估的模型。
(4)安全和隱私標準
數據安全和隱私保護作為數據標準體系的重要部分,貫穿于整個(gè)數據生命周期的各個(gè)階段。
大數據安全雖仍繼承了傳統數據安全保密性、完整性和可用性等特性,但也有其特殊性,主要表現在個(gè)人隱私保護、跨境數據流動(dòng)等方面。歐盟于今年5月頒布的《通用數據保護條例》(General Data Protection Regulation,簡(jiǎn)稱(chēng)GDPR),也進(jìn)一步凸顯了大數據時(shí)代數據隱私保護的重要性。
在安全標準領(lǐng)域,ITU-T SG17正在制定多個(gè)大數據安全國際標準,包括《移動(dòng)互聯(lián)網(wǎng)服務(wù)中大數據分析的安全需求與框架》、《大數據即服務(wù)的安全指南》、《大數據基礎設施及平臺的安全指南》、《電信大數據生命周期管理安全指南》等。而在國內,全國信息安全標準化技術(shù)委員會(huì )下設了大數據安全標準特別工作組(SWG-BDS),專(zhuān)門(mén)進(jìn)行大數據相關(guān)標準的研究,目前已發(fā)布了《信息安全技術(shù) 個(gè)人信息安全規范》、《信息安全技術(shù) 大數據服務(wù)安全能力要求》兩項國家標準,同時(shí)還在制定《大數據安全管理指南》、《個(gè)人信息安全影響評估指南》、《個(gè)人信息去標識化指南》、《數據安全能力成熟度模型》、《數據交易服務(wù)安全要求》、《數據出境安全評估指南》等多項國家標準。下一步,該工作組將重點(diǎn)開(kāi)展大數據安全參考框架、個(gè)人信息安全、數據交換共享相關(guān)安全以及大數據安全檢測評估相關(guān)標準的研制。
(5)行業(yè)應用標準
行業(yè)應用類(lèi)標準主要是針對大數據為各個(gè)行業(yè)所能提供的服務(wù)角度出發(fā)制定的規范。該類(lèi)標準指的是各領(lǐng)域根據其領(lǐng)域特性產(chǎn)生的專(zhuān)用數據標準,包括工業(yè)、政務(wù)、服務(wù)等領(lǐng)域。
由于這一領(lǐng)域的標準針對性較強,因此國際標準組織較少涉及這一領(lǐng)域,而同樣也由于其較強的針對性和指導作用,國內熱點(diǎn)行業(yè)的標準化工作則比較活躍。尤其是在工業(yè)大數據領(lǐng)域,信標委大數據標準工作組下設工業(yè)大數據專(zhuān)題組,制定中的國家標準包括《信息技術(shù) 大數據 工業(yè)應用參考架構》、《信息技術(shù) 大數據 產(chǎn)品要素基本要求》、《智能制造 對象標識要求》、《智能制造 制造對象標識解析體系應用指南》。CCSA TC601也成立了工業(yè)大數據工作組,進(jìn)行相關(guān)標準的研究。其它比較活躍的行業(yè)還有政務(wù)領(lǐng)域,信標委大數據標準工作組同樣下設政務(wù)大數據專(zhuān)題組,CCSA TC601也成立了政務(wù)大數據工作組。
結語(yǔ)
中國信科集團旗下大唐電信科技股份有限公司(簡(jiǎn)稱(chēng):大唐電信)作為業(yè)界領(lǐng)先的行業(yè)應用解決方案提供商,多年來(lái)一直積極參與國內外的標準化工作,提升了公司在行業(yè)的知名度和影響力。目前,在云計算、大數據領(lǐng)域,公司已成功主導發(fā)布了4項國際標準和1項行業(yè)標準,同時(shí)還有4項國際標準和1項行業(yè)標準正在制定中。未來(lái),大唐電信將持續加大在國際標準化尤其是大數據標準化工作的投入,與業(yè)內同仁通力合作,為大數據產(chǎn)業(yè)的健康發(fā)展貢獻自己的力量。