亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩,日本久久久久,日本-区二区三区免费精品,中文字幕日本亚洲欧美不卡

 首頁 > 新聞 > 國內 >

醫(yī)療大數據專家:淺談醫(yī)學大數據

2015-03-26 10:06:29   作者:   來源:36氪   評論:0  點擊:


  圖二

  由此可見有效的數據管理,數據庫建立及數據分析流程的重要性。傳統(tǒng)的數據管理的過程包括抽取(Extraction),轉換(Transformation)和載入(load)。通過 ETL,可以賦予數據一種合適恰當的結構用于特定的分析發(fā)現(xiàn)。具體數據準備分析流程如圖三所示:1)抽取單個或多個來源的數據 。2)凈化,格式化,標準化,聚合,添加,或遵循其他特定的數據處理規(guī)則。3)載入處理完的數據到特定的數據庫或儲存為特定的文件格式。4)采用各種方法進行數據分析。

  圖三

  ETL 的中心內容仍舊適用于大數據,但由于大數據的大量性和多樣性對數據庫和數據管理及處理方法的要求越來越高,也越來越復雜,這樣線性處理整個數據變得相當耗費人力,物力,和時間。

  此外,大數據的快速性,易變性也使得把數據儲存在單一的中央數據庫變的不太可行。 在這種情況下,最流行的思路是把數據分割處理,也就是把數據儲存到多個儲存節(jié)點(比如網絡數據庫),在每個節(jié)點單獨處理數據(甚至處理完就接著進行初步分析, 但處理的程度依客戶具體問題而調整),然后再匯總整合到一起,提供給單個或多個數據庫,接著根據需要選擇合適的分析方法獲取有用結果。ETL 貫穿于整個大數據管理分析的流程中。圖四演示了大致的大數據管理分析流程及一些大數據處理分析平臺工具的名字。

  圖四

  SAS的數據倉庫研究院(TDWI)針對現(xiàn)今存在的大數據處理分析平臺工具進行了一項調查以幫助人們在選擇軟硬件進行大數據分析時能做出更好的決策。針對大數據技術,特點,和使用者操作,調查提供了三個選擇:1)現(xiàn)在使用中,并且會繼續(xù)使用。2)會在三年中開始使用。3)沒有計劃使用。圖五左側顯示了對于各種大數據分析平臺工具,被調查人員的回復比例。圖五的右側顯示了平臺工具可能的潛在成長和對采用此工具做出承諾的被調查人員比例。

  圖五

  根據潛在成長和承諾的綜合考量,此調查還進一步把大數據分析平臺, 工具分成4組:第一組為適度的承諾,中度到強的成長潛力;第二組為中度至強有力的承諾,適度增長潛力;第三組為弱到中度的承諾,適度增長潛力;第四組為中度至強有力的承諾,弱增長潛力。圖六顯示了這些組別的內容分布。限于篇幅,本文不詳細介紹所列的每一平臺工具的具體內容,感興趣的讀者可以參考文獻獲取更詳細的介紹。

分享到: 收藏

專題

泽库县| 宿迁市| 浏阳市| 孟州市| 博乐市| 翁牛特旗| 剑川县| 射阳县| 千阳县| 沂南县| 会东县| 门源| 华安县| 上犹县| 金沙县| 桦甸市| 西乡县| 黑龙江省| 保定市| 龙州县| 乡宁县| 贞丰县| 临漳县| 天门市| 阳曲县| 威信县| 保亭| 庐江县| 瓮安县| 西青区| 梁山县| 荣成市| 临泉县| 滦平县| 哈密市| 武山县| 岐山县| 鄄城县| 灌云县| 托克托县| 佛冈县|