在2019國際超算大會(huì )(ISC’19)上,英特爾介紹了一系列英特爾以數據為中心的產(chǎn)品組合如何改變下一代高性能計算(HPC)系統,并推動(dòng)全行業(yè)向E級超算不斷發(fā)展的最新情況。

英特爾公司副總裁兼企業(yè)與政府事業(yè)部總經(jīng)理Rajeeb Hazra博士在2019年6月17日于德國法蘭克福舉行的2019國際超算大會(huì )上代表英特爾發(fā)表主題演講,介紹了英特爾最新的高性能計算產(chǎn)品和技術(shù)突破。
英特爾公司副總裁兼極限計算部門(mén)總經(jīng)理 Trish Damkroger 表示:“在當今以數據為中心的世界,英特爾將繼續推動(dòng)創(chuàng )新并不斷提升產(chǎn)品性能。我們的高性能計算解決方案產(chǎn)品組合 -- 包括英特爾 至強 鉑金9200處理器和英特爾 傲騰 數據中心級持久內存 -- 實(shí)現了前所未有的科學(xué)探索和發(fā)現。”
如今,先進(jìn)的高性能計算系統同時(shí)借助傳統的高性能計算數據分析和人工智能技術(shù),來(lái)高效處理最為復雜的科學(xué)問(wèn)題。然而隨著(zhù)高性能計算系統對計算性能的要求越來(lái)越高,內存帶寬日益成為一個(gè)瓶頸。在日前舉行的2019國際超算大會(huì )上,英特爾展示了其以數據為中心的產(chǎn)品組合如何通過(guò)將高性能計算數據分析和人工智能加速整合到一個(gè)單一的計算環(huán)境中,并提供新的內存和存儲模式為計算引擎提供支持,進(jìn)而解決高性能計算系統面臨的獨特挑戰。
當前,英特爾以數據為中心的產(chǎn)品組合為系統架構師提供了構建先進(jìn)計算系統的根基,賦能這些系統能夠傳輸、存儲和處理海量數據。針對那些對計算性能有著(zhù)最高要求的系統,英特爾近日還宣布,包括Atos*、慧與(HPE)*、聯(lián)想*、Penguin Computing*、Megware*等在內的一些指定OEM廠(chǎng)商以及經(jīng)過(guò)授權的英特爾經(jīng)銷(xiāo)商目前已開(kāi)始出貨基于英特爾 至強 鉑金9200處理器的預配置系統。作為第二代英特爾 至強 可擴展處理器產(chǎn)品系列的延續,英特爾 至強 鉑金9200處理器系列為廣泛的工作負載和用途提供領(lǐng)先的性能,諸如科學(xué)模擬、財務(wù)分析、人工智能/深度學(xué)習、3D建模與分析、密碼學(xué)和數據壓縮等場(chǎng)景。英特爾 至強 鉑金9200處理器集成了英特爾 深度學(xué)習加速(英特爾DL Boost)技術(shù),其人工智能性能相比上一代發(fā)布的至強 可擴展處理器提高多達30倍。[1]
在2019國際超算大會(huì )上,英特爾還與歐洲中期天氣預報中心(ECMWF)*、愛(ài)丁堡大學(xué)并行計算中心(EPCC)*[4]、富士通*、斯洛文尼亞IT服務(wù)提供商Arctur*以及NEXTGenIO項目[2]中的其它合作伙伴公布了多項不同超算應用項目中使用英特爾 傲騰 數據中心級持久內存獲得的最新突破性性能。
歐洲中期天氣預報中心(ECMWF)將其Fields Database(保存中期天氣預測的氣象數據)存儲于持久內存并分布在多個(gè)計算節點(diǎn)上之后,獲得了10倍[3]的更高帶寬。配備英特爾 傲騰 數據中心級持久內存的計算節點(diǎn)不僅加快了ECMWF的全球天氣預測,還減少了運行其模型所需的I/O節點(diǎn)數量。
Arctur高性能計算中心與巴塞羅那超算中心攜手合作,在模擬輕型電動(dòng)飛機的3D模型時(shí),獲得了2倍3的速度提升,并在16個(gè)節點(diǎn)上將其OpenFOAM運行時(shí)間縮短了50%[3]。
愛(ài)丁堡大學(xué)并行計算中心(EPCC)在配備英特爾 傲騰 數據中心持久內存的計算節點(diǎn)上運行代碼后,在CASTEP*材料科學(xué)應用上實(shí)現了2倍[3]的高吞吐量,加快了跨多個(gè)領(lǐng)域的材料科學(xué)研究。
此外,英特爾進(jìn)一步加快英特爾 傲騰 數據中心級持久內存在高性能計算系統中的應用,并宣布了一項針對超算推出的,利用英特爾 傲騰 數據中心級持久內存和分布式異步對象存儲(DAOS)的革命性全新存儲架構。其中,DAOS是一種提供高帶寬、低延遲和高I/O操作的開(kāi)源軟件定義橫向擴展對象存儲,專(zhuān)為高性能計算和人工智能工作負載的融合而設計。這一全新的軟件定義存儲引擎消除了目前并行文件系統中的若干局限性。
ALCF-X*項目總監/E級計算系統副總監Susan Coghlan表示:“阿貢領(lǐng)導力計算機構(ALCF)將作為‘極光’(Aurora)項目的一部分首次大規模生產(chǎn)部署DAOS存儲系統,到2021年,‘極光’(Aurora)將成為美國第一個(gè)E級計算系統。DAOS存儲系統旨在提供E級系統上的I/O密集型工作負載所需的元數據運算速度和帶寬。”
在2019國際超算大會(huì )上,英特爾還披露了其有關(guān)One API項目的更多信息。該項目將提供一個(gè)統一的編程模型,以簡(jiǎn)化多樣化計算架構上的應用開(kāi)發(fā)。同時(shí),英特爾的One API將基于行業(yè)標準和開(kāi)放規范,并可以與OpenMP*、MPI*和Fortran*等進(jìn)行交互操作。
[1] 配備英特爾 DL Boost獲得最高30倍的人工智能性能,對比了2017年7月發(fā)布的英特爾 至強 鉑金8180處理器。英特爾于2019年2月26日前進(jìn)行測試。平臺:Dragon rock 2 socket 英特爾 至強 鉑金9282(每個(gè)插槽56個(gè)核心),啟用超線(xiàn)程,啟用睿頻,總內存768 GB(24個(gè)插槽/ 32 GB/ 2933 MHz),BIOS:SE5C620.86B.0D.01.0241.112020180249,Centos 7 Kernel 3.10.0-957.5.1.el7.x86_64,深度學(xué)習框架:Intel? Optimization for Caffe版:https://github.com/intel/caffe d554cbf1, ICC 2019.2.187,MKL DNN版本:v0.17(commit hash:830a10059a018cd2634d94195140cf2d8790a75a),模型: https://github.com/intel/caffe/blob/master/models/intel_optimized_models/int8/resnet50_int8_full_conv.prototxt,BS=64,無(wú)數據層DummyData:3x224x224,56個(gè)實(shí)例/2個(gè)插槽,數據類(lèi)型:INT8 vs 英特爾于2017年7月11日前測試:2S英特爾 至強 鉑金8180 CPU @ 2.50GHz(28個(gè)核心),禁用超線(xiàn)程,禁用睿頻,通過(guò)intel_pstate驅動(dòng)程序把調速器設置到“高性能”,384GB DDR4-2666 ECC RAM。CentOS Linux版本7.3.1611 (Core),Linux內核3.10.0-514.10.2.el7.x86_64。固態(tài)盤(pán):英特爾 固態(tài)盤(pán)DC S3700系列(800GB,2.5in SATA 6Gb/s,25nm,MLC)。性能測量使用了:環(huán)境變量:KMP_AFFINITY=’granularity=fine, compact‘, OMP_NUM_THREADS=56, CPU Freq set with cpupower frequency-set -d 2.5G -u 3.8G -g performance。Caffe:(http://github.com/intel/caffe/),修訂版f96b759f71b2281835f690af267158b82b150b5c。推理使用“caffe time –forward_only”指令測量,訓練使用“caffe time”指令測量。對于“ConvNet”拓撲,使用了虛擬數據集。對于其它拓撲,數據存儲在本地存儲設備上并在訓練之前在內存中緩存。拓撲規格來(lái)自于 https://github.com/intel/caffe/tree/master/models/intel_optimized_models (ResNet-50)。英特爾C++編譯器17.0.2 20170213版,英特爾MKL小型函數庫2018.0.20170425版。Caffe與“numactl -l”運行。
[2] NEXTGenIO項目由671951號Grant Agreement下的歐盟Horizon 2020研究與創(chuàng )新項目進(jìn)行資助。
[3] 系統配置細節由EPCC提供:
34個(gè)配備英特爾至強可擴展處理器8260M CPU的DP節點(diǎn)(A0步進(jìn)),富士通主板
每個(gè)插槽96GB DDR4 DRAM(6×16 GB DIMMs,2666速度級),加1.5 TB英特爾傲騰數據中心級持久內存(6×256 GB DIMMs,QS)
雙軌Omni-Path網(wǎng)絡(luò )(每個(gè)節點(diǎn)2個(gè)OPA網(wǎng)卡),通過(guò)2個(gè)48端口OPA交換機連接
兩個(gè)運行Lustre的額外存儲服務(wù)器節點(diǎn)
[4] EPCC是愛(ài)丁堡大學(xué)先進(jìn)計算中心
關(guān)于英特爾
英特爾(NASDAQ: INTC)是全球半導體行業(yè)的引領(lǐng)者,以計算和通信技術(shù)奠定全球創(chuàng )新基石,塑造以數據為中心的未來(lái)。我們通過(guò)精尖制造的專(zhuān)長(cháng),幫助保護、驅動(dòng)和連接數十億設備以及智能互聯(lián)世界的基礎設施 -- 從云、網(wǎng)絡(luò )到邊緣設備以及它們之間的一切,并幫助解決世界上最艱巨的問(wèn)題和挑戰。如需了解更多信息,請訪(fǎng)問(wèn)英特爾中國新聞中心 newsroom.intel.cn 以及官方網(wǎng)站 intel.cn。