
該項可信評估主要考察智算平臺的基礎資源、平臺、應用三層核心能力,監控運維、安全性、高可用與災備三大跨層能力,涉及基礎資源管理、數據管理、框架管理、算法管理、監控告警、日志審計、權限管理等能力項。
數字時(shí)代到來(lái),自動(dòng)駕駛、生命醫學(xué)、智能制造等領(lǐng)域發(fā)展迅速,超大規模人工智能(AI)模型和海量數據對算力需求不斷提高,智算平臺能夠幫助企業(yè)突破算力瓶頸,提高計算資源利用效率,滿(mǎn)足企業(yè)不斷增長(cháng)的高性能算力使用需求,成為云服務(wù)商新的發(fā)力點(diǎn)。
智算平臺的建設面臨著(zhù)眾多挑戰,國產(chǎn)化AI算力自主可控要求高,需加強技術(shù)攻關(guān),提高平臺的安全性;人工智能、科學(xué)研究以及元宇宙等新興領(lǐng)域快速崛起,對算力提出更多元化的要求;大規模分布式訓練、異構算力的統一管理和調度效率較低,新計算任務(wù)上線(xiàn)耗費大量時(shí)間;網(wǎng)管、云管多平臺共存,AI場(chǎng)景算力的統一分配和融合調度難度大。
天翼云緊跟市場(chǎng)需求,依托分布式架構的云底座和海量的計算、存儲、網(wǎng)絡(luò )資源打造智算平臺,具有自主可控、高性能、算力調度賦能、統一管理調度、產(chǎn)業(yè)賦能等優(yōu)勢。
①自主可控
打造國產(chǎn)化能力體系,適配昇騰、寒武紀等國產(chǎn)主流GPU芯片,適配海光、鯤鵬等各種國產(chǎn)服務(wù)器,構建自主可控的智算平臺。
②高性能底座
計算側提供GPU云主機、彈性裸金屬等高性能服務(wù)器;存儲側支持并行文件存儲、海量文件存儲、對象存儲等多種存儲形態(tài),提供百萬(wàn)級IOPS、亞毫秒級時(shí)延,支持豐富的大容量非結構化數據保存和分析場(chǎng)景;網(wǎng)絡(luò )側提供百GE RDMA。
③算力調度賦能
提供AI任務(wù)調度、異構算力調度、數據緩存加速、GPU虛擬化等能力,支持近萬(wàn)億級參數模型訓練規模、3D并行分布式訓練、推理加速引擎、數據加速等算力賦能調度能力,大大提升訓練速度和推理效率。
④統一管理調度
云上云下多算力數據中心可統一進(jìn)行管理調度,平臺提供標準化運營(yíng)計費、租戶(hù)管理、監控運維等能力。
⑤產(chǎn)業(yè)賦能
根據客戶(hù)的業(yè)務(wù)軟件特性,為數字政府、產(chǎn)業(yè)金融、高校科研等行業(yè)客戶(hù)提供風(fēng)險低、高性能、最佳性?xún)r(jià)比的實(shí)現方案。
天翼云智算平臺適用于城市治理、AI質(zhì)檢、搜索推薦、自動(dòng)駕駛、金融、科學(xué)研究等領(lǐng)域,大模型訓練與推理全場(chǎng)景支持,可提供人工智能應用所需算力服務(wù)、數據服務(wù)和算法服務(wù),通過(guò)算力的生產(chǎn)、聚合、調度和釋放,支撐產(chǎn)業(yè)創(chuàng )新聚集。
為了滿(mǎn)足更多場(chǎng)景更多元的算力需求,天翼云基于智算平臺和超算平臺融合打造解決方案,為企業(yè)提供更靈活、高性能、高性?xún)r(jià)比的算力服務(wù)。
“1”個(gè)底座:以“云+智”的體系為核心,提供云計算完整產(chǎn)品能力、超大規模超高性能底座、精細化運營(yíng)能力,為數字經(jīng)濟發(fā)展提供強有力的云底座支撐;
“2”個(gè)平臺:智算、超算平臺,滿(mǎn)足復雜業(yè)務(wù)場(chǎng)景需求;
“3”種部署形態(tài):智算、超算、智算超算融合三種交付形態(tài),實(shí)現不同場(chǎng)景靈活交付。
未來(lái),天翼云將繼續堅持智算平臺的自主研發(fā)與技術(shù)創(chuàng )新,推動(dòng)國家人工智能戰略實(shí)施,賦能實(shí)體經(jīng)濟實(shí)現動(dòng)能轉換,促進(jìn)人工智能科研等領(lǐng)域高質(zhì)量發(fā)展。