站在21年后的今天回望1999,無(wú)論對于汪建還是華大基因而言,都是具有里程碑意義的一年。這一年,作為“人類(lèi)基因組計劃”中國研究員之一的汪建,一手創(chuàng )立了華大基因。
自上世紀90年代初以來(lái),“基因”便成為人類(lèi)繞不開(kāi)的話(huà)題,學(xué)界更是從那時(shí)起開(kāi)始涉足“人類(lèi)基因組計劃”。
在你我或多或少都能談上一兩句“基因”的今天,基因已經(jīng)不再是那樣的新奇,它甚至關(guān)乎著(zhù)你我自身的健康。
秉承“基因科技造福人類(lèi)”的使命,懷抱“健康美麗,做生命時(shí)代的引領(lǐng)者”的愿景,華大基因以“產(chǎn)學(xué)研”一體化的發(fā)展模式引領(lǐng)基因組學(xué)的創(chuàng )新發(fā)展。然而,對于華大基因這樣的行業(yè)先行者而言,若想有一個(gè)更長(cháng)遠的未來(lái),解決算力瓶頸成為立足基因測序行業(yè)的必然選擇。
計算資源緊張的時(shí)候
任務(wù)排隊等候是“家常便飯”
01、隨著(zhù)業(yè)務(wù)規模的不斷擴大,既反映了華大基因不可撼動(dòng)的行業(yè)地位,同時(shí)也讓它遭受了“幸福的煩惱”——“基因測序”需要龐大的算力支持。
往大了說(shuō),如今的生命科學(xué)研究競賽,很多時(shí)候已經(jīng)變成了一場(chǎng)“算力”的比拼,好的科研成果通常基于龐大的計算數據和強大算力的支撐;往小了說(shuō),目前的產(chǎn)前檢測、腫瘤檢測等醫療檢測也需要消耗大量的算力。
作為全球領(lǐng)先的生命科學(xué)前沿機構,目前華大基因已經(jīng)完成HPV檢測總數超過(guò)420萬(wàn)例,完成耳聾基因檢測250余萬(wàn)例,完成無(wú)創(chuàng )產(chǎn)前檢測510多萬(wàn)例。
這些基因測序的流程中,動(dòng)輒涉及數萬(wàn)到數十萬(wàn)個(gè)基因測序及模型建立,依賴(lài)大量的計算和存儲資源,隨著(zhù)未來(lái)業(yè)務(wù)量的那一步擴展,將使華大基因的傳統IT架構面臨一定挑戰——計算資源緊張的使用峰值時(shí),任務(wù)排隊等候更是“家常便飯”。
02、除此之外,基因測序行業(yè)還有這樣的特點(diǎn),對于算力的需求是波動(dòng)的。通常情況下,第4季度的消耗最大而第1季度最少,這便導致了服務(wù)器的數量無(wú)法得到很好的控制。
如何調配服務(wù)器成為擺在華大基因這樣基因測序企業(yè)面前的一大難題。基因測序行業(yè)有很多復雜基因組,在各個(gè)測序分析的階段需要借助不同規格的計算資源,線(xiàn)下計算集群往往無(wú)法適應快速的擴縮容。
03、除此之外,線(xiàn)下集群架構不支持高通量基因測序數據的多任務(wù)并行,面對海量基因數據,每個(gè)基因測序都是一個(gè)極其消耗計算資源的過(guò)程,傳統的數據存儲和分析方式并不能支持高通量測序的需求。
面對基因測序行業(yè)困難與挑戰,華大基因該如何化解?

華為云讓華大基因
“云端暢游”,事半功倍
面對大量待測數據的挖掘、存儲、計算等都給基因測序行業(yè)帶來(lái)了全新的挑戰。系統逐步上云成為基因行業(yè)未來(lái)高速度、高質(zhì)量發(fā)展中不可缺少的重要一環(huán)。
2018年,針對基因測序行業(yè)的困難與挑戰,華為云推出了以Kubernetes為基礎的基因容器服務(wù)GCS(Gene Container Service)。通過(guò)華為云GCS-SGE容器方案,將基因測序和容器技術(shù)完美結合,可以幫助華大基因更好地解決新一代基因測序技術(shù)在應用過(guò)程中所產(chǎn)生的大量數據存儲、識別、計算等問(wèn)題。
為了更好地探索基因的奧秘和解決計算資源短缺等問(wèn)題,華大基因率先開(kāi)啟創(chuàng )新改革之路。“步入云端”后,華大基因既節省了測序時(shí)間,又針對測序算力需求波動(dòng),云端容器自主擴容,解決了峰值期客戶(hù)各部門(mén)排隊情況。
不僅如此,華為云GCS服務(wù)還為華大基因提供全自動(dòng)化測序分析能力、低成本高可靠的存儲服務(wù),通過(guò)計算存儲分離、內存及分布式緩存、智能調度等使大數據性能提升40%,成本降低50%。如今,華大科技服務(wù)已利用GCS-SGE方案完成超過(guò)300萬(wàn)核時(shí)計算,合作期間始終保持云端平穩運行。





看華為云五大“技能”為華大基因提供算力加持
回到最初的起點(diǎn),人們關(guān)心的仍然是“基因測序技術(shù)能否鎖定個(gè)人病變基因,提前預防和輔助治療”的問(wèn)題。因為,基因科技產(chǎn)業(yè)的發(fā)展一頭連著(zhù)經(jīng)濟發(fā)展,一頭連著(zhù)民生福祉。(延伸閱讀:預言只在科幻里?不,可能還在基因里)
近年來(lái),華為云也一直秉持“科技向善”的理念,華大基因與華為云的攜手,不僅以科技力量解碼基因測序,也為上述問(wèn)題的解決提供了更多的可能,進(jìn)而讓更多人從中獲益。
可以想象,在“云+AI+5G”等新技術(shù)的加持下,華大基因和華為云將繼續為基因乃至泛醫療行業(yè)的發(fā)展帶來(lái)更多想象空間。