“從騰訊來(lái)看,華為服務(wù)器的技術(shù)和服務(wù)優(yōu)勢非常明顯。首先華為服務(wù)器有很強的研發(fā)實(shí)力,全部是自研產(chǎn)品,能夠支撐騰訊的定制化需求在產(chǎn)品中快速實(shí)現,并且產(chǎn)品可靠性很高;然后就是服務(wù)積極響應,硬件產(chǎn)品難免出故障,出現故障積極響應,快速處理,華為在這一點(diǎn)做的很好。”
---- 騰訊
客戶(hù)簡(jiǎn)介
騰訊是亞洲最大、全球第三大互聯(lián)網(wǎng)企業(yè)(僅次于谷歌和亞馬遜)。騰訊是用戶(hù)最多的中國互聯(lián)網(wǎng)企業(yè),也是中國首家市值超1000億美元的互聯(lián)網(wǎng)公司。旗下分為游戲、社區、媒體、電商等6大業(yè)務(wù),各業(yè)務(wù)在中國互聯(lián)網(wǎng)均處于Top1~3的地位,在中國互聯(lián)網(wǎng)基本占據統治地位。
業(yè)務(wù)挑戰
為支撐龐大的互聯(lián)網(wǎng)業(yè)務(wù),騰訊現網(wǎng)的服務(wù)器總數已超過(guò)30萬(wàn)臺,近年服務(wù)器采購量接近中國市場(chǎng)總量的10%。
騰訊每年電費支出超過(guò)10億人民幣,能耗成本是運營(yíng)成本中很大的一部分,綠色節能成為服務(wù)器關(guān)注的重點(diǎn)之一。另外騰訊服務(wù)器很大一部分部署在運營(yíng)商機房,運營(yíng)商按機柜收費,機柜的租金也是運營(yíng)成本中不小的投入。
服務(wù)器承載著(zhù)騰訊的生產(chǎn)系統,服務(wù)器停機會(huì )導致業(yè)務(wù)性能下降或暫停,造成巨大的直接和潛在收入損失,所以服務(wù)器穩定性至關(guān)重要。
互聯(lián)網(wǎng)用戶(hù)需求是浪涌式,滿(mǎn)機柜20臺服務(wù)器的部署時(shí)間需要5小時(shí)以上,嚴重制約了業(yè)務(wù)的上線(xiàn)進(jìn)度。由于業(yè)務(wù)快速發(fā)展及全業(yè)務(wù)運營(yíng)的開(kāi)展,騰訊各業(yè)務(wù)部門(mén)服務(wù)器規格不一,同一時(shí)間竟有28種規格配置,為選型測試、運維管理、采購預測提出了極大挑戰,亟待優(yōu)化IT架構,并滿(mǎn)足未來(lái)業(yè)務(wù)平滑演進(jìn)和靈活部署的要求。
解決方案
華為與騰訊自2008年在服務(wù)器領(lǐng)域展開(kāi)全面合作,華為向騰訊提供了1U/2U機架服務(wù)器、刀片服務(wù)器、高密服務(wù)器、機柜服務(wù)器等全系列服務(wù)器產(chǎn)品。華為服務(wù)器從性能、能耗、部署等各項指標均很好的滿(mǎn)足甚至超越了騰訊的苛刻要求。
優(yōu)化設計、綠色節能
為降低服務(wù)器規模部署帶來(lái)的高功耗問(wèn)題,華為與騰訊成立聯(lián)合創(chuàng )新團隊,獲取到幾年內騰訊的詳細運維數據,經(jīng)分析,服務(wù)器的平均利用率只有25%,其中Web接入服務(wù)器的利用率只有15%。為此,華為提出優(yōu)化方案:
1.使用更低能耗的Workstation CPU代替Server CPU,使得Web接入服務(wù)器功耗降低一半,部署密度提高一倍,整體運營(yíng)成本降低25%。
2.由于服務(wù)器大部分擴展功能從未使用,剔除這部分特性后,功耗降低10%。
優(yōu)選部件、降低故障率
統計近兩年的故障維護數據,發(fā)現服務(wù)器的故障率一直居高不下,詳細分析發(fā)現主要原因是復雜多樣的機型配置導致無(wú)法對每一種配置進(jìn)行深度優(yōu)化。為此,在機型歸一化之初,聯(lián)合創(chuàng )新團隊就把嚴格控制故障率作為首要任務(wù),華為對容易發(fā)生故障的部件做詳細分析和深度優(yōu)化,優(yōu)選電信級部件,很好的控制了故障率,使得故障率降低了50%。
歸一化架構、提高部署密度
自2008年起,華為與騰訊的聯(lián)合團隊詳細分析討論了現有28種配置的差異和共性,在最大化滿(mǎn)足業(yè)務(wù)個(gè)性需求的前提下,突出共性特征,將配置從將28種歸一化到5種,極大的優(yōu)化了機型配置,使得服務(wù)器選型測試部、運維部和采購部的工作量大幅降低,工作內容更加聚焦,同時(shí)使得服務(wù)器的故障率大幅降低。同時(shí),聯(lián)合創(chuàng )新團隊充分考慮IT架構的靈活性和未來(lái)的平滑演進(jìn)性,從1U、2U服務(wù)器歸一化到2U機箱、多種節點(diǎn),再到后續的機柜服務(wù)器,所有節點(diǎn)平滑演進(jìn),多種不同配置的節點(diǎn)共用機箱、電源系統和接口,保持技術(shù)的延續性,同時(shí)保護用戶(hù)投資。
一體化交付、簡(jiǎn)化管理
以往客戶(hù)每種配置機箱不統一,機房無(wú)法提前布線(xiàn),服務(wù)器到貨安裝時(shí)才能對機柜進(jìn)行布線(xiàn),部署效率極低。經(jīng)過(guò)優(yōu)化,將所有機型歸一化到2U機箱,不同配置使用不同的節點(diǎn),機柜布線(xiàn)在機房建設時(shí)即可提前部署,服務(wù)器到貨安裝時(shí)只需要插好電源、網(wǎng)線(xiàn),部署效率大幅提高。傳統服務(wù)器大多是前后維護,故障燈在前面,而多數接口在后面,對于成百上千個(gè)機柜、數千臺服務(wù)器的大機房,這種后維護方式帶來(lái)效率極低,甚至實(shí)際中發(fā)生多次搞錯機器的情況。為此,華為服務(wù)器支持前維護功能,特別是X6000服務(wù)器,所有節點(diǎn)操作均是前維護,給日常維護工作帶來(lái)極大便利。
客戶(hù)收益
截至2013年底,超過(guò)10萬(wàn)臺華為服務(wù)器部署在騰訊現網(wǎng)業(yè)務(wù)中,成為騰訊最大的服務(wù)器供應商。華為服務(wù)器不僅滿(mǎn)足了騰訊當前的建設需求,而且也很好的適應了后續的業(yè)務(wù)發(fā)展需要。
1.成本節省過(guò)億:高密度部署節省機房空間50%,功耗減低15%,每年成本節省過(guò)億元
2.最低的故障率:電信級部件、優(yōu)秀設計和制造工藝,有效解決了批次性故障問(wèn)題,華為服務(wù)器在騰訊的統計中故障率最低
3.部署、管理效率大幅提升:滿(mǎn)機柜20臺服務(wù)器的部署時(shí)間由原先5小時(shí)降低到現在10分鐘; 故障自動(dòng)發(fā)現和自動(dòng)上報,帶來(lái)運維的極大方便。
回首整個(gè)項目運作歷程以及華為服務(wù)器在實(shí)際運行中的良好表現,騰訊對此評價(jià)道:
“從騰訊來(lái)看,華為服務(wù)器的技術(shù)和服務(wù)優(yōu)勢非常明顯。首先華為服務(wù)器有很強的研發(fā)實(shí)力,全部是自研產(chǎn)品,能夠支撐騰訊的定制化需求在產(chǎn)品中快速實(shí)現,并且產(chǎn)品可靠性很高;然后就是服務(wù)積極響應,硬件產(chǎn)品難免出故障,出現故障積極響應,快速處理,華為在這一點(diǎn)做的很好。”