她擁有全國最大的數字化節目?jì)热菝襟w資源庫,是全國最大的互動(dòng)電視和3G手機電視內容提供商;她擁有IPTV運營(yíng)牌照和3G手機電視全國集成運營(yíng)牌照,并在杭州擁有超過(guò)200萬(wàn)數字電視用戶(hù);她同時(shí)還是國家發(fā)改委媒體云重大項目的全國唯一承建單位。
不錯,她就是位于杭州的華數數字電視傳媒集團,這家跨網(wǎng)絡(luò )、跨媒體、跨應用的數字電視與新傳媒運營(yíng)企業(yè)在上個(gè)月剛剛登陸國內資本市場(chǎng),掀起了廣電行業(yè)省網(wǎng)整合的新一輪序幕。
但在這篇文章中,我們并不會(huì )討論華數傳媒在資本市場(chǎng)上的表現,也不會(huì )討論廣電行業(yè)的整合,而是從華數企業(yè)內部IT基礎架構的細節入手,看看華數是如何應云而動(dòng)隨云而起。為此,在上個(gè)月,C114中國通信網(wǎng)編輯對華數傳媒網(wǎng)絡(luò )技術(shù)副總裁朱素平和運維總監姚軍進(jìn)行了專(zhuān)訪(fǎng)。華數傳媒網(wǎng)絡(luò )是華數集團旗下專(zhuān)業(yè)從事數字電視網(wǎng)絡(luò )運營(yíng)與新傳媒發(fā)展的運營(yíng)企業(yè),是華數系主力上市平臺之一。
應云而動(dòng)
在朱素平看來(lái),華數傳媒在云計算方面的探索和成績(jì),之前更多的是被業(yè)務(wù)推著(zhù)走。“我們的業(yè)務(wù)分布非常廣泛,而且不同的業(yè)務(wù)板塊對于IT支撐能力的需求特性差別也很大。除了傳統的廣電行業(yè)業(yè)務(wù)外,華數還運營(yíng)著(zhù)有線(xiàn)和無(wú)線(xiàn)寬帶接入服務(wù),政府電子政務(wù)信息化平臺支撐等。”
業(yè)務(wù)跨度大、伸縮性強的特征對華數傳媒的IT基礎架構能力提出了很大的挑戰。“所以我們在2010年就開(kāi)始進(jìn)行云計算方面的嘗試,希望能夠通過(guò)對底層IT基礎架構云化以及云管理系統搭建,提升IT使用效率,實(shí)現對業(yè)務(wù)的靈活快速響應,降低整體成本。”朱素平說(shuō)。
據他介紹,華數傳媒在云計算方面的拓展已經(jīng)取得了不錯進(jìn)展,在基礎設施、云平臺和云應用三個(gè)層面都有著(zhù)明確布局。“在基礎設施上,我們成立了獨立的數據中心公司,對所有平臺進(jìn)行運營(yíng)支撐,并引入了外部資本,作為未來(lái)獨立發(fā)展的一條脈絡(luò );在云平臺上,初步形成了媒體云、轉碼云、游戲云和服務(wù)云四個(gè)平臺;在應用層面,則包括視頻、音樂(lè )、游戲、購物、支付、信息和閱讀等九大應用。”
其中,轉碼云主要承載視頻轉碼服務(wù),“因為華數本身是非常大的內容生產(chǎn)和制作公司,每天大概會(huì )有15T-20T左右的節目量,會(huì )涉及到非常多的格式和碼率,因為這些內容會(huì )面向非常多的平臺和終端,不同的廣電運營(yíng)商互相之間都會(huì )有差異,所以對節目生產(chǎn)的要求會(huì )非常高。”
應用云則主要是華數的業(yè)務(wù)系統和WEB類(lèi)應用等,“這是我們現在跟英特爾項目合作的重點(diǎn),我們所有應用系統,包括Web類(lèi)應用和業(yè)務(wù)系統全部都承載在應用云上。”而服務(wù)云則是基于云服務(wù)加瘦客戶(hù)端的探索。“現在大家比較知道的概念是云游戲,比如美國的Onlive、Gaikai,通過(guò)把游戲本身的控制從客戶(hù)端化變成一個(gè)視頻流分發(fā)下去,客戶(hù)端只做解碼,這是我們在云游戲上的積極探索。”
服務(wù)云的應用前景可遠不止云游戲本身。“廣電行業(yè)大概有2000多萬(wàn)存量機頂盒上,我們希望把它變成一個(gè)瘦客戶(hù)端,通過(guò)瘦客戶(hù)端可以加載一些復雜的應用。比如以前可能由于終端能力所限能加載的服務(wù)非常有限。我們通過(guò)服務(wù)云的模式,我們能讓它加載互聯(lián)網(wǎng)上可以加載的所有應用,拓展增值業(yè)。”
據朱素平預計,國內至少有50%的現網(wǎng)機頂盒終端可以被改造成瘦客戶(hù)端。“當然,運營(yíng)企業(yè)肯定要對這種方案進(jìn)行技術(shù)和成本評估,是進(jìn)行云化改造合適還是直接更新機頂盒合適。”
但需要指出的是,華數并不是所有的業(yè)務(wù)應用都部署在IA架構上。“目前,包括計費系統等在內的核心BOSS系統還是部署在小型機上,現在的英特爾架構在計算能力和RAS特性上已經(jīng)可以和傳統小型機媲美,并在成本上有很大優(yōu)勢,但是由于原有的體系相對封閉,應用軟件等都是部署在小型機上。”朱素平說(shuō)。據他透露,華數在將來(lái)會(huì )逐步完成架構遷移。
隨云而起
在云計算平臺的搭建和后期運維上,華數傳媒運維總監姚軍的感受還是非常深刻。“這兩年業(yè)務(wù)發(fā)展非常快,但我們的技術(shù)平臺建設還是按照原來(lái)運營(yíng)商的模式搭建的,IT平臺能力很難跟上業(yè)務(wù)的需求。另外,在傳統的建設模式下,IT平臺普遍存在資源利用率低,資源調配困難。”
“我們最早還是用商用軟件解決方案,就遇到了兩個(gè)問(wèn)題,一是商用軟件在公司設備數量大量增加以后,整體成本比較高;二是對一些定制化的需求,商用軟件實(shí)現起來(lái)比較慢,這并不符合用戶(hù)的期望。”姚軍說(shuō)。“商用軟件要么是根據物理CPU計費,要么是簽署戰略框架。我們評估了一下,像華數這樣的設備數量,費用還是蠻高的。而如果采用開(kāi)源策略,不存在License費用,投入的只是開(kāi)發(fā)的費用。”
但完全開(kāi)源的系統還是面臨著(zhù)未知的技術(shù)風(fēng)險。“云現在很熱,拿開(kāi)源的東西隨便搞兩下也可以叫做云。當時(shí)我們也是想找一個(gè)商業(yè)公司合作,后來(lái)經(jīng)過(guò)比較長(cháng)時(shí)間的評估。一是覺(jué)得很多商業(yè)化的東西大同小異,沒(méi)有太多的特點(diǎn)。另外,我們自己的行業(yè)和應用環(huán)境有一些特殊的地方,我們可能更需要英特爾更深層次的支持。因為從虛擬化往云計算方向演進(jìn),最終更需要的是跟硬件更緊密的結合,反而是那些純云服務(wù)的軟件供應商和平臺供應商是做不了的。”
“我們今年跟英特爾一起合作做云平臺項目,主要想達成這三方面的目標,一是著(zhù)眼于開(kāi)源化的管理軟件,開(kāi)源化就要達到云基礎架構平臺,在上面疊加個(gè)性化的需求,包括流程、資源的申請和審批過(guò)程,最后要跟華數上端的APP做一些結合,更好的服務(wù)于應用。”姚軍說(shuō)。
據姚軍介紹,根據原定的時(shí)間表,雙方在3月份完成整體設計,8月份完成基礎平臺的代碼開(kāi)發(fā)和設計,隨后做一些華數的流程開(kāi)發(fā),審批流程和資源申請流程,定制化開(kāi)發(fā)要到12月份。“我們跟英特爾那個(gè)平臺現在已經(jīng)上線(xiàn),業(yè)務(wù)環(huán)境已經(jīng)開(kāi)始試用,規模已經(jīng)到了50臺的物理設備。今后的兩個(gè)月還會(huì )根據現在的運營(yíng)情況做優(yōu)化,大規模部署到數據中心中去。”
從姚軍對整體架構的介紹來(lái)看,最底層是基于英特爾的虛擬化硬件,中間是用KVM、Xen或者VMware ESXi技術(shù)做資源池,同時(shí)引入英特爾智能節點(diǎn)管理器(Node Manager),在監控軟件上則主要是集成,Nagios、Ganglia等開(kāi)源軟件。最上層是一些整體的管理功能和云平臺的高級功能,比如負載均衡、高可用、HA等。“我們也考慮這個(gè)平臺能支持其它的云管理平臺,現在目前主要支持Openstack的平臺,下一步要做支持對VMware新出來(lái)的云管理平臺的一些第三方支持。”
流程變革
云計算平臺的部署以及業(yè)務(wù)應用加載,給姚軍所領(lǐng)導的運維部門(mén)帶來(lái)了更大的挑戰,也催生了一系列的變革。“傳統運維下的設備基本上是按業(yè)務(wù)劃分的,就拿流量來(lái)說(shuō),運維人員對流量要非常敏感,以前某個(gè)業(yè)務(wù)的流量基本上是可控的。但引入虛擬化技術(shù)以后,流量模型、系統資源占用模型都會(huì )被全部打散,運維中心會(huì )變得完全不可控。”
現在大部分虛擬化平臺都具備自動(dòng)遷移功能,更是降低了運維可控性。云平臺部署以后,最大的挑戰是重新抓住可控性。這是通過(guò)多方面的,一是加強監控手段,二是加強標準規范;對部分于應用遷移進(jìn)行規劃,使其在控制范圍內。“以前設備分離,在保證總能力情況下,基本上不會(huì )有很大的問(wèn)題,現在就不太一樣了,運維人員對業(yè)務(wù)要更加敏感,這其實(shí)是今后整個(gè)運維當中最大的挑戰。”姚軍說(shuō)。
但在朱素平看來(lái),云計算的引入不但改變了運維部門(mén),也徹底改變了企業(yè)的業(yè)務(wù)生產(chǎn)和IT基礎架構的構建流程。“在傳統的運營(yíng)商或企業(yè)用戶(hù)中,運維和建設原來(lái)是分離的,界定是比較清晰的。項目建設部門(mén)立項,把硬件買(mǎi)回來(lái)之后,完成之后上線(xiàn),上線(xiàn)完之后交給運維部門(mén)做。這個(gè)流程在華數碰到的主要挑戰在于,它不適應整體業(yè)務(wù)應用發(fā)展的快速變化。”
“你做了云平臺之后,對于各個(gè)部門(mén)的角色變化是非常大的,意味著(zhù)項目建設沒(méi)有購買(mǎi)硬件的權利,系統運維部門(mén)需要第一時(shí)間關(guān)注建設項目的業(yè)務(wù)需求和能力,包括軟件本身的調試對硬件基礎設施的依賴(lài)。以前可能依賴(lài)項目組的外部團隊,現在可能要依賴(lài)整體云平臺運維。”
現在相當于軟件平臺建設部門(mén)只管軟件,對于所有的基礎網(wǎng)絡(luò )、存儲、操作系統等,我們會(huì )統一做好環(huán)境,軟件平臺只是在上面進(jìn)行部署,接下來(lái)繼續要做的工作,就是加強硬件對軟件的“管控”能力。“我可能要求軟件必須運行在我們的云平臺環(huán)境里,簡(jiǎn)化本身平臺的管理架構。”