12月13日消息,在由云基地主辦的“中關(guān)村大數據日”活動(dòng)上,中國聯(lián)通研究院副院長(cháng)黃文良介紹,“今年,中國聯(lián)通成功將大數據和Hadoop技術(shù)引入到‘移動(dòng)通信用戶(hù)上網(wǎng)記錄集中查詢(xún)與分析支撐系統’。截止到目前,我們已經(jīng)部署了4.5PB的存儲空間。其中,4.5PB的存儲分布在300個(gè)數據節點(diǎn)上,即每個(gè)節點(diǎn)配備15TB的存儲空間。如此一來(lái),系統每天有能力處理700億條上網(wǎng)記錄。”
中國聯(lián)通對大數據的探索源自于2010年中國聯(lián)通數據大集中策略的提出。2009年,中國聯(lián)通3G業(yè)務(wù)正式商用,提出“統一品牌、統一業(yè)務(wù)、統一包裝、統一資費、統一終端政策、統一服務(wù)標準”的“六個(gè)統一”策略。這意味著(zhù)中國聯(lián)通要走一條數據大集中的路線(xiàn)。
然而,數據大集中將使得中國聯(lián)通面臨著(zhù)不少挑戰。中國聯(lián)通信息化部總經(jīng)理柳博亮曾在公開(kāi)演講中指出挑戰來(lái)自五個(gè)方面,分別是大用戶(hù)量下的集中系統的處理能力,如何快速實(shí)現對市場(chǎng)變化需求的響應,支撐業(yè)務(wù)運營(yíng)的可靠性,與個(gè)性化業(yè)務(wù)的支持能力以及集中環(huán)境下的運維體系。
適逢大數據的出現,為聯(lián)通應對這些挑戰找到了一條途徑。2010年,中國聯(lián)通開(kāi)始著(zhù)手大集中的數據中心建設,同期引入Hadoop技術(shù)。目前,Hadoop被成功部署到中國聯(lián)通的“移動(dòng)通信用戶(hù)上網(wǎng)記錄集中查詢(xún)與分析支撐系統”。
黃文良表示,“我們之前很擔心一旦數據大集中,會(huì )出現用戶(hù)查詢(xún)響應速度慢等問(wèn)題,從而影響用戶(hù)感知。顯然,這對于保持用戶(hù)黏性顯然是不利的。如今引入Hadoop技術(shù)后,假如用戶(hù)查詢(xún)上網(wǎng)記錄,系統在1秒內便可呈現數據。”
“我們確確實(shí)實(shí)體會(huì )到,自己是分布式計算的受益者,是非結構化數據庫的受益者,更是大數據的受益者。”黃文良在本次活動(dòng)上獲得“大數據最佳實(shí)踐獎”之際由衷地說(shuō)道。
其實(shí)中國聯(lián)通并不是唯一一家吃“螃蟹”的運營(yíng)商。中國移動(dòng)可是說(shuō)是國內最早開(kāi)始Hadoop技術(shù)研發(fā)的運營(yíng)商。2007年3月,中國移動(dòng)啟動(dòng)“大云”計劃,當年7月,便利用閑置資源搭建第一個(gè)Hadoop平臺。而在中國移動(dòng)“大云”1.5產(chǎn)品總體架構中,分析型PaaS產(chǎn)品底層便是基于Hadoop數據存儲和分析平臺。目前,中國電信也正在進(jìn)行大數據技術(shù)的實(shí)驗室研究工作。