
從2007年開(kāi)始,大數據應用成為很多企業(yè)的需求,2012年興起并產(chǎn)生了大數據平臺,使用者主要是程序員;2013年到2017年間,數據逐漸增多,大數據平臺變成了融合大數據平臺,使用者從程序員變成數據管理員和數據分析師;從2018年開(kāi)始,大數據進(jìn)入企業(yè)數據智能新階段,普通的工程師也能輕松應用。
當數據越來(lái)越多,需求也越來(lái)越高,環(huán)境越來(lái)越復雜,分析處理的方式也多種多樣,這對平臺有了更高的要求。
華為FusionInsight就是迎合著(zhù)這種趨勢來(lái)開(kāi)發(fā)的一個(gè)混合負載的、開(kāi)放的、統一大數據平臺。
從HD、MPP DB到AI、數據智慧,FusionInsight平臺滿(mǎn)足四大場(chǎng)景需求
華為FusionInsight平臺圍繞大數據提供了系列產(chǎn)品,最主要的是與Hadoop兼容的開(kāi)源平臺FusionInsight HD、MPP DB平臺、數據挖掘和人工智能的平臺以及數據智慧的平臺。其中,FusionInsight HD是一個(gè)融合的大數據平臺,滿(mǎn)足各種用戶(hù)需求同時(shí)混合負載、開(kāi)放應用。

在企業(yè)當中,大數據平臺的主體是Hadoop平臺,其業(yè)務(wù)場(chǎng)景主要有離線(xiàn)處理、實(shí)時(shí)流處理、交互查詢(xún)或數據集市和實(shí)時(shí)檢索。這四個(gè)場(chǎng)景都是隨著(zhù)大數據的發(fā)展逐步出現的。
針對離線(xiàn)處理場(chǎng)景,FusionInsight HD由如下組件來(lái)實(shí)現:HDFS負責存儲所有數據;Yarn負責調度在離線(xiàn)平臺上運行的所有任務(wù),從數據加工、數據挖掘到數據分析;Mapreduce和Hive專(zhuān)門(mén)處理離線(xiàn)的具體任務(wù),其中Mapreduce處理非SQL類(lèi)、Hive處理SQL類(lèi),對應的有另外叫離線(xiàn)處理引擎的兩個(gè)組件——Spark和Spark SQL,作用與Mapreduce和Hive相同。借助上述組件,再加上數據采集組件(FusionInsight HD也提供了很多功能和組件),即可完成離線(xiàn)處理。
交互查詢(xún)場(chǎng)景通常需要在三秒內實(shí)現。FusionInsight HD的Elk提供交互查詢(xún)的引擎是存儲和查詢(xún)一體的組件,類(lèi)似于Hadoop的組件但是功能更強。數據的采集可以用華為提供的工具,也可以用第三方的工具。
流處理場(chǎng)景核心的要求就是快,所以也叫實(shí)時(shí)流處理,一般用時(shí)在4到5秒之內。FusionInsight HD滿(mǎn)足流處理方案主要是三個(gè)組件,Kafka接受數據做緩存,流處理的引擎——Spark Streaming與Fhink(前者速度相對較慢,但是成本偏低,后者成本稍高,但速度更快),Redis主要處理流處理之后的結果數據。
實(shí)時(shí)檢索場(chǎng)景常見(jiàn)于運營(yíng)商、銀行、公安等行業(yè),性能要求高,并發(fā)大,其查詢(xún)條件比較簡(jiǎn)單且相對固定。用華為FusionInsight HD來(lái)實(shí)現,主要是Hbase和Solr/ESX,兩個(gè)組件的組合可以滿(mǎn)足低時(shí)延、高并發(fā)并且查詢(xún)條件相對固定的檢索。
不論是合作伙伴還是客戶(hù),都可以在FusionInsight HD平臺上輕松地開(kāi)發(fā)出滿(mǎn)足四個(gè)業(yè)務(wù)場(chǎng)景的應用。
FusionInsight HD組件中的6大特色
FusionInsight HD有鮮明的特色。
1、統一的SQL接口
華為統一的SQL接口,可以支持各種組件進(jìn)行統一查詢(xún),而不需要把數據從一個(gè)組件遷移到另一個(gè)組件。
2、FusionInsight SparkSQL
SparkSQL概念并非華為提出,但華為為社區做出了很多貢獻,自己的產(chǎn)品能力更強,例如華為主導向Spark SQL貢獻的CPU優(yōu)化器,使得穩定性和高性能比社區的開(kāi)源的SQL更強。
3、完全自研的SQL引擎Elk
讓華為的SQL引擎更接近數據庫甚至超過(guò)數據庫,用戶(hù)能夠得到跟數據庫一樣甚至超過(guò)數據庫交互體驗效果。
4、Apach
CarbonData是華為主導的一個(gè)社區開(kāi)展項目,參與者有國內眾多互聯(lián)網(wǎng)公司和大型企業(yè),也有國外IT企業(yè),其特點(diǎn)是對上層的應用無(wú)感知,提升了數據分析、數據查詢(xún)的性能。
5、多級租戶(hù)管理功能
FusionInsight提供的多級租戶(hù)管理功能來(lái)匹配企業(yè)的組織架構,也就是說(shuō),可以有這種公司級的租戶(hù)和管理員,有部門(mén)級的綜合管理員,還有子部門(mén)租戶(hù)和管理員,在給用戶(hù)設置權限、設置資源配合有更方便的對應。
6、對異構設備支持。
FusionInsight提供了對異構設備支持,既支持高低配的設備在同一個(gè)大集群里,又支持開(kāi)發(fā)應用可以指定某些應用運行在不同的機器上。
除此之外,華為FusionInsight還具備資源的靈活配置、多租戶(hù)的能力、分級存儲、超大集群、滾動(dòng)升級、異構磁盤(pán)集群熱點(diǎn)數據均衡、Flink流數據引擎、可視化的集群管理與運維、可信產(chǎn)品、可信開(kāi)發(fā)流程等十大優(yōu)勢,是一個(gè)幫助用戶(hù)以最低的成本解決最復雜問(wèn)題的可信平臺。
用戶(hù)實(shí)踐與啟迪
中國60%的TOP 10金融、保險、銀行,全球Top50運營(yíng)商中的25%都用了華為的大數據平臺;中國的平安城市建設有30%的客戶(hù)選擇了華為。華為在全球的項目、合作伙伴相當可觀(guān)。
迄今為止,FusionInsight HD已經(jīng)交付了700多個(gè)項目,產(chǎn)生了300多個(gè)合作伙伴和客戶(hù);這些項目覆蓋到金融、公共安全、交通、政務(wù)、電信、電力、石油等各個(gè)行業(yè)。
選擇FusionInsight HD作為大數據的承載平臺和處理平臺,可以盡可能地將大數據價(jià)值發(fā)揮到極致。
