隨著(zhù)摩爾定律的失效,以前靠升級硬件實(shí)現Scale Up的方式已經(jīng)不行了。讓數據庫Scale Out變成新的考慮目標。當數據量達到一定量級時(shí),采用分布式數據庫往往是必經(jīng)之路。
因此,分布式數據庫近年來(lái)廣受關(guān)注,許多廠(chǎng)商都推出了相應的分布式數據庫產(chǎn)品,并且價(jià)格從免費到數百萬(wàn)不等,選擇多了,選型難度就更大了。
另外,到目前為止,分布式數據庫的選型還沒(méi)有一個(gè)真正科學(xué)并廣泛接受的標準,可以準確評判某個(gè)分布式數據庫的好壞。因此,分布式數據庫選型是一個(gè)十分具有挑戰并且需要小心的工作。
本調查定位面向金融行業(yè)國產(chǎn)分布式數據庫選型及滿(mǎn)意度調查?有2個(gè)方面的原因。
其一、分布式,為國產(chǎn)數據庫打開(kāi)了一個(gè)全新的思路,“沿著(zhù)同樣的路線(xiàn)再造一個(gè)Oracle根本不可能,也沒(méi)有意義”成為國內數據庫從業(yè)者的共識,分布式數據庫被認為是“變道超車(chē)”的機會(huì )。在這條賽道,中國沒(méi)有落后于人,因為中國人口紅利,有著(zhù)世界絕無(wú)僅有的場(chǎng)景支撐。比如:螞蟻集團自己研發(fā)的數據庫OceanBase已經(jīng)能夠支撐住雙11的壓力,并且性能還不錯。美國商務(wù)部“拉黑”12家中國企業(yè),再次激發(fā)國產(chǎn)替代的預期。
其二、金融行業(yè)下一步分布式改造已然成為必然趨勢,2019年中國人民銀行印發(fā)《金融科技(FinTech)發(fā)展規劃(2019-2021 年)》(銀發(fā)〔2019〕209 號)金融科技發(fā)展三年規劃中提到的“加強分布式數據庫研發(fā)應用”的要求,目前已經(jīng)接近收關(guān)。
因此,用不用分布式數據庫已經(jīng)不是問(wèn)題,而是怎么選?怎樣用?如何用好才是迫切需要解決的問(wèn)題。
那么,在如此眾多的產(chǎn)品中,金融行業(yè)企業(yè)到底應該如何正確的選擇國產(chǎn)分布式數據庫供應商,如何選擇最適合企業(yè)自身的國產(chǎn)分布式數據庫服務(wù),從而讓企業(yè)真正實(shí)現效率的提升,滿(mǎn)足業(yè)務(wù)發(fā)展的需求,同時(shí)節省成本開(kāi)支。
目前,已經(jīng)應用國產(chǎn)分布式數據庫的企業(yè)滿(mǎn)意度如何?他們是如何應用國產(chǎn)分布式數據庫的?踩過(guò)哪些坑?如何規避?國產(chǎn)分布式數據庫在使用過(guò)程中,有哪些突出的問(wèn)題?對于其他即將應用國產(chǎn)分布式數據庫或者使用效果不明顯的企業(yè),有哪些值得借鑒的,國產(chǎn)分布式數據庫供應商還有哪些可以改善的地方?這是我們本期報告所關(guān)注的點(diǎn)。
數據說(shuō)明:2021年5-12月,IT168面向旗下ITPUB、ChinaUnix社區進(jìn)行調查,調查對象涵蓋CIO/CTO(3%)、技術(shù)總經(jīng)理/總監(8%)、DBA(21%)、架構師(14%)、技術(shù)經(jīng)理(21%)、項目經(jīng)理(12%)、研發(fā)工程師(14%)等,回收問(wèn)卷1391,其中銀行、保險、證券等金融行業(yè)合格問(wèn)卷476。
為了更加有效地保障金融行業(yè)調查數據的有效性,除了問(wèn)卷調查,我們針對金融企業(yè),又定向地展開(kāi)了超過(guò)200次的電話(huà)微信調查,并采訪(fǎng)了近30位金融企業(yè)的數據庫領(lǐng)域的技術(shù)專(zhuān)家,得出了當前的國內《國產(chǎn)分布式數據庫選型及滿(mǎn)意度調查報告》。特別說(shuō)明:本次調查,以部署的企業(yè)的案例數為主,不看具體的部署節點(diǎn)數。
報告主要結論:
- 分布式數據庫應用在金融行業(yè)是大勢所趨
- 金融行業(yè)分布式數據庫改造更青睞原生分布式架構技術(shù)路線(xiàn)
- 產(chǎn)品選擇和使用上,OceanBase最受歡迎
- 產(chǎn)品技術(shù)及服務(wù)能力上,騰訊云TDSQL最受推崇
- 安全性(可用性、可靠性、穩定性)是金融行業(yè)選擇分布式數據庫的首要指標。
- 目前,分布式數據庫在金融行業(yè)的應用場(chǎng)景分析偏多,交易次之。
- 部署方式私有云與混合云部署將是常態(tài)
- 運維復雜度提升是金融行業(yè)在應用分布式數據庫過(guò)程中遇到的最突出問(wèn)題。
- 國產(chǎn)分布式數據庫用戶(hù)滿(mǎn)意度:OceanBase第一
- 國產(chǎn)分布式數據庫供應商推薦度:PingCAP第一
- 運維復雜讓金融行業(yè)對供應商提供相關(guān)數據庫優(yōu)化軟件有較強訴求

在調研中,我們首先對金融行業(yè)的分布式數據庫應用情況做了調查,從下圖中,我們可以看到,81%的受訪(fǎng)人表示,其所在企業(yè)已經(jīng)、正在或計劃部署分布式數據庫,其中已經(jīng)部署、正在部署、正在計劃部署的企業(yè)分別占比37%、18%、26%,只有19%的企業(yè)表示沒(méi)有任何計劃。這說(shuō)明,分布式數據庫在金融行業(yè)中的應用是大勢所趨。
調查發(fā)現,分布式數據庫在金融行業(yè)中的應用之所以是大勢所趨,有兩個(gè)大背景,其一,業(yè)務(wù)驅動(dòng),隨著(zhù)數據井噴,金融行業(yè)不僅業(yè)務(wù)需求升級倒逼架構創(chuàng )新,同時(shí)互聯(lián)網(wǎng)金融的快速發(fā)展對金融系統能力帶來(lái)全新挑戰,傳統集中式數據庫已經(jīng)難以承載,而分布式能很好的解決這一問(wèn)題。其二、政策指引,《金融科技(FinTech)發(fā)展規劃(2019-2021)》中明確指出:“加強分布式數據庫的研發(fā)應用。做好分布式數據庫金融應用的長(cháng)期規劃,加大研發(fā)與應用投入力度。有計劃、分步驟穩妥推動(dòng)分布式數據產(chǎn)品先行先試,形成可借鑒、能推廣的典型案例和解決方案,為分布式數據庫在金融領(lǐng)域的全面應用探明路徑。
分布式數據庫改造更青睞原生分布式架構技術(shù)路線(xiàn)
分布式數據庫選型首先面對的是技術(shù)路線(xiàn)的選擇,原生分布式架構,重構了數據庫系統,原生支持分布式事務(wù)處理與數據切分,在擴展性方面存在天然的優(yōu)勢,在未來(lái)具有更廣闊的發(fā)展空間,但目前產(chǎn)品成熟度,仍需時(shí)間錘煉。
分庫分表中間件技術(shù)相對成熟,但對數據庫的核心能力改造并不多,基本上都沿用了原來(lái)單點(diǎn)數據庫的核心能力,最大的優(yōu)勢是能夠以最小的代價(jià)在最短的時(shí)間內突破單點(diǎn)數據庫的瓶頸。
企業(yè)選擇了一個(gè)分布式數據庫產(chǎn)品之后,意味著(zhù)選擇了未來(lái)五年甚至十年的一個(gè)技術(shù)路線(xiàn),因此,大多數用戶(hù)從長(cháng)遠角度來(lái)看,更愿意選擇原生分布式架構。
調查也證實(shí)了這樣的結果,56%的受訪(fǎng)者更傾向于原生分布式技術(shù)路線(xiàn)。而傾向于分布式中間件+分庫分表的受訪(fǎng)者也不少,占比44%。(說(shuō)明:數據僅代表受訪(fǎng)者選擇的傾向性,并不代表當下的應用狀態(tài))

產(chǎn)品選擇和使用上,OceanBase最受歡迎
金融企業(yè)對分布式數據庫產(chǎn)品的選擇和使用,毫無(wú)疑問(wèn)是各大廠(chǎng)商爭奪的焦點(diǎn),對于其他企業(yè)也極具參考價(jià)值,下圖是一個(gè)多選項的調查數據。
特別說(shuō)明:該項調查,以部署的企業(yè)案例數為主,不看具體的部署節點(diǎn)數。對GaussDB的定義并不包含openGauss。

有16.67%的受訪(fǎng)者表示,其所在企業(yè)已使用或計劃采用OceanBase,排名第一。2012年OceanBase開(kāi)始支持支付寶,2014年替換支付寶交易系統,2015年雙十一100%支持交易數據鏈和支付數據鏈,2016年雙十一支付寶的整個(gè)核心賬務(wù)庫已經(jīng)運行在OceanBase上,2017年螞蟻集團的所有核心數據鏈全部遷移到OceanBase。今年OceanBase宣布開(kāi)源,并一次性開(kāi)放300萬(wàn)行代碼,都讓OceanBase備受關(guān)注。調查顯示,OceanBase具有豐富的金融級內部實(shí)踐與商用實(shí)踐,商用案例覆蓋國有大行、城商行、農商行、證券及保險行業(yè),其中不乏重度使用案例,目前金融領(lǐng)域TOP200的客戶(hù)服務(wù)比例高達四分之一。
第二名華為云GaussDB占比15.32%,與第三名騰訊云TDSQL15.21%,差距極微。短期華為云GaussDB受華為整體戰略調整影響,但從長(cháng)期看,是看好的。而騰訊云TDSQL過(guò)去一年在金融行業(yè)大力發(fā)展,遍地開(kāi)花勢頭很猛,在TOP 10 銀行中服務(wù)比例高達 60%,勁頭十足。
產(chǎn)品技術(shù)及服務(wù)能力上,騰訊云TDSQL最受推崇
數據庫供應商的產(chǎn)品技術(shù)及服務(wù)能力,也是金融行業(yè)選擇分布式數據庫至關(guān)重要的環(huán)節。數據顯示,在當前各個(gè)分布式數據庫產(chǎn)品的供應商中,騰訊云 TDSQL的產(chǎn)品周邊生態(tài)完善程度及服務(wù)保障能力,最受金融企業(yè)用戶(hù)推崇,占比23.4%,目前TDSQL已助力20余家金融機構完成核心替換。
騰訊云TDSQL在產(chǎn)品實(shí)施的技術(shù)服務(wù)方面,建設了完善的產(chǎn)品實(shí)施服務(wù)、維保服務(wù)團隊,有實(shí)力保障金融用戶(hù)的數據庫產(chǎn)品的實(shí)施與日常運營(yíng)。
另外騰訊云TDSQL提供了比較完整的產(chǎn)品周邊服務(wù)工具套件。金融企業(yè)選擇使用分布式數據庫產(chǎn)品時(shí),實(shí)現高質(zhì)量與高效的數據遷移,是一項至關(guān)重要的任務(wù)。

安全性(可用性、可靠性、穩定性)是金融行業(yè)選擇分布式數據庫的首要指標

金融是國民經(jīng)濟的命脈,數據是金融企業(yè)最核心的資產(chǎn),所以,金融行業(yè)對分布式數據庫的要求“穩”是第一位的,數據既不能錯也不能丟,同時(shí)系統不能停,因為,一旦系統停機會(huì )給金融企業(yè)帶來(lái)無(wú)法估量的經(jīng)濟和名譽(yù)損失。因此,金融企業(yè)對與“穩” 相關(guān)的“可用性、可靠性、穩定性”的要求較為極致。
安全性自然成為分布式數據庫選型的首要指標,占比20%。其次是產(chǎn)品服務(wù)能力與價(jià)格,占比18%,容災能力占比13%,技術(shù)產(chǎn)品領(lǐng)先性,占比10%,可擴展性占比9%。
當前分布式數據庫在金融行業(yè)的應用場(chǎng)景分析偏多,交易次之
數據和分析是數字化轉型的關(guān)鍵,金融科技以技術(shù)創(chuàng )新推動(dòng)業(yè)務(wù)創(chuàng )新帶來(lái)了更多大數據分析需求,而信創(chuàng )則加速了國產(chǎn)化替代進(jìn)程,尤其是一些金融企業(yè)核心業(yè)務(wù)分布式改造進(jìn)程標志著(zhù)金融級分布式數據庫逐漸走向成熟和穩定。
調查顯示,有36%的分布式數據庫被用于大數據分析,30%用于傳統業(yè)務(wù),14%用于互聯(lián)網(wǎng)業(yè)務(wù),12%用于人工智能場(chǎng)景,其它場(chǎng)景8%。

私有云與混合云部署將是常態(tài)

在金融行業(yè),數據庫部署模式不僅與監管要求有關(guān),也與企業(yè)規模相關(guān),尤其是頭部企業(yè)。目前在金融行業(yè),尤其是核心系統,處于對數據主權及安全考量,大多數還是獨立部署,但隨著(zhù)基礎層及平臺層的快速云化,上云是必然趨勢。
調查顯示,從云部署模式看,私有云與混合云部署將是常態(tài),其中私有云部署占比46%,混合云部署占比37%,公有云部署只有17%。
運維復雜度提升是金融行業(yè)在應用分布式數據庫過(guò)程中遇到的最突出問(wèn)題
相比傳統商業(yè)數據庫,分布式數據庫會(huì )有更多的節點(diǎn)和組件,更難于管理。
調查顯示,金融行業(yè)在使用分布式數據庫過(guò)程中,最突出的問(wèn)題是運維復雜度提升,占比18%,其次是人才儲備不足,占比16%,對原有應用系統升級改造成本較高,占比15%,數據遷移難度大占比14%,兼容性問(wèn)題,占比11%。

運維復雜讓金融行業(yè)對供應商提供相關(guān)數據庫優(yōu)化軟件有較強訴求

相比傳統商業(yè)數據庫,分布式數據庫相對較新,金融企業(yè)在分布式數據庫方面的自有運維支持能力有待進(jìn)一步提高。所以,為了降低運維復雜度,金融企業(yè)對供應商提供相關(guān)圖形化的數據庫優(yōu)化軟件或工具有較強的訴求。
用戶(hù)滿(mǎn)意度:OceanBase第一
具體到供應商滿(mǎn)意度,OceanBase以7.65分滿(mǎn)意度排名第一, PingCAP以7.55分排名第二,華為云GaussDB以7.27排名第三。

通過(guò)對選用(或者試用)OceanBase的用戶(hù)進(jìn)一步調查得知,OceanBase相比其它開(kāi)源數據庫,具備技術(shù)領(lǐng)先性的優(yōu)勢,技術(shù)領(lǐng)先性主要在于功能和性能,雙十一和TPC-C打榜是最有力的證明,并且支持MySQL和Oracle、Paxos協(xié)議、生態(tài)工具等。
安全性,OceanBase滿(mǎn)足行業(yè)規范,如支持私有化部署,支持多中心多副本架構滿(mǎn)足容災高可用需求。
服務(wù)方面,OceanBase有較為完善的產(chǎn)品服務(wù)體系,尤其在某些方面表現突出,多位受訪(fǎng)者表示其解決問(wèn)題時(shí)效比較快。
供應商推薦度:PingCAP第一
在供應商推薦度方面,PingCAP以7.86分排名榜首,騰訊云TDSQL以7.12分排名第二,OceanBase以7分排名第三。

通過(guò)對選用(或者試用)TiDB的金融行業(yè)用戶(hù)的進(jìn)一步調查得知,TiDB原生分布式架構適用于海量數據規模的OLTP和混合負載業(yè)務(wù),對MySQL高度兼容,相較于分庫分表方案,對業(yè)務(wù)無(wú)侵入,在線(xiàn) DDL 對敏態(tài)業(yè)務(wù)開(kāi)發(fā)友好。TiDB 5.0 版本引入MPP模式,支持函數和算子下推, HTAP引擎可以提供更加強勁的算力,目前已在銀行、證券等金融機構的實(shí)時(shí)數倉、風(fēng)控、營(yíng)銷(xiāo)和數據中臺等場(chǎng)景中得到落地應用。
不過(guò),對于金融用戶(hù)而言,之所以更愿意推薦TiDB,就是 TiDB 是一個(gè)開(kāi)源的項目,而且社區很活躍,版本迭代快速。一方面,對于企業(yè)用戶(hù)而言,企業(yè)的技術(shù)團隊可以方便地深入到數據庫核心代碼的開(kāi)發(fā)中,有利于對數據庫平臺的后期深度的運營(yíng)開(kāi)發(fā)維護。另一方面,一旦有疑難問(wèn)題時(shí),可以向社區求助,通過(guò)社區平臺解決問(wèn)題,從而降低可能產(chǎn)生的服務(wù)支持費用。
數據來(lái)源:ITPUB & IT168
調研時(shí)間:2021年5月-12月
發(fā)布時(shí)間:2021.12
出品:ITPUB