• <strike id="fdgpu"><input id="fdgpu"></input></strike>
    <label id="fdgpu"></label>
    <s id="fdgpu"><code id="fdgpu"></code></s>

  • <label id="fdgpu"></label>
  • <span id="fdgpu"><u id="fdgpu"></u></span>

    <s id="fdgpu"><sub id="fdgpu"></sub></s>
    您當前的位置是:  首頁(yè) > 資訊 > IT與互聯(lián)網(wǎng) >
     首頁(yè) > 資訊 > IT與互聯(lián)網(wǎng) >

    TiDB x Catalyst丨秒級洞悉數據價(jià)值,TiDB 幫助“客戶(hù)成功 SaaS 廠(chǎng)商”提升用戶(hù)體驗

    2023-06-29 12:13:32   作者:   來(lái)源:   評論:0  點(diǎn)擊:


    Catalyst 是一家總部位于紐約的 SaaS 創(chuàng )業(yè)公司,它提供了一個(gè)直觀(guān)且靈活的客戶(hù)成功平臺(Custom Success Platform),可幫助客戶(hù)成功團隊匯聚客戶(hù)數據,洞悉客戶(hù)健康狀況,推動(dòng)客戶(hù)留存和業(yè)務(wù)增長(cháng)。目前 Catalyst 已完成了 B 輪融資。

    業(yè)務(wù)特點(diǎn)

    Catalyst 整合了來(lái)自包括 Salesforce、Mixpanel、 PostgreSQL 等不同來(lái)源的海量數據,并將其納入 Catalyst 生態(tài)系統中進(jìn)行處理、分析并生成可參考執行的數據洞察。

    Catalyst 主要處理三種類(lèi)型的數據:事務(wù)型數據、只讀數據和時(shí)序數據。

    事務(wù)型數據主要包括內部創(chuàng )建的筆記和任務(wù),以及從 Salesforce、Zendesk 和其他平臺收集的外部數據。

    只讀型數據主要是指從 Jira 和 Zendesk 等平臺收集的工單數據。

    時(shí)序型數據是 Catalyst 最重要和最棘手的數據類(lèi)型之一。能處理這一類(lèi)型的數據,也是 Catalyst 團隊數據庫選型的重要需求之一。

    以前的數據架構及其瓶頸

    Catalyst 最初使用 PostgreSQL 來(lái)處理從外部收集的所有數據。然而,隨著(zhù)其業(yè)務(wù)的增長(cháng)和數據源的迅速擴大,PostgreSQL 無(wú)法跟上其需求。Catalyst 最初試圖通過(guò)將數據存儲為 JSON 文檔來(lái)彌補這一缺陷,但查詢(xún)性能受到了嚴重影響。

    隨后,該團隊轉向了 pre-caching 方案。他們采用 Elasticsearch 來(lái)存儲結果,以便更快地響應客戶(hù)的查詢(xún)。然而,由于 Elasticsearch 不支持 SQL 風(fēng)格的 JOIN, Catalyst 必須在將所有內容存儲在 Elasticsearch 之前進(jìn)行預計算。隨著(zhù)存儲數據量增加,成本也急劇上升。

    為了解決這些問(wèn)題并拓展業(yè)務(wù)增長(cháng),Catalyst 團隊決定重新設計整個(gè)數據處理和存儲系統。他們也是這個(gè)時(shí)候發(fā)現了新一代分布式關(guān)系型數據庫 TiDB。

    數據層重構

    Catalyst 的新架構分為五個(gè)數據層:數據攝取層、數據湖層、Spark 層、數據服務(wù)層和 Web 應用層。原始數據通過(guò)攝取層進(jìn)入,并繼續進(jìn)入數據湖層。Spark 層組合數據對象,執行預計算,確保數據有意義。數據服務(wù)層存儲所有預處理過(guò)數據以供客戶(hù)查詢(xún)。因為直接影響用戶(hù)體驗,數據服務(wù)層對 Catalyst 來(lái)是最重要的,也成為 Catalyst 對新數據棧迫切需求的地方。數據服務(wù)層以下的各層不需要是實(shí)時(shí)的。然而,在數據服務(wù)層,Catalyst 需要亞秒級的延遲,以便客戶(hù)能夠迅速獲得結果。

    新技術(shù)棧的必備能力

    為了服務(wù)不斷增長(cháng)的客戶(hù),Catalyst 迫切需要一個(gè)具備以下特性的數據庫:

    支持混合事務(wù)型和分析型工作負載。Catalyst 必須處理事務(wù)型和只讀數據,以及時(shí)序數據。他們需要的解決方案,無(wú)論是單一的數據庫還是一個(gè)數據庫組合,必須能夠同時(shí)處理交易型和分析型工作負載。

    快速響應。新的數據庫解決方案必須比 Catalyst 以前的解決方案更靈活,特別是在查詢(xún)速度和用戶(hù)界面性能方面。它必須在幾秒鐘內對查詢(xún)作出反應,并具有較低的更新延時(shí)。

    處理復雜和高度定制的數據。Catalyst 的客戶(hù)可以在 Catalyst 平臺內部以及 Salesforce 和 Zendesk 等數據源平臺上自定義許多設置,包括查詢(xún)、數據轉換和關(guān)系。與許多自定義字段集成的自定義對象的組合可能相當復雜。新的解決方案必須能夠處理這種情況。

    高可用。Catalyst 需要對他們的客戶(hù)作出敏捷的反應。維持系統運行是 Catalyst 的首要任務(wù)。一旦 Catalyst 宕機,客戶(hù)往往幾十秒內就會(huì )投訴。因此,新的數據庫解決方案必須是高度可用的,以幫助 Catalyst 輕松應對任何可能的系統事故。

    水平擴展性。可擴展性是另一個(gè)必須具備的條件。Catalyst 處理的數據量非常大,而且數據量還會(huì )不斷擴大。數據庫解決方案必須易于擴展到巨大的規模。

    數據強一致性。數據一致性是另一個(gè)要求。但考慮到有如此多的數據處理在流中進(jìn)行,要在整個(gè)系統中保持數據強一致性是非常困難的。因此 Catalyst 可以接受最終一致性 (Eventual Consistency)。

    TiDB 在性能測試中脫穎而出

    Catalyst 在選擇新的數據庫時(shí)非常謹慎;他們調研了 TiDB 和另外兩種選擇: Aurora 與 AWS Timestream 結合,以及 YugaByte 與 AWS Timestream 結合的方案。這些選項是聯(lián)機事務(wù)處理(OLTP)數據庫和時(shí)序數據庫的組合。

    為了測試這三個(gè)候選解決方案,Catalyst 采用來(lái)自?xún)炔?Salesforce 和 Jira 實(shí)例的大型真實(shí)數據集作為負載,通過(guò)連續并行的方式運行分組查詢(xún)。查詢(xún)響應速度是最重要的評估標準之一。

    TiDB 對典型查詢(xún)和聚合查詢(xún)的響應時(shí)間都在幾秒鐘之內,比其他候選解決方案快得多。同時(shí),TiDB 對時(shí)序聚合查詢(xún)的表現也足夠靈活敏捷,7 秒內返回結果。下表總結了一些關(guān)鍵的測試結果。

    查詢(xún)的類(lèi)型有:

    典型查詢(xún):客戶(hù)最感興趣的查詢(xún)。

    聚合查詢(xún):主要是基于復雜 JOIN 的計算。

    時(shí)序聚合查詢(xún): Catalyst 沒(méi)有在 Aurora 和 Yugabyte 解決方案上測試時(shí)序聚合查詢(xún),因為時(shí)間有限,而且 TiDB 的性能對他們來(lái)說(shuō)已經(jīng)足夠印象深刻。

    微信截圖_20230629104508.png

    關(guān)鍵測試結果

    為什么選擇 TiDB?

    查詢(xún)響應快

    根據查詢(xún)類(lèi)型的不同,TiDB 的響應時(shí)間比其競爭對手快 10 到 60 倍。這是 Catalyst 選擇 TiDB 的最重要原因。

    完美支持在線(xiàn) DDL

    TiDB 支持在線(xiàn)數據定義語(yǔ)言(DDL)操作,且不會(huì )影響在線(xiàn)業(yè)務(wù)。TiDB 提供無(wú)憂(yōu)的模式變化,并允許 Catalyst 更快地添加或刪除索引,特別是對于大表。當他們遇到慢查詢(xún)并需要快速添加索引以提高性能時(shí),這尤其有用。通過(guò)在線(xiàn)模式變更,Catalyst 無(wú)須停下在線(xiàn)業(yè)務(wù)或預留長(cháng)時(shí)間的維護窗口。

    HTAP 混合負載數據庫

    TiDB 是一個(gè)混合事務(wù)和分析處理的(HTAP)數據庫。在 Catalyst 評估的三個(gè)候選項中,TiDB 是唯一一個(gè)技術(shù)棧可以同時(shí)處理對象數據和時(shí)序數據的數據庫。這不僅非常高效,而且還為 Catalyst 節省了大量的時(shí)間、精力和金錢(qián)。

    水平擴展性

    TiDB 具有高度的水平擴展性。這完美地滿(mǎn)足了 Catalyst 應對不斷擴大的數據量的業(yè)務(wù)需求。TiDB 還支持計算和存儲資源分離,這使得 Catalyst 可以單獨擴展這兩種資源,也有助于控制成本。

    快速的容災恢復

    TiDB 使用 Raft 共識算法來(lái)確保數據的高度可用性和安全復制。TiKV 是 TiDB 的存儲服務(wù)器,數據在 TiKV 節點(diǎn)之間進(jìn)行冗余復制,并放置在不同的可用區域,以防止機器或數據中心故障。這確保了 Catalyst 的系統正常運行時(shí)間。此外,TiDB 提供了多種災難恢復方案的選擇,每一種方案都適用于不同的場(chǎng)景,成本靈活。

    全面的托管服務(wù)

    Catalyst 有一個(gè)小的 DevOps 團隊,所以他們需要一個(gè)完全托管的數據庫解決方案,以減輕團隊的負擔并控制成本。TiDB 的全托管服務(wù) TiDB Cloud 滿(mǎn)足了這一需求。

    云中立

    Catalyst 的服務(wù)采取跨云部署的方式以保證其業(yè)務(wù)的靈活性:一些工作負載在谷歌云平臺(GCP)上運行,一些在亞馬遜(AWS)上運行。因此,他們需要一個(gè)支持多云部署的云數據庫解決方案。TiDB Cloud 正是這樣的解決方案。

    總結

    Catalyst 之前主要使用 PostgreSQL 來(lái)處理客戶(hù)數據,但系統很快遇到了瓶頸。他們重新設計了數據架構,并引入新的數據庫來(lái)為客戶(hù)提供數據。通過(guò)采用 TiDB, Catalyst 能夠提供更好的客戶(hù)體驗,包括更快的查詢(xún)響應、更有彈性的系統、更強大的數據存儲、處理和分析能力。Catalyst 還降低了它們的整體維護成本。

    【免責聲明】本文僅代表作者本人觀(guān)點(diǎn),與CTI論壇無(wú)關(guān)。CTI論壇對文中陳述、觀(guān)點(diǎn)判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。

    相關(guān)閱讀:

    專(zhuān)題

    CTI論壇會(huì )員企業(yè)

    亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 大城县| 象山县| 友谊县| 陆良县| 海原县| 安图县| 汕头市| 永靖县| 阆中市| 凤城市| 高青县| 双辽市| 永昌县| 常德市| 富锦市| 禄劝| 漾濞| 永川市| 黑龙江省| 曲周县| 万年县| 文成县| 家居| 汽车| 景东| 义马市| 安陆市| 辰溪县| 明水县| 普宁市| 江永县| 玛曲县| 郓城县| 石泉县| 高碑店市| 廉江市| 黎平县| 南平市| 清水县| 恩平市| 栾城县| http://444 http://444 http://444 http://444 http://444 http://444