日前,亞馬遜云服務(wù)(AWS)宣布Amazon Timestream正式可用。作為一款面向物聯(lián)網(wǎng)和運營(yíng)應用的全新時(shí)序數據庫,Amazon Timestream每天可處理數萬(wàn)億規模的時(shí)序事件,速度比關(guān)系型數據庫快多達1000倍,而成本卻低至其1/10。Amazon Timestream將最新數據保存在內存之中,并根據用戶(hù)定義的策略,將歷史數據移動(dòng)至成本優(yōu)化的存儲層,從而為客戶(hù)節省精力和費用。同時(shí),其查詢(xún)處理使客戶(hù)能夠通過(guò)單一查詢(xún),跨層透明地訪(fǎng)問(wèn)和組合最新數據和歷史數據,而無(wú)需在查詢(xún)中明確指定數據是駐留在內存之中或成本優(yōu)化層。Amazon Timestream提供了針對時(shí)序的分析功能,幫助客戶(hù)近乎實(shí)時(shí)地識別數據中的趨勢和模式。Amazon Timestream是一款無(wú)服務(wù)器服務(wù),它可以自動(dòng)擴大或縮小規模,根據負載調整容量,客戶(hù)無(wú)需管理其底層基礎設施。客戶(hù)無(wú)需預付費或承諾即可使用 Amazon Timestream,僅需為寫(xiě)入、存儲或查詢(xún)的數據付費。訪(fǎng)問(wèn) https://aws.amazon.com/timestream即可開(kāi)始使用 Amazon Timestream。
當前,客戶(hù)都希望構建物聯(lián)網(wǎng)、邊緣和運營(yíng)應用,從隨時(shí)間變化的海量數據(通常被稱(chēng)為時(shí)序數據)中收集、歸納和獲取洞察力。例如,制造商希望跟蹤物聯(lián)網(wǎng)傳感器數據,測量整個(gè)工廠(chǎng)中設備的變化;在線(xiàn)營(yíng)銷(xiāo)人員希望分析點(diǎn)擊流數據,捕獲用戶(hù)瀏覽網(wǎng)站的先后順序;數據中心運營(yíng)商希望查看衡量基礎設施性能指標變化的數據。這種類(lèi)型的時(shí)序數據可以從多個(gè)來(lái)源生成,數據量極大,既需要近乎實(shí)時(shí)地、低成本地收集,又需要高效的存儲以幫助客戶(hù)組織和分析數據。之前要實(shí)現這一點(diǎn),客戶(hù)可以使用現有的關(guān)系型數據庫或自己管理的時(shí)序數據庫。然而,這兩種選擇都有一定的缺陷。關(guān)系型數據庫需要預設固定的模式(schema),在需要跟蹤應用的新屬性時(shí)缺乏靈活性。例如,當新設備上線(xiàn)并開(kāi)始發(fā)出時(shí)序數據時(shí),固化的模式意味著(zhù)客戶(hù)要么必須丟棄新的數據,要么重新設計數據庫的表以支持新的設備,這將會(huì )費時(shí)費錢(qián)。除了固化的模式外,關(guān)系型數據庫還需要多個(gè)表和索引,每當新的數據產(chǎn)生,這些表和索引都需要更新,而且隨著(zhù)數據的增長(cháng),查詢(xún)會(huì )變得越來(lái)越復雜和低效。此外,關(guān)系型數據庫還缺乏必要的時(shí)序分析功能,如平滑、近似和插值,這些功能可以幫助客戶(hù)近乎實(shí)時(shí)地識別趨勢和模式。另一個(gè)解決方案是客戶(hù)自己構建和管理時(shí)序數據庫,缺點(diǎn)是數據處理和存儲能力有限,難以擴展。許多現有的時(shí)序數據庫解決方案都無(wú)法支持數據保留策略,隨著(zhù)數據的增長(cháng)會(huì )導致存儲變得日益復雜。為了訪(fǎng)問(wèn)數據,客戶(hù)必須建立定制的查詢(xún)引擎和工具,配置和維護都很困難,并且可能需要通過(guò)復雜的、多年的工程項目來(lái)實(shí)現。而且,這些解決方案無(wú)法與客戶(hù)目前正使用的數據收集、可視化和機器學(xué)習工具相集成。這就導致了許多客戶(hù)疏于保存或分析時(shí)序數據,錯過(guò)有價(jià)值的信息洞察。
為解決上述挑戰,Amazon Timestream為客戶(hù)提供了專(zhuān)門(mén)構建的無(wú)服務(wù)器時(shí)序數據庫,用于收集、存儲和處理時(shí)序數據。Amazon Timestream 會(huì )自動(dòng)檢測數據的屬性,使得客戶(hù)不再需要預設模式。Amazon Timestream 通過(guò)自動(dòng)存儲分層,簡(jiǎn)化了數據生命周期管理的復雜過(guò)程,將最新數據存儲在內存之中,并根據預設的用戶(hù)策略、自動(dòng)將歷史數據移動(dòng)到成本優(yōu)化的存儲層。Amazon Timestream還使用了專(zhuān)門(mén)打造的自適應查詢(xún)引擎,通過(guò)一條SQL語(yǔ)句,透明地、跨層訪(fǎng)問(wèn)和組合最新數據和歷史數據,而無(wú)需指定數據存在哪個(gè)存儲層。這使得客戶(hù)能夠使用單一查詢(xún)功能查詢(xún)所有數據,而不需要編寫(xiě)復雜的應用邏輯來(lái)查找數據的存儲位置,單獨查詢(xún)每個(gè)層,然后再將結果合并為一個(gè)完整的視圖。Amazon Timestream 提供了內置的時(shí)序分析功能,具有平滑、近似和插值功能,客戶(hù)不必從數據庫中提取原始數據,然后使用外部工具和庫來(lái)執行其時(shí)序分析,也不必編寫(xiě)復雜的、并非所有數據庫都支持的存儲過(guò)程。Amazon Timestream的無(wú)服務(wù)器架構采用完全解耦的數據攝取和查詢(xún)處理系統,不需要客戶(hù)管理底層基礎設施,為客戶(hù)提供了幾乎無(wú)限的擴展規模,以及獨立、自動(dòng)地增長(cháng)存儲和查詢(xún)處理的能力。此外,Amazon Timestream還集成了客戶(hù)目前使用的、流行的數據收集、可視化和機器學(xué)習工具,包括用于物聯(lián)網(wǎng)數據收集的AWS IoT Core、用于流式數據的Amazon Kinesis和Amazon MSK、用于無(wú)服務(wù)器商業(yè)智能的Amazon QuickSight,用于快速構建、訓練和部署機器學(xué)習模型的Amazon SageMaker等服務(wù),以及開(kāi)源的第三方工具Grafana(用于可觀(guān)察性?xún)x表盤(pán))和Telegraf(用于指標收集)。
Amazon Timestream已經(jīng)在美國東部(弗吉尼亞北部)區域、美國東部(俄亥俄)區域、美國西部(俄勒岡)區域和歐洲(愛(ài)爾蘭)區域推出,未來(lái)數月也將在更多區域推出。
消息來(lái)源:AWS