分布式時序數據庫TimeLyre 9.1發(fā)布:海量存儲、高效壓縮、實時分析

隨著物聯網、車聯網和工業(yè)互聯網等的迅速發(fā)展,時序數據被廣泛應用在各行各業(yè),包括工業(yè)制造、經濟金融、環(huán)境監(jiān)測、醫(yī)學、農業(yè)生產、硬件和軟件系統監(jiān)控等領域都在大量使用時序數據揭示研究對象的趨勢性、規(guī)律性、異常性。同時,在人工智能的浪潮下,時序數據作為大數據、機器學習、實時預測基礎數據的作用日益凸顯。各類應用產生的時序數據量爆炸式增長,呈現出海量性、關聯性、時效性、實時性等特征,對數據庫寫入、存儲、分析性能以及實時性提出了更高的要求,如何管理海量的實時數據、從中挖掘價值,是時序數據庫需要解決的重要問題。

Transwarp TimeLyre是星環(huán)科技自主研發(fā)的企業(yè)級分布式時序數據庫,其支持分布式水平擴展,同時具有極高的壓縮率可以支持海量時序數據的存儲,提供高吞吐實時寫入、時序精確查詢、多維檢索等功能,可以有效支撐物聯網、能源制造、金融量化交易領域等多種時序數據業(yè)務場景。

近日,TimeLyre正式發(fā)布V9.1版本,通過原生分布式架構、5-20倍無損數據壓縮能力、每秒千萬級數據吞吐能力、優(yōu)異的查詢分析性能、豐富的生態(tài)支持、靈活的部署方式,為海量時序數據的高效存儲、快速查詢、便捷計算提供了有力支撐,大幅降低了企業(yè)硬件成本,保障了時序數據查詢分析的實效性,滿足了時序數據在各類復雜業(yè)務場景的應用需求。同時新版本還提供一站式國產化替代解決方案,可以實現InfluxDB的平滑替換,助力企業(yè)打造自主可控數據平臺。

原生分布式架構,集群靈活擴展,輕松實現海量時序數據存儲分析

TimeLyre采用原生分布式架構,支持集群在線擴縮容,可滿足海量時序數據存儲和分析需求。TimeLyre的存儲組件TimeLyreStorage主要由分布式數據管理系統與時序存儲引擎構成。

* 分布式數據管理系統負責分布式元信息的一致性存儲與分布式集群管理,基于Raft協議保證數據一致性與高可用性。

* 時序存儲引擎使用類似LSM-Tree的技術,提供高吞吐的實時插入、高性能的時序數據檢索,同時會對時序數據進行多種編碼和壓縮,保持整體數據的高壓縮率。

在計算方面,TimeLyre采用星環(huán)科技分布式向量化計算引擎Crux實現快速讀取批量存儲文件、高速響應數據查詢等功能。同時基于用于數據倉庫和交互式分析的分布式編譯器Quark,提供完整的SQL編譯支持,兼容通用開發(fā)框架和工具,使得TimeLyre可以輕松融入企業(yè)數據倉庫或數據湖體系,為企業(yè)提供高性價比和高度可擴展的解決方案。此外,Quark支持分布式計算可以同時在多個時序存儲間平衡業(yè)務流量,能夠有效地為客戶端屏蔽掉集群細節(jié),并且解決了時序存儲超時或宕機后無法執(zhí)行任務的問題。

分布式時序數據庫TimeLyre 9.1發(fā)布:海量存儲、高效壓縮、實時分析

高吞吐、高并發(fā),實現單節(jié)點每秒千萬級數據寫入的極致性能

TimeLyre支持實時、批量等多種數據寫入方式。實時寫入具備高吞吐、高并發(fā),每秒千萬級數據點插入的性能,可以保證數據檢索的實效性,是企業(yè)搭建實時數倉的極佳選擇。此外,TimeLyre支持通過SQL、文件載入、API以及多種工業(yè)物聯網通信協議實現數據入庫,滿足各種復雜業(yè)務場景的多樣化需求。

高水平無損數據壓縮,實現超高數據壓縮率,大幅降低硬件成本

TimeLyre采用行業(yè)領先的高水平數據壓縮優(yōu)化技術,在常見的時序數據上可實現5-20倍的壓縮率,提高了資源的利用率,大幅降低用戶硬件成本。TimeLyre提供多場景數據靈活、高效的壓縮解決方案,不僅支持snapyy、gzip、lzo、zstd等常用壓縮算法,還支持通過Delta編碼將數據作為連續(xù)樣本之間的差異來存儲,同時也支持行業(yè)特征編碼,根據檢測值數據類型、分布范圍,數據集中度進行特定的編碼,通過內置多種數據壓縮方式進一步提升時序數據壓縮效果。

數據處理性能增強,提供時序數據存儲分析極速體驗

時序數據存儲方面,TimeLyre內置多種索引結構,檢索性能達到毫秒級的低延遲響應。數據分析方面,TimeLyre支持通過標準SQL進行數據分析,降低用戶使用門檻。并且支持主流的SQL模塊化擴展,兼容通用開發(fā)框架和工具,支持事務特性,保證數據的準確性。通過使用分布式向量化計算引擎,TimeLyre支持海量時序數據的計算與分析,覆蓋關聯查詢、聚合查詢、嵌套查詢等多種復雜SQL分析功能,提供復雜場景構筑能力?;谛黔h(huán)科技多模型統一技術架構,TimeLyre時序數據可以與星環(huán)不同模型的數據統一存儲管理和聯合分析,打破數據存儲管理屏障,實現多模型數據的統一融合。

分布式時序數據庫TimeLyre 9.1發(fā)布:海量存儲、高效壓縮、實時分析

國產軟硬件異構平臺靈活部署,提供全面的安全和運維保障

TimeLyre采用星環(huán)科技自主研發(fā)的存算分離架構,基于容器技術,支持業(yè)內主流的操作系統和芯片,滿足各類信創(chuàng)軟硬件環(huán)境需求。并且可支持X86架構和各種國產芯片架構的混合架構,能夠運行在異構CPU架構以及多種操作系統混合部署的集群環(huán)境中,最大化利用硬件資源,讓用戶逐步實現國產化平滑替代。

TimeLyre內置配套的安全授權、用戶權限控制等相關安全功能,可以有效保障系統數據和訪問上的安全。

* 在用戶權限認證上,基于SASL提供plain與gssapi兩種認證方式,同時提供用戶組概念,便于通過平臺實現統一管理與操作;

* 在數據權限上,基于角色的訪問控制(RBAC)機制,使用戶能夠通過將權限分配給角色并將角色分配給用戶或組來授權用戶,支持庫級/表級以及列級/行級訪問權限控制,同時支持20多種脫敏算法,具備優(yōu)秀的數據隱私保護能力;

* 數據加密上,支持基于SSL/TLS兩類協議進行數據加密,確保數據傳輸過程的安全。

一站式國產化替代解決方案,助力企業(yè)打造自主可控數據平臺

為符合國家信創(chuàng)戰(zhàn)略要求,助力企業(yè)實現軟件自主可控,TimeLyre提供了InfluxDB一站式國產化替代解決方案。TimeLyre對InfluxDB有良好的兼容性,可以實現在不修改業(yè)務代碼的情況下,將運行在InfluxDB中的業(yè)務和數據平滑地遷移至TimeLyre,并且在遷移過程中可以保證監(jiān)控系統在線持續(xù)運行,充分保障遷移過程安全穩(wěn)定進行。

替換InfluxDB涉及接口兼容度、高可用性、中間件與應用層軟件兼容性等多個問題,TimeLyre采用兩段式的替代方案,保障原系統和服務的低成本、安全、平滑遷移。

* 第一階段:替換InfluxDB的數據庫服務,完成InfluxQL到TimeLyre標準SQL的改造工作,實現原有業(yè)務邏輯腳本的平滑替換;

* 第二階段:替換InfluxDB配套的grafana等運維監(jiān)控組件,借助星環(huán)科技多模數據平臺監(jiān)控軟件Aquila Insight、大數據安全管理軟件Guardian等組件,完成對既有業(yè)務系統的完全國產化替換。

分布式時序數據庫TimeLyre 9.1發(fā)布:海量存儲、高效壓縮、實時分析

打造實時高性能時序數據平臺,賦能能源制造行業(yè)數據湖建設

能源制造業(yè)數字化轉型是數字經濟的重要環(huán)節(jié)。某能源頭部企業(yè)現有大量的智能化工業(yè)設備,設備檢測具有測點多、頻率高、數據安全要求高等特點。

傳統關系型數據庫數據入庫慢、存儲資源消耗大、查詢計算效率低,而開源時序數據庫可運維性、可擴展性較差,無法支撐復雜分析業(yè)務,同時也面臨數據安全問題,均無法支撐智能工業(yè)設備實時產生的大量時序數據。

該企業(yè)基于星環(huán)科技TimeLyre的實時數據存儲、分析能力,打造了高性能時序數據平臺。通過星環(huán)科技實時流計算引擎Slipstream實時的將散布在數萬傳感器中的時序數據抽取到TimeLyre中,以此為基礎進一步開展行業(yè)算子計算、實時作業(yè)管理等實時分析,以及時序數據檢索、時序數據開發(fā)等。同時利用星環(huán)科技分布式分析型數據庫ArgoDB進行湖倉集一體化建設,實現了大數據靈活分析、離線作業(yè)管理等功能,進一步增強了企業(yè)業(yè)務數據離線分析能力。

項目建成后極大提升了時序數據存儲性能,實現了每秒千萬級流數據插入,入庫性能提升十倍以上;實現了高性能查詢,時序數據快速查詢能夠毫秒級返回結果,查詢性能提升十倍以上;大幅提升數據壓縮效率,數據平均壓縮率達到10倍,有效節(jié)約企業(yè)硬件成本;聯合分布式分析型數據庫ArgoDB滿足了之前未能實現的實時數倉與離線數倉聯合查詢的業(yè)務需求。

分布式時序數據庫TimeLyre 9.1發(fā)布:海量存儲、高效壓縮、實時分析

攜手頭部券商,打造量化投研一體化平臺,提升投研效率

金融行業(yè)數據往往具有數據架構大、數據頻率高、實時性強等特征。某頭部券商客戶使用Python進行數據處理分析,受技術所限只能進行單機程序部署,不僅需要購買昂貴的高配置單機服務器滿足性能和存儲需求,還需要業(yè)務人員具有較高的技術水平完成復雜查詢分析的編寫,此外該技術架構也無法完成多年高頻數據的分析,導致喪失部分交易機會,整體收益率顯著下降。

針對該券商客戶遇到的高頻交易數據入庫存儲困難、因子數據分析函數復雜、業(yè)務人員技術水平要求高、硬件購置成本高等痛點,星環(huán)科技基于TimeLyre打造了量化投研一體化平臺TransQuant。

通過TimeLyre Tools和Workflow實現多源數據接入,包括存儲在Oracle/MySQL中的數據、以HDF5和PKL格式存儲的用戶因子數據以及第三方數據等,將這些數據統一存儲在TimeLyre時序數據庫中,并通過星環(huán)科技智能量化投研平臺TransQuant對這些數據進行量化回測和因子研究,實現海量數據的復雜分析。

該平臺提供豐富的數據接口,通過Python API與原系統通信,支持多數據源多數據格式遷移導入,實現用戶業(yè)務的平滑遷移擴展,支撐多種金融應用場景。同時,TimeLyre作為分布式時序數據庫大大提升了系統運算能力,提供億級數據的高速運算,相同場景下達到Pandas單機性能的百倍以上。此外,特別支持了客戶應用過程中使用的上千列因子數據表,并提供了節(jié)點橫向擴展能力。最終通過運用圍繞TimeLyre的系列產品實現了對金融行業(yè)海量時序數據入庫、存儲、復雜分析的全面支持。

分布式時序數據庫TimeLyre 9.1發(fā)布:海量存儲、高效壓縮、實時分析

(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )