星環(huán)科技分布式時序數據庫TimeLyre 9.2發(fā)布:原生多模態(tài)、高性能計算、極速時序回放分析

在當今數據驅動的世界中,多模態(tài)數據已經成為企業(yè)的重要資產。隨著數據規(guī)模和多樣性的不斷增加,企業(yè)不僅需要高效存儲和處理這些數據,更需要從中提取有價值的洞察。工業(yè)領域在處理海量設備時序數據的同時,還需要聯(lián)動分析警報信息、設備關系、組織信息等關系數據或圖數據;金融領域除了常見的行情和訂單流時序數據外,還會采用地理信息、實時新聞、氣象數據等多種類型的數據輔助決策。然而,要充分挖掘和利用這些多模態(tài)數據,傳統(tǒng)單一模型的時序數據庫已顯得力不從心,無法滿足現(xiàn)代多元應用場景中企業(yè)對數據使用的復雜需求。

Transwarp TimeLyre是星環(huán)科技自主研發(fā)的企業(yè)級分布式時序數據庫,具備高吞吐實時寫入、時序精準查詢、超高數據壓縮率等特點,可以支持海量時序數據的存儲、查詢、分析,有效支撐能源、制造、金融領域等多種時序數據業(yè)務場景。

近日,TimeLyre正式發(fā)布V9.2版本,支持海量時序數據的同時,具備原生的多模態(tài)數據混合存儲能力,能夠整合和處理不同類型的數據,幫助企業(yè)實現(xiàn)數據的多維分析。同時提供高性能分析、熱溫冷數據分層存儲、極速時序數據回放分析等新功能,可以有效支撐大規(guī)模時序數據湖、投研一體化平臺、時序數據中臺等新場景,充分滿足企業(yè)對多模態(tài)數據存儲分析的需求,助力企業(yè)發(fā)揮數據深層價值。

原生多模態(tài)架構,支持時序數據與關系數據模型混合存儲

TimeLyreV9.2采用原生多模態(tài)架構,來自多種數據源的時序和關系數據經由統(tǒng)一的接口以批量或實時的方式存入統(tǒng)一的存儲引擎中,通過統(tǒng)一的高性能計算引擎Quark進行讀取和分析,支撐上層模型加工、批處理、在線分析、高性能讀取等場景,助力企業(yè)更全面、更多維度的數據分析應用。

不同于傳統(tǒng)方案為不同類型的數據單獨部署和使用不同的數據庫產品,TimeLyre以原生的多模態(tài)架構高效實現(xiàn)了多種數據模型的轉化流轉與關聯(lián)分析,具有復雜度低、開發(fā)和運維成本低、數據處理效率高等優(yōu)勢。

圖片1111.png

高性能C++計算引擎,向量化計算,顯著提升數據分析性能

依托于星環(huán)科技統(tǒng)一的多模型數據管理平臺架構,TimeLyre在計算引擎中納入了高性能C++計算引擎技術,通過使用向量化計算,充分利用了現(xiàn)代CPU的SIMD指令集,借助列式掃描減少了IO開銷。同時采用高性能數據傳輸格式,實現(xiàn)了數據零拷貝,減少了序列化和反序列化的開銷,并借助列式存儲和高壓縮率,減少了網絡傳輸的數據量,便于數據更快速地接入高性能C++分析引擎。通過采用高性能分析計算引擎,可以幫助用戶顯著提高數據處理能力和效率,更快獲取分析結果,加速決策過程,降低能耗和硬件成本,幫助用戶在數據驅動的商業(yè)環(huán)境中保持領先。

熱溫冷數據自動分層存儲,降低存儲成本,優(yōu)化資源配置

TimeLyre提供全新的熱溫冷數據分層存儲方案,統(tǒng)一接收外部應用的數據寫入和數據查詢,內部按時間或指定條件將熱數據、溫數據和冷數據進行自動轉換。對于熱數據,可以實現(xiàn)毫秒級查詢性能,提供5倍以上數據壓縮率;溫數據支持百毫秒查詢性能,提供15倍以上壓縮率;冷數據提供30倍以上數據壓縮率,滿足數據批量加工需求。熱溫冷數據的分層僅需在建表時通過DDL指定,無需后期運維,即可實現(xiàn)定期后臺自動分層。同時支持指定數據存儲在不同的存儲介質上,進一步降低綜合存儲成本,優(yōu)化資源配置。

圖片2222.png

支撐分布式極速時序回放分析引擎TransMatrix,助力時序數據回放分析

TransMatrix是星環(huán)研發(fā)的分布式投研系統(tǒng),用戶可以將多種數據結構、多種頻率(高、中、低頻)的數據按照時間順序進行回訪;支持原生多模態(tài)數據源回放,可以從星環(huán)TDH中直接讀取和加工數據源,除了時序和關系數據之外,還支持文本數據、圖數據、圖片數據等,同時允許用戶借助Python開源生態(tài)對多模態(tài)數據進行加工和分析;內置豐富的時序算子庫,支持自定義算子開發(fā)與共享;采用事件驅動的編程范式,提供生成式算子開發(fā)接口;提供算子拼接接口與豐富的內置表達式,支持用戶自定義表達式;通過分布式任務實現(xiàn)多租戶負載均衡、提供分布式任務配置接口,可實現(xiàn)任務拆分、批量運行、大規(guī)模采樣等大型任務。

新場景:大規(guī)模時序數據湖引擎,助力企業(yè)應對海量時序數據

用戶可以基于TimeLyre構建大規(guī)模時序數據湖,海量時序數據通過流式引擎進入數據湖內,依托TimeLyre完成ODS層、DW層、維度層數據加載與處理,通過豐富的API接口和開源生態(tài)接口支撐上層應用開發(fā)、風險識別、模型訓練、實時展示、數據智能、時序分析等業(yè)務場景。以TimeLyre為核心構建時序數據湖,充分利用了產品對海量實時數據的存儲與查詢分析能力,實時寫入性能可達每節(jié)點千萬測點,實時查詢性能可達每節(jié)點10000QPS。結合流、批計算引擎,滿足業(yè)務對端到端秒級時效性的要求。同時支持時序數據與關系數據高效關聯(lián)分析、提供完善的SQL支持與靈活可變的Schema定義,為用戶提供全面、高效、靈活的數據管理分析平臺。

圖片3333.png

新場景:投研一體化平臺技術底座,搭建分布式投研框架

面向金融投研場景,TimeLyre可以作為投研一體化平臺的技術底座,助力企業(yè)搭建分布式投研框架。底層依托時序數據庫TimeLyre及其內置的分布式投研計算引擎TransMatrix構建投研平臺核心技術底座,通過標準數據接口、因子開發(fā)接口、策略開發(fā)接口和分布式任務開發(fā)接口對接上層業(yè)務模型,助力企業(yè)在一體化平臺內實現(xiàn)數據泰索、因子研究、策略回測等應用開發(fā)。

圖片4444.png

新場景:投研數據中臺數據底座,實現(xiàn)多源數據分層管理

依托TimeLyre構建投研數據中臺,參考標準數據分層結構,可將數據分為數據源層、基礎數據層、投研標準層、業(yè)務模型層與收益報表層。在數據源層負責從數據廠商、交易所數據、用戶因子數據等外部數據源同步數據,可以做到將原始的行情或因子數據以完全一致的形式同步入投研數據中臺;基礎數據層負責完成數據的校驗、清洗與加工,生成干凈的基礎投研數據;投研標準層負責將這些數據統(tǒng)一成面向投研過程的標準表模型以及數據結構模型,為用戶屏蔽掉不同來源數據在字段名、字段類型等方面的差異;業(yè)務模型層負責生成面向特定研究過程的因子與數據;收益報表層負責生成面向投研收益評價的因子與數據,可以將策略的研究結果、投研結果以報表的形式存在時序模型或關系模型中。

圖片5555.png

依托TimeLyre構建投研數據中臺可以對接豐富的外部數據源,實現(xiàn)多層次外部數據錄入,支持以投研領域常見的文件形式加載數據、從主流數據庫(MySQL、Oracle等)進行數據同步、通過類似SQL的API接收交易所實時行情、通過Kafka統(tǒng)一接受數據等多種數據接入方式。同時為了應對數據實時和批量更新的需求,提供專業(yè)的ETL工具,可以實現(xiàn)數據的一鍵重入,開啟一鍵重入即可自動觸發(fā)多層次數據加工,實現(xiàn)投研數據的自動更新,并通過統(tǒng)一的API提供給業(yè)務人員進行研究使用。

圖片6666.png

賦能業(yè)務:TimeLyre助力某光伏企業(yè)打造批流一體時序數據湖方案

某光伏企業(yè)為解決數據孤島問題,依托星環(huán)科技分布式時序數據庫TimeLyre構建批流一體的時序數據湖。首先通過數采設備從數據源系統(tǒng)中獲取原始數據,統(tǒng)一經由Kafka消息系統(tǒng)匯入數倉平臺的數據接入區(qū),并通過TimeLyre自帶的流處理引擎Slipstream將數據加載到內部的貼源層,實現(xiàn)時序數據、關系數據等多模態(tài)數據的統(tǒng)一存儲。數倉內部通過統(tǒng)一的計算引擎和SQL引擎將數據加工到不同的層次,包括標準表DWD層、中間表MID層、模型表DWS層、維度表DIM層和業(yè)務寬表ADS層等,用以支撐上層業(yè)務報告、BI報表、數據智能、實時分析對比、三維展示等應用場景。值得注意的是數倉平臺以TimeLyre為核心,僅通過TimeLyre一個數據庫,就實現(xiàn)了時序數據、關系數據從貼源層到應用層的加工、分析和查詢。

圖片7777.png

項目基于星環(huán)大數據技術實現(xiàn)了光伏數據的統(tǒng)一接入,包括設備測點數據的實時接入以及管理數據、巡檢圖片、運行日志等數據的全量接入,目前已實現(xiàn)基地3300多臺設備、近30萬測點數據的秒級入庫。并且方案具備水平擴展能力,未來增加硬件資源,也可順利接入新建場站數據。

同時依托星環(huán)科技時序數據庫、批處理引擎和分析庫構建的光伏數據底座,可以實現(xiàn)各類數據的存儲和數倉模型加工,通過統(tǒng)一的計算引擎和統(tǒng)一的數據接口,支撐各類可視化數據應用的構建,方便光伏實驗實證分析人員利用大數據技術開展數據對比分析、設備性能查詢、運行曲線查看等日常工作。

此外基于星環(huán)一體化平臺與數據資產管理,實現(xiàn)了全平臺數據的統(tǒng)一授權、開發(fā)、治理、開放、審計,讓各部門的開發(fā)人員,可以快速便利的獲得所需的數據資源,并基于高性能的時序數據湖平臺進行數據分析。

(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )