

国双技术全景
TECHNOLOGY PANORAMA
概念解析
时序数据库全称为时间序列数据库。时序数据库主要用于指处理带时间标签(按照时间的顺序变化,即时间序列化)的数据,带时间标签的数据也称为时间序列数据。时间序列数据主要来自油气行业、能源行业、汽车行业、电力行业、制造行业等各类型实时监测、检查与分析设备所采集、产生的数据,这些工业数据的典型特点是:产生频率快(每一个监测点一秒钟内可产生多条数据)、严重依赖于采集时间(每一条数据均要求对应唯一的时间)、测点多信息量大(常规的实时监测系统均有成千上万的监测点,监测点每秒钟都产生数据,每天产生几百GB的数据量)。
国双对时序数据库的研究正不断取得可喜进展,从最开始的Cassandra, 单节点存储的数据少于1.5T,每秒支撑200+查询的时序数据库,发展为可存储计算PB级数据量,写吞吐量提升了4.5x,磁盘占比减少了2.1x,查询性能最高达到45x的提升,形成自主知识产权、自主可控的时序数据库。

国双优势
国双时序数据库产品优势:
1)专为时序数据设计的高性能数据仓储,时序数据存储引擎可以实现高吞吐速度与数据压缩率,使用极简架构设计理念,没有任何其它外部依赖;
2)通过插件可以实现对其它数据库协议的接入,如Graphite、collectd 和 OpenTSDB;
3)强大的类SQL查询引擎,方便数据聚合查询;
4)动态Tags和Measurement理念,使得series能够被迅速而高效地检索;
5)高效地淘汰过期数据的保留策略;
6)预聚合功能可以自动定时聚合数据,使得需要频繁执行的检索更加高效。根据行业特色沉淀技术特色,比如提供获取截面数据API方便智能诊断的场景。
应用场景:所有有时序数据产生,并且需要展现其历史趋势、周期规律、异常性的,进一步对未来做出预测分析的,都是时序数据库适合的场景。
演进路线
-
2019年
时序数据库首先应用于国双CPS (Cyber-Physical System,工业互联基础平台)。同年应用于国双工业互联网平台Gridsum COMPaaS,服务于石油、交通、农业等行业客户。