时间序列数据库概览——基于文件（RRD）、K/V数据库（influxDB）、关系型数据库

2017-11-16 23:50:00

一般人们谈论时间序列数据库的时候指代的就是这一类存储。按照底层技术不同可以划分为三类。

另外一类数据库其表结构是：

[timestamp] [d1] [d2] .. [dn] [v1] [v2] .. [vn]

其优化的查询方式不限于查询原始数据，而是可以组合查询条件并且做聚合计算，比如：

我们希望时间序列数据库不仅仅可以提供原始数据的查询，而且要支持对原始数据的聚合能力。这种聚合可以是在入库阶段完成的，所谓物化视图。也可以是在查询阶段完成，所谓实时聚合。根据实际情况，可以在这两种方式中进行取舍。

想要在在查询阶段做数据的聚合和转换，需要能够支持以下三点。

用索引检索出行号：能够从上亿条数据中快速过滤出几百万的数据。

从主存储按行号加载：能够快速加载这过滤出的几百万条数据到内存里。

分布式计算：能够把这些数据按照GROUP BY 和 SELECT 的要求计算出最终的结果集。

要想尽可能快的完成整个查询过程，需要在三个环节上都有绝招。传统上说，这三个步骤是三个不同的技术领域。

Druid.io。

摘自：http://www.infoq.com/cn/articles/database-timestamp-01

本文转自张昺华-sky博客园博客，原文链接：http://www.cnblogs.com/bonelee/p/6432562.html，如需转载请自行联系原作者

继续阅读