分区索引的应用和实践 - 阿里云RDS PostgreSQL最佳实践

2021-11-09 06:34:52

postgresql , partial index , partition index

当表很大时，大家可能会想到分区表的概念，例如用户表，按用户id哈希或者范围分区，拆成很多表。

又比如行为数据表，可以按时间分区，拆成很多表。

拆表的好处：

1、可以将表放到不同的表空间，表空间和块设备挂钩，例如历史数据访问量低，数据量大，可以放到机械盘所在的表空间。而活跃数据则可以放到ssd对应的表空间。

2、拆表后，方便维护，例如删除历史数据，直接drop table就可以了，不会产生redo。

索引实际上也有分区的概念，例如按user id hash分区，按时间分区等。

分区索引的好处与分区表的好处类似。同时还有其他好处：

1、不需要被检索的部分数据，可以不对它建立索引。

例如一张用户表，我们只检索已激活的用户，对于未激活的用户，我们不对它进行检索，那么可以只对已激活用户建立索引。

2、不同构造的数据，可以使用不同的索引接口。

例如某张表里面数据出现了倾斜，某些value占比很高，而某些value占比则很低。我们可以对占比很高的value使用bitmap或者gin的索引方法，而对于出现频率低的使用btree的索引方法。

那么我们接下来看看postgresql分区索引是如何实现的？

首先是全局索引，就是我们平常建立的索引。

1、在搜索数据时，用户带上索引分区条件，索引字段。使用对应的操作符，即可实现分区索引的检索。

2、分区索引通常用在多个条件的搜索中，其中分区条件作为其中的一种搜索条件。当然它也能用在对单个列的搜索中。

3、postgresql除了支持分区索引（partial index），还支持表达式索引、函数索引。

继续阅读