大家都知道,postgresql 近几大版本中加入了很多 olap 相关特性。9.6 的并行扫描应该算最大的相关特性。在今年发布的 10.0 中,并行扫描也在不断加强,新增了并行的索引扫描。
我们知道并行扫描是支持外部数据源的。在云上,有很多存储存储产品可以以外部数据源的形式做数据库的外部存储。例如,阿里云的 oss 和 aws 的 s3 都是绝佳的外部数据源。云上的 postgresql 和他们的结合可以给用户提供既廉价又高性能数存储的方案。
另人欣喜的是,postgresql 的外部表对外提供了可编程接口,并且支持并行扫描框架。利用它可以使 postgresql 的外部数据源访问效率得到质的提升。
并行查询是 postgresql 引入的一个大特性,它可以优化 sql 语句的执行方式,从传统的单一进程,最多使用单个 cpu 运算的模式,提升到多进程,协同完成工作的模式。
并行查询消耗更多的硬件资源,大大提高了任务的执行效率。
在 postgresql 中,一个 sql 任务是否可以被并行化,可以通过查看 sql 的执行计划(plan)的方式看到。
例如:
可以看到,上面的 sql 采用了并行的方式执行,它使用了2个额外的并行工作进程(共3个进程)完成工作。
并行 worker 主要完成顺序扫描数据的和过滤数据的工作,符合条件的数据被发送给主进程。
主进程的 gather 节点接受来自子进程的数据,再发给客户端。
合理的配置下列参数能让 postgresql 成功开启并行查询特性。
max_worker_processes 整个实例允许的最大并行工作进程,它的值建议和实例所在主机的逻辑 cpu 相关
max_parallel_workers_per_gather 单个 gather 节点的并行度,让单个 sql 更快的执行,可以增大该参数的设置。
force_parallel_mode 是否让查询优化器尽可能的选择并行的执行方式。
<a href="https://www.postgresql.org/docs/9.6/static/when-can-parallel-query-be-used.html">详细的参数描述在这</a>
外部表是 postgresql 引入外部数据的入口,任何的外部数据源都可以使用该接口把数据引入到数据库中。用户可以像访问表一样读写外部数据源上的数据。
目前 postgresql 支持的常见外部数据源有 mysql oracle postgresql oss s3 等。
postgresql 在引入并行查询时也支持了外部表的并行查询,并扩展了之前的编程接口。
一条 sql 语句的执行通常经历下面的过程:
1) 语法分析和语意分析
2) 查询优化
3) 查询执行
外部表的扫描在阶段 2 和 3 都有相应的操作
查询优化阶段,需要提供对应外部数据源的数据大小(行数和行宽度)等信息,用于优化器计算最优的查询路径
查询执行阶段,需要实现几个回调函数,用于向执行器(executor)输送以行(slot)为单位的数据,直到外部数据读取完成。
并行查询模式的引入,是 postgresql 在传统的 pipeline 模式上的较大改动。
大致的改进点如下,这部分也是外部表的并行查询模式实现所要注意的
一 查询优化阶段
提供给优化器并行模型的各类代价信息,参与优化器进行整体的代价评估。
当并行模式最终被确认为最优方案后,优化器会给出并行模式的执行计划。
二 查询执行器阶段
执行器得到一个带有并行执行节点的计划,还要进行如下工作
启动并行工作进程。
开辟相关共享内存结构,准备交换数据。
构造并行协作相关内存结构。
给工作进程下发并行相关的执行任务。
并行执行,并行工作进程拿到数据做相应的处理后发送给主进程的 gather 节点,主进程的 gather 节点拿到数据后返回给上层节点。直到所有数据处理完毕。
释放资源,处理事物信息。
上诉工作中框架相关的通用工作 postgresql 已经完成,我们需要在并行框架下实现各阶段的部分逻辑。下面将会重点说明这部分细节。
实现外部表的并行扫描需要注意上述环节中每个环节,下面描述概要设计
一: 查询优化阶段
实现 isforeignscanparallelsafe ,返回 true。 标志该数据源可以并行化。
补充函数 getforeignpaths 根据外数据的规模和可提供的并行工作进程数等信息提供给优化器可以行并行 path。
调用 create_foreignscan_path 创建可并行的外部表扫描节点 path。
调用 add_partial_path 把生成好的 path 加入优化器 path 备选队列。
补充函数 getforeignplan 创建可并行的外部表扫描节点 plan。
函数内部调用 make_foreignscan 根据输入的 path 生成 plan, 并向上返回。
二: 查询执行阶段
并行任务关键当然是把一个大的任务拆分成多个尽可能不相关的子任务,让这些子任务被并行的完成。
1 对外部 mysql 一张表 t 的读取,可以按照表 t 主键的值域把数据拆分成 n 部分,让并行 worker 分别读取其中一部分。
2 对外部数据源 oss 一个目录 dir1 中多个文件中数据的读取,可以把这批文件均匀的分成 n 份,让并行 worker 分别完成其中的一部分。
如何合理的切分子任务,往往决定了最终的并行效果。合理的切分数据会使并行任务间尽量少的交互,最终任务完成耗时和并行工作进程数线性相关。
执行器的具体工作:
实现 estimatedsmforeignscan 计算需求的共享内存大小。这部分内存将用户存放整个并行任务的相关信息。
这部分流程主进程完成,即 gather 节点完成。
实现 initializedsmforeignscan 分配共享内存,放入相关信息。
我们把整个大任务拆分成一个子任务队列,并存入到共享内存中,初始化锁等信息。
这部分流程也主进程完成,即 gather 节点完成。
实现 initializeworkerforeignscan 并行 worker 读取共享内存上的信息,获取子任务,准备正式开始工作。
数据的读写操作。
这部分的实现尽量兼容传统模式的数据读取,或小幅调整。
实现 shutdownforeignscan 数据扫描完成的后清理工作。
<a href="https://www.postgresql.org/docs/9.6/static/fdw-callbacks.html">详细的 foreign data wrapper 接口实现说明在这</a>
并行查询能大大提高数据的访问效率,他把外部数据源深度整合到 postgresql 中。可以轻松的和本地数据一起做复杂的运算。同时,我们也能利用这套机制,实现高效的外部数据导入工作。