MySQL内核月报 2014.10-MariaDB· 新鲜特性·ANALYZE statement 语法

2021-11-07 06:23:21

mariadb 10.1版本中新增加了一个 analyze statement 命令。这个命令跟 explain statement 命令类似，但不同的是， analyze statement 命令调用优化器生成执行计划并且会真实的去执行语句，再用 explain 的输出来替代结果集，并且 explain 结果是实际语句执行中统计出来的。

这个语句可以让你检查优化器估算的执行计划代价和实际执行差多少。

<b>命令的输出</b>

我们可以看到 analyze 命令多了r_rows和r_filterd两行，我们来比较一下 explain 计算的 rows/filtered 和 analyze 计算的 r_rows/r_filtered 两列的区别。

r_rows 是基于实际观察的 rows 列，它表示实际从表中读取了多少行数据。

r_filtered 是基于实际观察的 filtered 列，它表示经过应用where条件之后还有百分之多少的数据剩余。

<b>输出结果解析</b>

让我们来看一个更复杂的sql。

从上面的结果，我们可以获得如下信息：

对于 customer 表，customer.rows=149095, customer.r_rows=150000. 从这两个值来看，优化器对 customer 表的访问估算还是很准确的。

customer.filtered=18.08, customer.r_filtered=9.13. 优化器有点高估了`customer` 表所匹配的记录的条数。（一般来说，当你有个全表扫描，并且 r_filtered 少于15%的时候，你得考虑为表增加相应的索引了）

orders.filtered=100, orders.r_filtered=30.03. 优化器无法预估经过条件（orders.o_totalprice > 200*1000）检查后还剩多少比例的记录。因此，优化器显示了100%。事实上，这个值是30%，通常来说30%的过滤性并不值得去建一个索引。但是对于多表join，采集和使用列统计信息也许对查询有帮助，也可能帮助优化器选择更好的执行计划。（因为在关联中，关联条件和普通过滤条件组合以后，可能过滤性会非常好，并且有助于优化器判断哪张表做驱动表比较好）

然后我们再把前面的例子稍微修改一下

这里我们可以看到 orders.r_rows=null，以及 orders.r_filtered=null。这意味着 orders 表连一次都没有被扫描到。

MySQL内核月报 2014.10-MariaDB· 新鲜特性·ANALYZE statement 语法

继续阅读

2022秋招面试总结（cpp+java+测开）百度测开一面字节后端一面虾皮后端一面虾皮后端二面

数据库之DDL操作数据库DDL操作数据库DDL操作数据表

数据库之DQL操作数据库

mysql优化（sql优化）

数据迁移方法数据迁移原则数据迁移之双写方案数据迁移之级联同步方案

redis集群数据一致性_RedisRaft为Redis集群带来强大的数据一致性

宝塔面板mysql恢复2018.1.8更新

Centos7 MySQL 5.7 安装MySQL 5.7 安装

查找入职员工时间排名倒数第三的员工所有信息

Hibernate使用Hibernate的“3个准备，7个步骤”Hibernate API简介操作实体对象对象识别

云计算面试题——mysql/存储引擎/备份

SQL语言基础：常用的数据查询语句

Ubuntu16.04安装Apache+MySQL+PHP1. 安装Apache2. 安装MySQL3. 安装PHP4. 安装phpMyAdmin

MySQL的4种隔离级别？出现问题

neo4j之cypher使用文档

mysql使用source命令导入.sql文件