天天看点

[MySQL 5.6] 初识5.6的optimizer trace

在MySQL5.6中,支持将执行的SQL的查询计划树记录下来,目前来看,即使对于非常简单的查询,也会打印出冗长的查询计划,看起来似乎不是很可读,不过对于一个经验丰富,对查询计划的生成过程比较了解的DBA而言,这是一个优化SQL的宝藏,因为暴露了大量的内部产生查询计划的信息给用户,这意味着,我们可以对开销较大的部分进行优化。

新参数optimizer_trace可以控制是否为执行的SQL生成查询计划树,默认关闭,我们也建议关闭,因为它会产生额外的性能开销(dimitrik的评测:http://dimitrik.free.fr/blog/archives/2012/01/mysql-performance-overhead-of-optimizer-tracing-in-mysql-56.html)。

我在自己的机器上使用sysbench测试,64个并发,select.lua,纯内存操作,QPS从112,000下降到88,000。

这是session级别的参数,如果需要是,可以在session级别打开,线程只能看到当前会话的查询计划,无法看到其他会话的。

使用也很简单:

打开optimizer_trace

mysql> set session optimizer_trace=’enabled=on';

Query OK, 0 rows affected (0.00 sec)

<执行你的SQL>  (例如,这里执行select * from sbtest1 order by k limit 3;)

然后查询information_schema.optimizer_trace表,输出如下

| select * from sbtest1 order by k limit 3 | {

  “steps”: [

    {

      “join_preparation”: {

        “select#”: 1,

        “steps”: [

          {

            “expanded_query”: “/* select#1 */ select `sbtest1`.`id` AS `id`,`sbtest1`.`k` AS `k`,`sbtest1`.`c` AS `c`,

`sbtest1`.`pad` AS `pad` from `sbtest1` order by `sbtest1`.`k` limit 3″

          }

        ]

      }

    },

      “join_optimization”: {

            “table_dependencies”: [

              {

                “table”: “`sbtest1`”,

                “row_may_be_null”: false,

                “map_bit”: 0,

                “depends_on_map_bits”: [

                ]

              }

            ]

          },

            “rows_estimation”: [

                “table_scan”: {

                  “rows”: 986400,

                  “cost”: 13741

                }

            “considered_execution_plans”: [

                “plan_prefix”: [

                ],

                “best_access_path”: {

                  “considered_access_paths”: [

                    {

                      “access_type”: “scan”,

                      “rows”: 986400,

                      “cost”: 211021,

                      “chosen”: true

                    }

                  ]

                },

                “cost_for_plan”: 211021,

                “rows_for_plan”: 986400,

                “chosen”: true

            “attaching_conditions_to_tables”: {

              “original_condition”: null,

              “attached_conditions_computation”: [

              ],

              “attached_conditions_summary”: [

                {

                  “table”: “`sbtest1`”,

                  “attached”: null

              ]

            }

            “clause_processing”: {

              “clause”: “ORDER BY”,

              “original_clause”: “`sbtest1`.`k`”,

              “items”: [

                  “item”: “`sbtest1`.`k`”

              “resulting_clause_is_simple”: true,

              “resulting_clause”: “`sbtest1`.`k`”

            “refine_plan”: [

                “access_type”: “table_scan”

            “reconsidering_access_paths_for_index_ordering”: {

              “index_order_summary”: {

                “index_provides_order”: true,

                “order_direction”: “asc”,

                “index”: “k”,

                “plan_changed”: true,

                “access_type”: “index_scan”

      “join_execution”: {

    }

  ]

}

###############################################################

主要分为三个部分 

join_preparation:SQL的准备阶段,sql被格式化

对应函数 JOIN::prepare

例如 * 被扩展开来

join_optimization:SQL优化阶段

对应函数JOIN::optimize

join_execution:SQL执行阶段

对应函数:JOIN::exec

可以看到,即便是一条非常简单的SQL,也会打印出很冗长的查询计划。

当然你也可以把查询计划导入到文件中去,例如导入到一个命名为xx.trace的文件,然后用JSON阅读器来查看     

SELECT TRACE INTO DUMPFILE “xx.trace” FROM INFORMATION_SCHEMA.OPTIMIZER_TRACE;

官方文档给出了一个不错的例子,比这里的这个要复杂多了,有兴趣的同学可自行翻阅:http://dev.mysql.com/doc/internals/en/tracing-example.html

之前也写过博客,提及到optimizer trace的相关选项(http://mysqllover.com/?p=470 ):

optimizer_trace有两个字段:

“enabled=on,one_line=off” ,可以通过set 进行字符串更新,前者表示打开optimizer_trace,后者表示打印的查询计划是否以一行显示,还是以json树的形式显示

我们可以在session级别来设这这个参数。

默认optimizer_trace_limit值为1,因此只会保存一条记录。这个设置需要重连session才能生效,另外一个变量optimizer_trace_offset通常与之配合使用,默认值为-1

例如,offset=-1, limit=1将显示最近一次trace

offset=-2,limit=1将显示最近的前一个trace。

offset=-5,limit=5 将最近的5次trace打印出来

 总的来说:

当offset大于0时,则会显示老的从offset开始的limit个trace,也就是说,新的trace没有记下来。

当offset小于0时,则会显示最新的-offset开始的limit个trace,也就是说,只显示新的trace

 注意重设变量会导致trace被清空

另外由于trace数据是存储在内存中的,因此还需要设置optimizer_trace_max_mem_size来限制内存的使用量,否则意外的设置可能导致内存爆掉。这是session级别,不应该设置的过大

optimizer_trace_limit和optimizer_trace_offset也影响占用内存大小,但不应该超过OPTIMIZER_TRACE_MAX_MEM_SIZE

另外,还有个参数optimizer_trace_features,可以控制打印到查询计划树的项,默认情况下是全部打开的,如下:

mysql> show variables like ‘optimizer_trace_features';

+————————–+—————————————————————————-+

| Variable_name            | Value                                                                      |

| optimizer_trace_features | greedy_search=on,range_optimizer=on,dynamic_range=on,repeated_subselect=on |

1 row in set (0.00 sec)

如果你不关心某些查询计划选项,可以将其关闭掉,只打印你关注的,这样可以减小查询计划树的输出,让其更可读一点。

greedy_search:对于有N个表的join操作,可能产生N的阶乘的查询计划路径;

range_optimizer:range优化

dynamic_range:dynamic range optimizer(也就是”range checked  for each row”,每个外部列会执行一次range optimizer);如果关闭该选项的话,只有第一次调用JOIN_TAB::SQL_SELECT才被跟踪

repeated_subselect:子查询,如果关闭的话,只有第一次调用Item_subselect 才被跟踪

—————————————————-

TODO PLAN:增加阈值(读取的行数,或者执行的时间),超过阈值时,自动将trace导入到某个文件中,这样可以便于在线debug

参考:

http://dev.mysql.com/doc/internals/en/optimizer-features-to-trace.html

http://dev.mysql.com/doc/internals/en/system-variables-controlling-trace.html

http://guilhembichot.blogspot.com/2011/09/optimizer-tracing-how-to-configure-it.html

http://jorgenloland.blogspot.com/2011/10/optimizer-tracing-query-execution-plan.html

原创文章,转载请注明: 转载自Simple Life

本文链接地址: [MySQL 5.6] 初识5.6的optimizer trace

文章的脚注信息由WordPress的wp-posturl插件自动生成