天天看点

MySQL内核月报 2014.08-MySQL· 捉虫动态·long semaphore waits

<b>现象描述:</b>

innodb引擎,父表和子表通过foreign constraint进行关联,因为在更新数据时需要check外键constraint,当父表被大量的子表referenced时候,那么在open innodb数据字典的时候,需要open所有的child table和所有的foreign constraint,导致持有dict_sys-&gt;mutex时间过长,产生long semaphore wait, 然后innodb crash了。

<b>case复现</b>

<b>分析过程</b>

<b>1. 数据字典</b>

innodb使用系统表空间保存表相关的数据字典,系统的数据字典包括:

在load某个表的时候,分别从这些表中把表相关的index,column, index_field, foreign, foreign_col数据保存到dictionary cache中。 对应的内存对象分别是:dict_col_struct,dict_field_struct,dict_index_struct,dict_table_struct,dict_foreign_struct。

<b>2. open过程</b>

dict_load_table:

<b>3. load foreign的详细过程</b>

3.1 根据表名t1 查找sys_foreign.

而sys_foreign表上一共有三个索引:     

所以,根据for_name='t1', ref_name='t1'检索出来所有相关的foreign_id.

3.2 加入cache

因为没有专门的cache,foreign分别加入到for_name-&gt;foreign_list, ref_name-&gt;referenced_list。 问题的关键:因为foreign是全局唯一的,但foreign又与两个表关联,所以,有可能在open 其它表的时候已经打开过,所以,create foreign对象后,需要判断以下四个list,是否已经存在,如果存在就直接使用。

dict_foreign_find:分别查询这四个list,如果已经存在,则free新建的foreign对象,引用已经存在的。

如果不存在,把新建的foreign加入到for_name-&gt;foreign_list,ref_name-&gt;referenced_list链表中。

<b>4. 问题的原因:</b>

因为第一次load,所以find都没有找到,但这四个都是list,随着open的越来越多,检索的代价越来越大。 而整个过程中,都一直持有trx_sys-&gt;mutex,最终导致了long semaphore wait。

<b>5. 问题改进方法:</b>

在mysql 5.5.39版本中,进行了修复,修复的方法就是,除了foreign_list,referenced_list。 另外又增加了两个red_black tree,如下源码所示:

这样dict_foreign_find的过程中,通过red_black tree进行检索,时间复杂度降到o(log n).

继续阅读