【MySQL】再說MySQL中的 table_id

【背景】

最近線上一個執行個體出現了主從資料不一緻的情況,也即從庫丢失資料的情況。根本原因:"由于table_list->table_id為uint,而m_table_id為ulong，主庫上assign的table map　id 總是一直遞增的

當超過2^32後，備庫出現溢出，導緻row模式下備庫對應table id的事件全部丢失,産生主備不一緻。"

【問題分析】

一 table_id 介紹

當MySQL 開啟日志模式時，binlog會記錄所有對資料庫的變更操作。binlog 分兩種模式 statement 模式和row 模式。

當資料庫的binlog format 是statement 模式時

例子：資料庫中執行一條語句

root@rac2 [yangyi]> insert into t1 values(9);

Query OK, 1 row affected (0.00 sec)

root@rac2 [yangyi]> show binlog events in 'mysql-bin.000003';

+------------------+-----+-------------+-----------+-------------+----------------------------------------+

| mysql-bin.000003 | 4 | Format_desc | 2 | 106 | Server ver: 5.1.68-log, Binlog ver: 4 |

| mysql-bin.000003 | 106 | Query | 2 | 176 | BEGIN |

| mysql-bin.000003 | 176 | Query | 2 | 265 | use `yangyi`; insert into t1 values(8) |

| mysql-bin.000003 | 265 | Xid | 2 | 292 | COMMIT /* xid=12 */ |

| mysql-bin.000003 | 292 | Query | 2 | 369 | use `yangyi`; flush tables |

| mysql-bin.000003 | 369 | Query | 2 | 439 | BEGIN |

| mysql-bin.000003 | 439 | Query | 2 | 528 | use `yangyi`; insert into t1 values(9) |

| mysql-bin.000003 | 528 | Xid | 2 | 555 | COMMIT /* xid=15 */ |

8 rows in set (0.00 sec)

binlog 的log event 記錄如下:

#140511 14:44:12 server id 2 end_log_pos 439 Query thread_id=1 exec_time=0 error_code=0

SET TIMESTAMP=1399790652/*!*/;

BEGIN

/*!*/;

# at 439

#140511 14:44:12 server id 2 end_log_pos 528 Query thread_id=1 exec_time=0 error_code=0

insert into t1 values(9)

# at 528

#140511 14:44:12 server id 2 end_log_pos 555 Xid = 15

COMMIT/*!*/;

從日志分析來看，DML會記錄為原始的SQL，也就是記錄在QUERY_EVENT中。

當資料庫的binlog format 是row模式時

執行insert 操作

root@rac2 [yangyi]> insert into t1 values(6);

root@rac2 [yangyi]> show binlog events in 'mysql-bin.000002';

+------------------+-----+-------------+-----------+-------------+---------------------------------------+

| mysql-bin.000002 | 4 | Format_desc | 2 | 106 | Server ver: 5.1.68-log, Binlog ver: 4 |

| mysql-bin.000002 | 106 | Query | 2 | 176 | BEGIN |

| mysql-bin.000002 | 176 | Table_map | 2 | 219 | table_id: 18 (yangyi.t1) |

| mysql-bin.000002 | 219 | Write_rows | 2 | 253 | table_id: 18 flags: STMT_END_F |

| mysql-bin.000002 | 253 | Xid | 2 | 280 | COMMIT /* xid=61 */ |

5 rows in set (0.00 sec)

binlog中記錄的資訊：

# at 176

# at 219

#140511 14:31:43 server id 2 end_log_pos 219 Table_map: `yangyi`.`t1` mapped to number 18

#140511 14:31:43 server id 2 end_log_pos 253 Write_rows: table id 18 flags: STMT_END_F

BINLOG '

TxlvUxMCAAAAKwAAANsAAAAAABIAAAAAAAEABnlhbmd5aQACdDEAAQMAAQ==

TxlvUxcCAAAAIgAAAP0AAAAAABIAAAAAAAEAAf/+BgAAAA==

'/*!*/;

### INSERT INTO `yangyi`.`t1`

### SET

### @1=6 /* INT meta=0 nullable=1 is_null=0 */

# at 253

#140511 14:31:43 server id 2 end_log_pos 280 Xid = 61

從解析的binlog中可以看出row模式下,DML操作會記錄為:TABLE_MAP_EVENT+ROW_LOG_EVENT（包括WRITE_ROWS_EVENT ，UPDATE_ROWS_EVENT，DELETE_ROWS_EVENT).

為什麼一個update在ROW模式下需要分解成兩個event：一個Table_map，一個Update_rows。我們想象一下，一個update如果更新了10000條資料，那麼對應的表結構資訊是否需要記錄10000次?其實是對同一個表的操作，是以這裡binlog隻是記錄了一個Table_map用于記錄表結構相關資訊,而後面的Update_rows記錄了更新資料的行資訊。他們之間是通過table_id來聯系的。

二 table_id 的特性

1 table_id 并不是固定的,它是當表被載入記憶體(table_definition_cache)時，臨時配置設定的，是一個不斷增長的變量。

2 當有新的table變更時，在cache中沒有，就會觸發一次load table def的操作，此時就會在原先最後一次table_id基礎上+1，做為新的table def的id。

3 flush tables，之後對表的更新操作也會觸發table_id 的增長。

4 如果table def cache過小，就會出現頻繁的換入換出，進而導緻table_id增長比較快。

例子

root@rac2 [yangyi]> show binlog events in 'mysql-bin.000002';

| mysql-bin.000002 | 280 | Query | 2 | 357 | use `yangyi`; flush tables |

| mysql-bin.000002 | 357 | Query | 2 | 427 | BEGIN |

| mysql-bin.000002 | 427 | Table_map | 2 | 470 | table_id: 19 (yangyi.t1) |

| mysql-bin.000002 | 470 | Write_rows | 2 | 504 | table_id: 19 flags: STMT_END_F |

| mysql-bin.000002 | 504 | Xid | 2 | 531 | COMMIT /* xid=65 */ |

10 rows in set (0.00 sec)

三 table_id在主從複制過程中轉變

每一個dml操作表的資訊都被會記錄table_mapping的hash資料結構中,hash的key就是ulong型的table_id,hash的值就是TABLE*的資料結構(包含了表的各種資訊，包括資料庫名，表名，字段數，字段類型等)，通過set_table()方法來hash,通過get_table()方法來根據table_id獲得對應的表資訊。

當主庫的日志傳遞到備庫時，每一個log_event都是通過do_apply_event()方法來将event應用到本地資料庫中。在apply relay log中的event時,do_apply_event()将ulong型的m_table_id(binlog記錄的table_id)指派給RPL_TABLE_LIST結構中的uint型的table_id。核心問題出現了: 如果binlog 中的table_id 的值大于max(uint)，在變量傳遞是，就會發生截斷。

而MySQL内部使用set_table(table_id)構造hash，使用get_table(m_table_id)從hash表中取值,在兩個階段用到的key因為發生了資料截斷,是以必然也就不能取到預期的值。也就是說之前用uint型的table_id建構出來的key-value的hash對，用ulong型的m_table_id是無法查詢到的。

四風險與解決

從第二，三點我們知道當table_id 過快增長,會導緻從庫應用binlog無法解析到對應的表，造成資料不一緻的情況。

解決方法:

1 加大 table cache 的大小。

2 重新開機主庫使table_id 歸0，缺點成本比較高，出現此問題的時候，主備已經不一緻，線上環境不能完成切換。

3 修改MySQL源碼,将 RPL_TABLE_LIST結構中的uint型的table_id修改為ulong型，一勞永逸。

五參考文章

【MySQL】再說MySQL中的 table_id

繼續閱讀

Ubuntu16.04安裝Apache+MySQL+PHP1. 安裝Apache2. 安裝MySQL3. 安裝PHP4. 安裝phpMyAdmin

Linxu常用指令技巧彙總

ERROR 1 (HY000): Can't create/write to file '/tmp/#sql_4188_1.MYI' (Errcode: 28)

艱難安裝LDAP,SSL認證

《Linux指令行與Shell腳本程式設計大全第2版.布盧姆》pdf

MySQL的4種隔離級别？出現問題

XX系統實施過程問題總結

無元件上傳圖檔到資料庫中，最完整解決方案

【MySQL資料庫】資料庫索引事務1.索引2.事務

neo4j之cypher使用文檔

NOSQL安全攻擊

mybatis_入門程式Mybatis入門

mysql使用source指令導入.sql檔案

登入plsql 報錯 the account is locked --使用者被鎖

sqlServer根據經緯查距離

SequoiaDB巨杉資料庫C++驅動概述