一.Mysql Binlog格式介紹
Mysql binlog日志有三種格式,分别為Statement,MiXED,以及ROW!
1.Statement:每一條會修改資料的sql都會記錄在binlog中。
優點:不需要記錄每一行的變化,減少了binlog日志量,節約了IO,提高性能。(相比row能節約多少性能與日志量,這個取決于應用的SQL情況,正常同一條記錄修改或者插入row格式所産生的日志量還小于Statement産生的日志量,但是考慮到如果帶條件的update操作,以及整表删除,alter表等操作,ROW格式會産生大量日志,是以在考慮是否使用ROW格式日志時應該跟據應用的實際情況,其所産生的日志量會增加多少,以及帶來的IO性能問題。)
缺點:由于記錄的隻是執行語句,為了這些語句能在slave上正确運作,是以還必須記錄每條語句在執行的時候的一些相關資訊,以保證所有語句能在slave得到和在master端執行時候相同 的結果。另外mysql 的複制,像一些特定函數功能,slave可與master上要保持一緻會有很多相關問題(如sleep()函數, last_insert_id(),以及user-defined functions(udf)會出現問題).
使用以下函數的語句也無法被複制:
* LOAD_FILE()
* UUID()
* USER()
* FOUND_ROWS()
* SYSDATE() (除非啟動時啟用了 --sysdate-is-now 選項)
同時在INSERT ...SELECT 會産生比 RBR 更多的行級鎖
2.Row:不記錄sql語句上下文相關資訊,僅儲存哪條記錄被修改。
優點: binlog中可以不記錄執行的sql語句的上下文相關的資訊,僅需要記錄那一條記錄被修改成什麼了。是以rowlevel的日志内容會非常清楚的記錄下每一行資料修改的細節。而且不會出現某些特定情況下的存儲過程,或function,以及trigger的調用和觸發無法被正确複制的問題
缺點:所有的執行的語句當記錄到日志中的時候,都将以每行記錄的修改來記錄,這樣可能會産生大量的日志内容,比如一條update語句,修改多條記錄,則binlog中每一條修改都會有記錄,這樣造成binlog日志量會很大,特别是當執行alter table之類的語句的時候,由于表結構修改,每條記錄都發生改變,那麼該表每一條記錄都會記錄到日志中。
3.Mixedlevel: 是以上兩種level的混合使用,一般的語句修改使用statment格式儲存binlog,如一些函數,statement無法完成主從複制的操作,則采用row格式儲存binlog,MySQL會根據執行的每一條具體的sql語句來區分對待記錄的日志形式,也就是在Statement和Row之間選擇一種.新版本的MySQL中隊row level模式也被做了優化,并不是所有的修改都會以row level來記錄,像遇到表結構變更的時候就會以statement模式來記錄。至于update或者delete等修改資料的語句,還是會記錄所有行的變更。
二.Binlog基本配制與格式設定
1.基本配制
Mysql BInlog日志格式可以通過mysql的my.cnf檔案的屬性binlog_format指定。如以下:
binlog_format = MIXED //binlog日志格式
log_bin =目錄/mysql-bin.log //binlog日志名
expire_logs_days = 7 //binlog過期清理時間
max_binlog_size 100m //binlog每個日志檔案大小
binlog-do-db=需要備份的資料庫名,如果備份多個資料庫,重複設定這個選項即可
binlog-ignore-db=不需要備份的資料庫苦命,如果備份多個資料庫,重複設定這個選項即可
2.Binlog日志格式選擇
Mysql預設是使用Statement日志格式,推薦使用MIXED.
由于一些特殊使用,可以考慮使用ROWED,如自己通過binlog日志來同步資料的修改,這樣會節省很多相關操作。對于binlog資料處理會變得非常輕松,相對mixed,解析也會很輕松(當然前提是增加的日志量所帶來的IO開銷在容忍的範圍内即可)。
3.mysqlbinlog格式選擇
mysql對于日志格式的標明原則:如果是采用 INSERT,UPDATE,DELETE 等直接操作表的情況,則日志格式根據 binlog_format 的設定而記錄,如果是采用 GRANT,REVOKE,SET PASSWORD 等管理語句來做的話,那麼無論如何 都采用 SBR 模式記錄
三.Mysql Binlog日志分析
通過MysqlBinlog指令檢視具體的mysql日志,如下:
///////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////
SET TIMESTAMP=1350355892/*!*/;
BEGIN
/*!*/;
# at 1643330
#121016 10:51:32 server id 1 end_log_pos 1643885 Query thread_id=272571 exec_time=0 error_code=0
Insert into T_test….)
# at 1643885
#121016 10:51:32 server id 1 end_log_pos 1643912 Xid = 0
COMMIT/*!*/;
1.開始事物的時間:
2.sqlevent起點
#at 1643330 :為事件的起點,是以1643330位元組開始。
3.sqlevent 發生的時間點
#121016 10:51:32:是事件發生的時間,
4.serverId
server id 1 :為master 的serverId
5.sqlevent終點及花費時間,錯誤碼
end_log_pos 1643885:為事件的終點,是以1643885 位元組結束。
execTime 0: 花費的時間
error_code=0:錯誤碼
Xid:事件訓示送出的XA事務
Mixed日志說明:
在slave日志同步過程中,對于使用now這樣的時間函數,MIXED日志格式,會在日志中産生對應的unix_timestamp()*1000的時間字元串,slave在完成同步時,取用的是sqlEvent發生的時間來保證資料的準确性。另外對于一些功能性函數slave能完成相應的資料同步,而對于上面指定的一些類似于UDF函數,導緻Slave無法知曉的情況,則會采用ROW格式存儲這些Binlog,以保證産生的Binlog可以供Slave完成資料同步。