天天看點

redis的持久化rdb和aof的差別

aof,rdb是兩種 redis持久化的機制。用于crash後,redis的恢複。

rdb的特性如下:

Code:

fork一個程序,周遊hash table,利用copy on write,把整個db dump儲存下來。

save, shutdown, slave 指令會觸發這個操作。

粒度比較大,如果save, shutdown, slave 之前crash了,則中間的操作沒辦法恢複。

aof有如下特性:

Code:

把寫操作指令,持續的寫到一個類似日志檔案裡。(類似于從postgresql等資料庫導出sql一樣,隻記錄寫操作)

粒度較小,crash之後,隻有crash之前沒有來得及做日志的操作沒辦法恢複。

兩種差別就是,一個是持續的用日志記錄寫操作,crash後利用日志恢複;一個是平時寫操作的時候不觸發寫,隻有手動送出save指令,或者是關閉指令時,才觸發備份操作。

選擇的标準,就是看系統是願意犧牲一些性能,換取更高的緩存一緻性(aof),還是願意寫操作頻繁的時候,不啟用備份來換取更高的性能,待手動運作save的時候,再做備份(rdb)。rdb這個就更有些 eventually consistent的意思了。

redis持久化RDB和AOF

Redis 持久化:

提供了多種不同級别的持久化方式:一種是RDB,另一種是AOF.

RDB 持久化可以在指定的時間間隔内生成資料集的時間點快照(point-in-time snapshot)。

AOF 持久化記錄伺服器執行的所有寫操作指令,并在伺服器啟動時,通過重新執行這些指令來還原資料集。 AOF 檔案中的指令全部以 Redis 協定的格式來儲存,新指令會被追加到檔案的末尾。 Redis 還可以在背景對 AOF 檔案進行重寫(rewrite),使得 AOF 檔案的體積不會超出儲存資料集狀态所需的實際大小。Redis 還可以同時使用 AOF 持久化和 RDB 持久化。 在這種情況下, 當 Redis 重新開機時, 它會優先使用 AOF 檔案來還原資料集, 因為 AOF 檔案儲存的資料集通常比 RDB 檔案所儲存的資料集更完整。你甚至可以關閉持久化功能,讓資料隻在伺服器運作時存在。

了解 RDB 持久化和 AOF 持久化之間的異同是非常重要的, 以下幾個小節将詳細地介紹這這兩種持久化功能, 并對它們的相同和不同之處進行說明。

RDB 的優點:

RDB 是一個非常緊湊(compact)的檔案,它儲存了 Redis 在某個時間點上的資料集。 這種檔案非常适合用于進行備份: 比如說,你可以在最近的 24 小時内,每小時備份一次 RDB 檔案,并且在每個月的每一天,也備份一個 RDB 檔案。 這樣的話,即使遇上問題,也可以随時将資料集還原到不同的版本。RDB 非常适用于災難恢複(disaster recovery):它隻有一個檔案,并且内容都非常緊湊,可以(在加密後)将它傳送到别的資料中心,或者亞馬遜 S3 中。RDB 可以最大化 Redis 的性能:父程序在儲存 RDB 檔案時唯一要做的就是 fork 出一個子程序,然後這個子程序就會處理接下來的所有儲存工作,父程序無須執行任何磁盤 I/O 操作。RDB 在恢複大資料集時的速度比 AOF 的恢複速度要快。

RDB 的缺點:

如果你需要盡量避免在伺服器故障時丢失資料,那麼 RDB 不适合你。 雖然 Redis 允許你設定不同的儲存點(save point)來控制儲存 RDB 檔案的頻率, 但是, 因為RDB 檔案需要儲存整個資料集的狀态, 是以它并不是一個輕松的操作。 是以你可能會至少 5 分鐘才儲存一次 RDB 檔案。 在這種情況下, 一旦發生故障停機, 你就可能會丢失好幾分鐘的資料。每次儲存 RDB 的時候,Redis 都要 fork() 出一個子程序,并由子程序來進行實際的持久化工作。 在資料集比較龐大時, fork() 可能會非常耗時,造成伺服器在某某毫秒内停止處理用戶端; 如果資料集非常巨大,并且 CPU 時間非常緊張的話,那麼這種停止時間甚至可能會長達整整一秒。 雖然 AOF 重寫也需要進行 fork() ,但無論 AOF 重寫的執行間隔有多長,資料的耐久性都不會有任何損失。

AOF 的優點:

使用 AOF 持久化會讓 Redis 變得非常耐久(much more durable):你可以設定不同的 fsync 政策,比如無 fsync ,每秒鐘一次 fsync ,或者每次執行寫入指令時 fsync 。AOF 的預設政策為每秒鐘 fsync 一次,在這種配置下,Redis 仍然可以保持良好的性能,并且就算發生故障停機,也最多隻會丢失一秒鐘的資料( fsync 會在背景線程執行,是以主線程可以繼續努力地處理指令請求)。AOF 檔案是一個隻進行追加操作的日志檔案(append only log), 是以對 AOF 檔案的寫入不需要進行 seek , 即使日志因為某些原因而包含了未寫入完整的指令(比如寫入時磁盤已滿,寫入中途停機,等等), redis-check-aof 工具也可以輕易地修複這種問題。

Redis 可以在 AOF 檔案體積變得過大時,自動地在背景對 AOF 進行重寫: 重寫後的新 AOF 檔案包含了恢複目前資料集所需的最小指令集合。 整個重寫操作是絕對安全的,因為 Redis 在建立新 AOF 檔案的過程中,會繼續将指令追加到現有的 AOF 檔案裡面,即使重寫過程中發生停機,現有的 AOF 檔案也不會丢失。 而一旦新 AOF 檔案建立完畢,Redis 就會從舊 AOF 檔案切換到新 AOF 檔案,并開始對新 AOF 檔案進行追加操作。AOF 檔案有序地儲存了對資料庫執行的所有寫入操作, 這些寫入操作以 Redis 協定的格式儲存, 是以 AOF 檔案的内容非常容易被人讀懂, 對檔案進行分析(parse)也很輕松。 導出(export) AOF 檔案也非常簡單: 舉個例子, 如果你不小心執行了 FLUSHALL 指令, 但隻要 AOF 檔案未被重寫, 那麼隻要停止伺服器, 移除 AOF 檔案末尾的 FLUSHALL 指令, 并重新開機 Redis , 就可以将資料集恢複到 FLUSHALL 執行之前的狀态。

AOF 的缺點:

對于相同的資料集來說,AOF 檔案的體積通常要大于 RDB 檔案的體積。根據所使用的 fsync 政策,AOF 的速度可能會慢于 RDB 。 在一般情況下, 每秒 fsync 的性能依然非常高, 而關閉 fsync 可以讓 AOF 的速度和 RDB 一樣快, 即使在高負荷之下也是如此。 不過在處理巨大的寫入載入時,RDB 可以提供更有保證的最大延遲時間(latency)。AOF 在過去曾經發生過這樣的 bug : 因為個别指令的原因,導緻 AOF 檔案在重新載入時,無法将資料集恢複成儲存時的原樣。 (舉個例子,阻塞指令 BRPOPLPUSH 就曾經引起過這樣的 bug 。) 測試套件裡為這種情況添加了測試: 它們會自動生成随機的、複雜的資料集, 并通過重新載入這些資料來確定一切正常。 雖然這種 bug 在 AOF 檔案中并不常見, 但是對比來說, RDB 幾乎是不可能出現這種 bug 的。

RDB 和 AOF ,我應該用哪一個?

一般來說,如果想達到足以媲美 PostgreSQL 的資料安全性, 你應該同時使用兩種持久化功能。如果你非常關心你的資料,但仍然可以承受數分鐘以内的資料丢失, 那麼你可以隻使用 RDB 持久化。有很多使用者都隻使用 AOF 持久化, 但我們并不推薦這種方式: 因為定時生成 RDB 快照(snapshot)非常便于進行資料庫備份, 并且 RDB 恢複資料集的速度也要比 AOF 恢複的速度要快, 除此之外, 使用 RDB 還可以避免之前提到的 AOF 程式的 bug 。因為以上提到的種種原因, 未來我們可能會将 AOF 和 RDB 整合成單個持久化模型。 (這是一個長期計劃。)

RDB 快照:

在預設情況下, Redis 将資料庫快照儲存在名字為 dump.rdb 的二進制檔案中。你可以對 Redis 進行設定, 讓它在“ N 秒内資料集至少有 M 個改動”這一條件被滿足時, 自動儲存一次資料集。你也可以通過調用 SAVE 或者 BGSAVE , 手動讓 Redis 進行資料集儲存操作。比如說, 以下設定會讓 Redis 在滿足“ 60 秒内有至少有 1000 個鍵被改動”這一條件時, 自動儲存一次資料集:

save 60 1000

這種持久化方式被稱為快照(snapshot)。

快照的運作方式:

當 Redis 需要儲存 dump.rdb 檔案時, 伺服器執行以下操作:

Redis 調用 fork() ,同時擁有父程序和子程序。

子程序将資料集寫入到一個臨時 RDB 檔案中。

當子程序完成對新 RDB 檔案的寫入時,Redis 用新 RDB 檔案替換原來的 RDB 檔案,并删除舊的 RDB 檔案。

這種工作方式使得 Redis 可以從寫時複制(copy-on-write)機制中獲益。

隻進行追加操作的檔案(append-only file,AOF)

快照功能并不是非常耐久(durable): 如果 Redis 因為某些原因而造成故障停機, 那麼伺服器将丢失最近寫入、且仍未儲存到快照中的那些資料。盡管對于某些程式來說, 資料的耐久性并不是最重要的考慮因素, 但是對于那些追求完全耐久能力(full durability)的程式來說, 快照功能就不太适用了。

從 1.1 版本開始, Redis 增加了一種完全耐久的持久化方式: AOF 持久化。

你可以通過修改配置檔案來打開 AOF 功能:

appendonly yes

從現在開始, 每當 Redis 執行一個改變資料集的指令時(比如 SET), 這個指令就會被追加到 AOF 檔案的末尾。

這樣的話, 當 Redis 重新啟時, 程式就可以通過重新執行 AOF 檔案中的指令來達到重建資料集的目的。

AOF 重寫:

因為 AOF 的運作方式是不斷地将指令追加到檔案的末尾, 是以随着寫入指令的不斷增加, AOF 檔案的體積也會變得越來越大。舉個例子, 如果你對一個計數器調用了 100 次 INCR , 那麼僅僅是為了儲存這個計數器的目前值, AOF 檔案就需要使用 100 條記錄(entry)。然而在實際上, 隻使用一條 SET 指令已經足以儲存計數器的目前值了, 其餘 99 條記錄實際上都是多餘的。為了處理這種情況, Redis 支援一種有趣的特性: 可以在不打斷服務用戶端的情況下, 對 AOF 檔案進行重建(rebuild)。執行 BGREWRITEAOF 指令, Redis 将生成一個新的 AOF 檔案, 這個檔案包含重建目前資料集所需的最少指令。

AOF 有多耐久?

你可以配置 Redis 多久才将資料 fsync 到磁盤一次。

有三個選項:

每次有新指令追加到 AOF 檔案時就執行一次 fsync :非常慢,也非常安全。

每秒 fsync 一次:足夠快(和使用 RDB 持久化差不多),并且在故障時隻會丢失 1 秒鐘的資料。

從不 fsync :将資料交給作業系統來處理。更快,也更不安全的選擇。

推薦(并且也是預設)的措施為每秒 fsync 一次, 這種 fsync 政策可以兼顧速度和安全性。

總是 fsync 的政策在實際使用中非常慢, 即使在 Redis 2.0 對相關的程式進行了改進之後仍是如此 —— 頻繁調用 fsync 注定了這種政策不可能快得起來。

如果 AOF 檔案出錯了,怎麼辦?

伺服器可能在程式正在對 AOF 檔案進行寫入時停機, 如果停機造成了 AOF 檔案出錯(corrupt), 那麼 Redis 在重新開機時會拒絕載入這個 AOF 檔案, 進而確定資料的一緻性不會被破壞。

當發生這種情況時, 可以用以下方法來修複出錯的 AOF 檔案:

為現有的 AOF 檔案建立一個備份。

使用 Redis 附帶的 redis-check-aof 程式,對原來的 AOF 檔案進行修複。

$ redis-check-aof --fix

(可選)使用 diff -u 對比修複後的 AOF 檔案和原始 AOF 檔案的備份,檢視兩個檔案之間的不同之處。

重新開機 Redis 伺服器,等待伺服器載入修複後的 AOF 檔案,并進行資料恢複。

AOF 的運作方式

AOF 重寫和 RDB 建立快照一樣,都巧妙地利用了寫時複制機制。

以下是 AOF 重寫的執行步驟:

Redis 執行 fork() ,現在同時擁有父程序和子程序。

子程序開始将新 AOF 檔案的内容寫入到臨時檔案。對于所有新執行的寫入指令,父程序一邊将它們累積到一個記憶體緩存中,一邊将這些改動追加到現有 AOF 檔案的末尾: 這樣即使在重寫的中途發生停機,現有的 AOF 檔案也還是安全的。當子程序完成重寫工作時,它給父程序發送一個信号,父程序在接收到信号之後,将記憶體緩存中的所有資料追加到新 AOF 檔案的末尾。現在 Redis 原子地用新檔案替換舊檔案,之後所有指令都會直接追加到新 AOF 檔案的末尾。

為最新的 dump.rdb 檔案建立一個備份。

将備份放到一個安全的地方。

執行以下兩條指令:

redis-cli> CONFIG SET appendonly yes

redis-cli> CONFIG SET save “”

確定指令執行之後,資料庫的鍵的數量沒有改變。

確定寫指令會被正确地追加到 AOF 檔案的末尾。

步驟 3 執行的第一條指令開啟了 AOF 功能: Redis 會阻塞直到初始 AOF 檔案建立完成為止, 之後 Redis 會繼續處理指令請求, 并開始将寫入指令追加到 AOF 檔案末尾。

步驟 3 執行的第二條指令用于關閉 RDB 功能。 這一步是可選的, 如果你願意的話, 也可以同時使用 RDB 和 AOF 這兩種持久化功能。

别忘了在 redis.conf 中打開 AOF 功能! 否則的話, 伺服器重新開機之後, 之前通過 CONFIG SET 設定的配置就會被遺忘, 程式會按原來的配置來啟動伺服器。

RDB 和 AOF 之間的互相作用:

在版本号大于等于 2.4 的 Redis 中, BGSAVE 執行的過程中, 不可以執行 BGREWRITEAOF 。 反過來說, 在 BGREWRITEAOF 執行的過程中, 也不可以執行 BGSAVE 。

這可以防止兩個 Redis 背景程序同時對磁盤進行大量的 I/O 操作。

如果 BGSAVE 正在執行, 并且使用者顯示地調用 BGREWRITEAOF 指令, 那麼伺服器将向使用者回複一個 OK 狀态, 并告知使用者, BGREWRITEAOF 已經被預定執行: 一旦 BGSAVE 執行完畢, BGREWRITEAOF 就會正式開始。當 Redis 啟動時, 如果 RDB 持久化和 AOF 持久化都被打開了, 那麼程式會優先使用 AOF 檔案來恢複資料集, 因為 AOF 檔案所儲存的資料通常是最完整的。

備份 Redis 資料:

Redis 對于資料備份是非常友好的, 因為你可以在伺服器運作的時候對 RDB 檔案進行複制: RDB 檔案一旦被建立, 就不會進行任何修改。 當伺服器要建立一個新的 RDB 檔案時, 它先将檔案的内容儲存在一個臨時檔案裡面, 當臨時檔案寫入完畢時, 程式才使用 原子地用臨時檔案替換原來的 RDB 檔案。這也就是說, 無論何時, 複制 RDB 檔案都是絕對安全的。

繼續閱讀