天天看點

CA ARCserve Backup系列(5)—使用“重複資料删除”備份

在 CA ARCserve Backup 中,重複資料消除是隻能處理備份伺服器上的單個會話。如果是要備份兩台伺服器(例如C槽),而這兩台伺服器有很多檔案是相同的,則需要使用 “全局重複資料消除” 。

下面是CA 執行dedup的過程——

在第一次備份過程中:

(1)、CA ARCserve Backup 掃描傳入資料并将其分解成塊。此程序在錄音帶引擎的 SIS 層進行。

(2)、 CA ARCserve Backup 執行雜湊演算法,該算法會為每個資料塊指定唯一的值,然後 CA ARCserve Backup 會将這些值儲存到一個哈希檔案中。 

(3)、CA ARCserve Backup 比較哈希值。當發現重複資料之後,資料僅寫入 磁盤一次,并且引用将添加到引用檔案(指向首次識别的該資料塊執行個體的存儲位置)。

在後續備份過程中:

(1)、CA ARCserve Backup 掃描傳入資料并将其分解成塊。

(2)、CA ARCserve Backup 執行雜湊演算法以指定哈希值。 

(3)、 CA ARCserve Backup 将新的哈希值與先前的值進行比較,以查找重複資料。如果發現了重複資料,則資料将不寫入磁盤, 而是使用資料塊原始 執行個體的存儲位置來更新引用檔案。

另外可以使用優化以獲得更好的吞吐量并減少對 CPU 的占用。啟用優化後, CA ARCserve Backup 會掃描檔案屬性,查找檔案标頭級的更改。如果沒有更改,則不對這些檔案執行雜湊演算法,檔案也不會複制到磁盤。雜湊演算法僅會對自上次備份後有所更改的檔案運作。僅在 Windows 卷中支援優化。不支援對基于資料流的備份的優化,例如 SQL VDI、Exchange 資料庫級、Oracle 和 VMware 映像級備份。

下面是做的dedup的實驗。

step1、在啟動項中選擇“重複資料消除備份”

<a href="http://taotao1240.blog.51cto.com/attachment/201204/20/731446_1334883911BvnR.png"></a>

step2、在源中選擇備份一個18.02M的電子書

<a href="http://taotao1240.blog.51cto.com/attachment/201204/20/731446_13348839120Bxk.png"></a>

step3、在“目标”項中選擇建立的“重複資料消除裝置dedup1”,在如下圖的右下角可以看到dedup1裝置的詳細資訊

<a href="http://taotao1240.blog.51cto.com/attachment/201204/20/731446_1334883912O4n8.png"></a>

step4、備份完成

<a href="http://taotao1240.blog.51cto.com/attachment/201204/20/731446_13348839138HuG.jpg"></a>

step5、可以看到在備份目錄的“資料檔案”中多了“000”這個檔案夾

<a href="http://taotao1240.blog.51cto.com/attachment/201204/20/731446_1334883913okmm.jpg"></a>

  看到“000”目錄下的備份資料是18982KB。

<a href="http://taotao1240.blog.51cto.com/attachment/201204/20/731446_1334883914MB2k.jpg"></a>

注:資料檔案存儲已備份資料的唯一執行個體。

step6、再看“索引檔案”中多了如下一些内容,

<a href="http://taotao1240.blog.51cto.com/attachment/201204/20/731446_1334883914SBTy.jpg"></a>

  “000”目錄中包括如下内容,其中由一個計算源檔案得到的hash值的檔案*.hash

<a href="http://taotao1240.blog.51cto.com/attachment/201204/20/731446_1334883915nSQL.jpg"></a>

注: 

  哈希檔案 - 存儲為每個備援資料塊配置設定的标記。 

  引用檔案 - 計算哈希數量,并将位址存儲到與各哈希相對應的資料檔案中。

step8、看到多了“000000002.hash”檔案和“000000002.ref”檔案,兩次hash計算得到的值是一樣的。說明已經成功地經過SIS後再存儲備份檔案。

<a href="http://taotao1240.blog.51cto.com/attachment/201204/20/731446_1334883915rVjc.jpg"></a>

本文轉自 taojin1240 51CTO部落格,原文連結:http://blog.51cto.com/taotao1240/839237,如需轉載請自行聯系原作者