天天看點

專家答疑:重複資料删除在雲中是如何工作的?

雲和其他存儲平台中的重複資料删除是一種從資料流中删除重複或重複資料以減少存儲在裝置或系統中的實體資料量的過程。

在主存儲中,重複資料删除有助于通過删除相同的資料塊并使用中繼資料将資料的邏輯副本與實際資料相關聯,進而減少所消耗的實體空間量。 在公共雲中,存儲平台的重複資料删除功能不會暴露給使用者。

如果提供商選擇在雲計算中實施重複資料删除,那麼該保護對于雲提供商來說是有益的。 這是因為存儲空間是基于所使用的邏輯容量(而不是實體容量)來計費的,任何節省的開支都是由服務提供商提供的,以提供更便宜的服務或降低成本。

但是對于使用雲端存儲進行備份的人來說,存在一個問題。将多個備份映像複制到雲上将消耗大量的存儲空間,這比使用磁盤系統等磁盤系統作為存儲目标時要大得多。

雲端的重複資料删除有許多解決方案。許多備份軟體平台将在源上重複資料删除,并僅保留實體存儲上的重複資料删除資料。備份軟體擁有并管理中繼資料由邏輯到實體狀态轉換。

另一種方法是尋找可以提供存儲接口并進行重複資料删除的存儲網關。在這種情況下,管理者不依賴于備份軟體,資料可以更容易地導入其他平台。

最明顯的問題是,使用任何備份軟體都将擁有中繼資料,是以,理想情況下,存儲重複資料删除網關是更好的選擇。這樣可以確定備份環境中的資料在備份軟體之外是可移植的,而不需要對資料進行補充,進而将資料轉移到另一個平台。

除了雲中的重複資料删除之外,該過程在虛拟機組中運作良好,在虛拟機中,基本作業系統在多個虛拟機中是相似的或相同的。

在備份世界中,重複資料删除用于減少在執行相同資料集(例如vm)的重複備份時存儲的實體資料量。當備份之間的實際資料隻有一小部分(例如5%到10%)發生變化時,重複資料删除技術可確定實體空間消耗盡可能最優。備份系統可以看到重複資料删除率為20:1及更高。

本文轉自d1net(轉載)