天天看點

大資料時代下的備份與恢複革命

【51cto.com快譯】随着全球資料總量的爆炸式增長,我們必須改變對相關資訊的保護方式。

過去五年以來,應用程式的規範已經迎來徹底轉變。如今,我們需要在應用當中實作更多靈活性、可擴充性與可用性要求。在如今這個時代,應用的主要趨勢開始轉向社交平台、移動裝置與軟體即服務(簡稱saas)。另外,其需要有能力從各種來源處擷取批量資料,同時實時處理以提供背景資訊或者業務洞穴能力,借此建立競争優勢。為了滿足這些新型需求,企業無法再單純依賴于傳統關系型資料庫。有鑒于此,一系列新型資料庫系統應運而生,其本質上具備分布式與橫向擴充特性,能夠被部署在商用硬體之上,同時提供可協調的統一性與性能調整機制。更重要的是,為了滿足靈活性需求,雲端資料庫即服務模式亦得到廣泛采用。

為了幫助大家了解這場分布式資料庫變革的規模之大,我們整理出了以下圖表,可以看到nosql類搜尋數量正呈現出急劇上升之勢。

大資料時代下的備份與恢複革命

這意味着資料保護要求已經徹底改變,且受到資料至上時代的大力推動(包括web規模應用以及分布式資料庫)。企業需要收集大量資料并從中擷取有價值資訊,用以帶來更為可觀的商業價值以及更為迅捷的決策制定能力。大部分分布式與雲資料庫已經提供複制功能,用于滿足資料保護及可用性要求。然而,我們仍然需要解決可擴充時間點備份與恢複這一重大難題。如果沒有時間點備份的支援,企業将時刻面臨着因人為錯誤、邏輯損壞或者其它營運故障造成的資料丢失風險。

傳統備份解決方案主要面向關系型資料庫設計,即面向共享式存儲并采用acid事務模型。遺憾的是,這類設計無法滿足分布式場景下的時間點備份要求(包括本地存儲、最終一緻性以及基礎設施的彈性特質)。

考慮到資料庫架構已經發生本質性轉變,資料保護舉措亦需要進行重新定義與重新設計。以下為資料保護在大資料時代下面臨的新挑戰:

·擷取最終一緻性資料庫的一套持久性時間點備份副本,我們将其稱為目前全新分布式時代下資料保護的“版本控制”新規範:備份到快照到複制到複制資料管理再到版本控制。

·最大程度降低故障恢複時間(即低rto)。

·随應用程式的實際需求進行規模擴充。

·允許輕松更新測試/開發環境以實作持續開發。

·在發生故障時提供營運彈性。

·提供立足于公有雲或者内部資料中心的部署靈活性。

大多數企業正在積極投資企業級時間點備份與恢複産品,進而確定自身能夠安心在分布式資料庫之上部署并擴充下一代應用程式。在未來五年内,各企業将重新定義資料保護技術,進而切實滿足下一代應用的實際需要。

作者:核子可樂譯

來源:51cto