天天看點

新型RAID技術

概述

大家知道随着磁盤容量的增大,資料在RAID級别的存儲可靠性受到了極大的威脅。其最為突出的問題是磁盤重構時間大為增加,對于RAID6而言三塊盤壞的幾率也大為增加,與此同時,應用性能在磁盤重構時也大為降低。這就是目前傳統RAID所遇到的最棘手的問題,很多存儲廠商都在想辦法解決目前RAID所遇到的問題。針對RAID所遇到的問題,我想基本有兩種解決方案,一種就是像當年從RAID5過渡到RAID6一樣,為資料增加備援資訊,進而可以增強壞盤數量的容錯能力。另一種方法是要改變現有RAID架構,使得RAID架構更加靈活,進而減少RAID的資料重構時間,降低RAID失效的可能性。在此,我對市場上的幾種新型RAID進行了調研,在此總結一下。

中科藍鲸的Smart RAID

×××計算技術研究所存儲中心是國内做存儲技術的核心團隊,其産業化公司是中科藍鲸。前一段時間推出了一種比較新穎的磁盤陣列,專門應用于視訊監控領域,這種RAID被稱之為smart RAID。該RAID的示意圖如下圖所示:

新型RAID技術

從這張圖中我們可以看出,該RAID的核心思想是将一個大RAID分解成若幹個小RAID,當一個小RAID中發現錯誤塊的時候,僅僅重構這個小RAID,而無需将整個磁盤上的資料全部重構一遍。這種做法顯然帶來了一個最大的好處,減少了重構時間。其實,這種方法是有理論根據的。人們發現絕大部分的磁盤壞不是整塊磁盤損壞,絕大部分情況是部分磁盤上的塊出現了問題。基于這種發現,我們可以采用部分重構的方法替代整塊磁盤重構,是以,這種解決方案原有的RAID分成了若幹個小RAID。看似這種解決方案比較完美,但是,還是存在一些問題,如果整塊磁盤損壞了怎麼辦?如果預留的空閑區域不夠用怎麼辦?如果空閑區域存在壞塊怎麼辦?如果同時有幾個小RAID在做資料重構,性能會怎麼樣?是以,個人以為這種方案靈活性還是不夠。由于中科藍鲸的磁盤陣列是在視訊監控領域應用,對資料的可靠性要求不一定很高,但是對持續資料流寫性能有很高的要求,是以,這種方案比傳統的RAID5更能滿足視訊監控的應用需求。

Quantum Dynamic Disk Pool

Quantum有一種和傳統RAID有所不同的RAID技術,這種技術被稱之為Dynamic Disk Pool。其核心思想可以采用下圖進行描述。

新型RAID技術

圖中,不同顔色的酷塊組成了一個小RAID,這個和中科藍鲸的優點類似,即采用局部塊建構傳統RAID。這種思想都是基于新型壞盤模型提出來的。所不同的是,每個小RAID都會有自己的Spare D-Piece,并且針對不同的小RAID,這些Spare D-Piece會分布在不同的磁盤上,也就是分布式空閑塊的思想。這種做法的好處是顯而易見的,如果有多個小RAID在同時重構資料的時候,所有重構資料将會分布到多個磁盤上,而不會集中在幾個固定的磁盤上。這種解決方案不僅利用了局部重構的思想,并且将空閑塊分布式,擷取最大的重構性能,進而減少重構時間。

這種解決方案的問題是,一旦一個磁盤被剔除RAID,一個新盤被加入之後,空閑快将會集中在新加入的盤上,分布式的空閑空間随着磁盤的替換而變得不存在。如下圖所示,前圖是替換之前的資料分布,後圖是資料重構之後,新盤加入之後的情景。

新型RAID技術

為了解決上述問題,有些解決方案為了擷取分布式空閑空間帶來的好處,會考慮進行一些資料遷移操作,但是會影響系統性能。

NetApp DDP

NetApp的新RAID技術也被稱之為Dynamic Disk Pool,并且在很多術語上面和Quantum的相同。但是,從NetApp的技術白皮書上來看,NetApp的DDP和Quantum的DDP還是有很大差别的。Quantum的DDP從資料布局的角度來講還是比較固定的,這點和中科藍鲸的解決方案是一緻的。從NetApp的技術描述來看,磁盤上的資料布局是不固定的,是靈活的。下圖是NetApp DDP在遇到整塊磁盤損壞時資料恢複的示意圖。

新型RAID技術

從這張圖中我們可以體會到一旦磁盤損壞之後,故障磁盤上的資料将會被重構到其他運作良好的磁盤上。這種磁盤的選擇應該是有算法的,據說是采用了僞随機磁盤選擇算法。從白皮書簡短的描述中,我可以體會到NetApp應該采用了類似存儲虛拟化的技術。如果這樣,整個架構将會變得十分靈活,資料可靠性将會比現有RAID提高很多。

IBM Declustered RAID

IBM的Declustered RAID技術是在其GPFS中應用的一種非傳統RAID技術。下圖是采用declustered RAID技術之後磁盤上的資料分布。從圖中可以看出,RAID是在基于磁盤塊的,而不是在整塊磁盤上建構的。這是和傳統RAID一個很重要的差別。另外,資料在磁盤上的分布式随機的,不知道是否采用了虛拟化的技術?通過虛拟化的技術對磁盤實體資料塊進行管理,然後通過資源配置設定的方式擷取實體塊,并且在這些實體塊的基礎上建構RAID。

新型RAID技術

IBM的Declustered RAID可以使得空閑資源分布化,進而提高資料重構性能,可以降低資料重構的時間。

Panasas Object Store

小結

繼續閱讀