天天看點

重複資料删除

重複資料删除

  重複資料删除技術在一兩年前已經收到人們的關注,重複資料删除初創廠商Data Domain公司在一兩年更是吸引了人們大部分的眼球,業績的飛速增長、使用者的迅速增加,讓Data Domain公司以讓人難以置信的速度擴張着,Data Domain更是在06年納斯達克上市。然而在2008年,重複資料删除領域,已經不再是Data Domain一家風光了,EMC、IBM、NetApp、飛康、Sepaton、HP、Sun、HDS、昆騰等公司紛紛行動起來,瞬間,整個市場由一枝獨秀變成群雄逐鹿了,而且整個市場呈現出熱鬧的同時,也彰顯出雜亂,各家都有各家的技術、沒有一個恒定的标準來衡量技術的好壞。出現這種局面,究其原因,主要是有兩方面:一是存儲發展到目前這個階段,使用者資料的迅速膨脹、存儲容量的快速增長,重複資料的日益增加,讓重複資料删除這個市場發展迅速,各大廠商看到了這個市場的無窮潛力;二是整個經濟大環境的不好,讓廣大使用者開始縮減IT開支,減少IT裝置的采購,停止花錢大手大腳,趨向于選擇經濟實惠的技術,而重複資料删除技術天生的特點決定了它必将受到使用者的青睐。是以這兩方面的原因鑄就了重複資料删除技術在2008年從年頭火到年尾的局面。

  算法、處理方式的争執

  算法的優劣、處理方式的好壞一直是重複資料删除領域争執的焦點,2008年同樣不例外。目前重複資料删除技術主要分為兩種:Post-Processing和In-line。Post-Processing技術是先把所有備份資料存好,然後再在第二時間做重複資料删除工作。In-line技術則是在備份的過程中就開始做重複資料删除工作。這兩種技術孰優孰劣似乎并不好去判别,每種技術的代表廠商都說自己技術更好。從筆者的角度來看,Post-Processing技術也許更加安全、可靠、準确,但是在犧牲備份時間、備份效率的前提下;而In-line技術則可以大大提高備份效率、縮短備份時間,但可能會犧牲資料備份的準确性;同時,備份時間縮短、備份視窗的增多也給系統性能提出了很高的要求;是以對In-line技術的重複資料删除算法的準确性、備份系統的高性能都有着很高的要求。

  正是這種差異化,造成了重複資料删除領域的争執,Post-Processing的代表是:飛康、Sepaton;In-line的代表是IBM Diligent、Data Domain。其他一些如昆騰、EMC則是兩種方式都有。

  産品 OR 功能--這是個問題

  根據著名資訊機構TechValidate調查,重複資料删除技術已經進入了産品或者功能化的階段,Data Domain和Sepaton都已經開始推出綜合性重複資料删除解決方案,但是其他廠商如飛康和Quantum顯然想把重複資料删除作為現有産品的一個功能來推廣。

  TechValidate的研究表明,46%的最終使用者表示他們願意将重複資料删除作為傳統存儲産品的一個新功能來使用,而44%的人希望把它作為一款新的獨立産品來使用。剩下的10%的使用者未發表意見。

  研究還發現,大部分IT專業人士(75%)希望能夠把重複資料删除內建到硬體之中,不管是以陣列的功能形式展現還是裝置的方式展現均可,他們不願意使用軟體形式如備份程式的重複資料删除功能。對于那些将軟體作為重複資料删除功能的首選方案的IT專業人士來說,結構上的問題是最大的問題。 對于希望使用基于硬體或者裝置的重複資料删除解決方案的IT專業人士來說,易于管理則是他們選購時考慮的主要因素。

  從調查資料可以看出重複資料删除經過今年的發展,已經開始逐漸走向成熟。由于廠商對待重複資料删除的态度不同,使得重複資料删除在未來呈現出兩種模式給使用者,以飛康、昆騰傳統備份廠商為代表的廠商更加傾向于把重複資料删除當做備份解決方案中的一個功能來推廣,而Data Domain等新興公司則是推出以重複資料删除為基礎的解決方案。至于這兩種模式未來哪種會占優勢,還要看使用者未來對待備份的态度。

  使用者該如何選擇?

  2008年的重複資料删除市場熱鬧非凡,市場上的吆喝聲是越來越大,衆廠商無不賣力的吆喝着自己重複資料删除産品的領先,有的吆喝自己算法優秀、有的吆喝自己處理方式先進、有的吆喝自己解決方案全面、有的甚至吆喝出重複資料删除比的承諾,一時間呈現出一幅“衆王婆吆喝圖”,好一幅熱鬧的景象。那麼使用者又該相信哪個“王婆”呢?

  其實相信“王婆”,還不如相信自己的判斷。重複資料删除技術優點很多,但是弱點也不少,好比公園裡的開屏孔雀,正面華麗無比,背面卻可能留着個秃尾巴。是以使用者在選擇重複資料删除産品時不僅要關注其好的方面,更需要透過廠商有點“變味”和“華麗”的宣傳,尋找到産品的弱點。

  使用者選購重複資料删除産品時,應該以正确的心态去面對它,重複資料删除産品選購有以下四大注意事項:重複資料删除是否對你有意義、重複資料删除對現有備份環境有多大影響、重複資料安全性如何保障、重複資料删除的擴充性和成本,正是從使用者自身角度來看待重複資料删除産品。相信使用者隻要很好的遵循這四個角度去選購重複資料删除産品,一定能夠選購到最适合自己的産品,也一定能夠讓使用者的備份環境得到更好的優化。

  廠商在重複資料删除領域的重要動态

  EMC。2008年EMC在完成收購Avarmar後,通過整合Avarmar産品,将重複資料删除技術納入到EMC的BuRA備份政策當中去。但是非常有趣的是,EMC公司并沒有停止在重複資料删除領域的動作,除了擁有Avarmar的産品外,EMC還和昆騰、飛康具有很好的合作關系,最新消息顯示EMC、Dell、昆騰這三家已經開始圍繞重複資料删除技術展開一系列的合作。

  IBM。2008年,IBM在完成收購Diligent後,快速将Diligent重複資料删除産品整合到IBM産品線中。與此同時,IBM并沒有放棄與飛康方面的緊密合作。這種作法跟EMC的做法類似。

  HP。整個2008年,HP在重複資料删除方面動作并沒有EMC、IBM那麼大,它并沒有選擇去收購重複資料删除技術廠商,而是在企業級方案中OEM Sepaton的産品,這也很容易了解,HP在VTL方面是Sepaton的一個很重要的OEM夥伴;在中小企業級方案中,HP目前計劃自己開發重複資料删除技術。

  Sun。Sun公司由于在VTL方面一直跟飛康有着緊密的合作,之前也OEM Diligent的重複資料删除産品,由于IBM公司已經把Diligent公司收購了,出于競争關系,未來Sun公司可能會在重複資料删除技術領域跟飛康有着更加緊密的聯系。

  NetApp。NetApp公司2008年在重複資料删除技術領域動作可謂頗多。相比于其他廠商熱衷于OEM 别人的産品或技術外,NetApp公司在重複資料删除技術領域堅持走自己研發的道路,除了在備份領域外,NetApp公司更是把重複資料删除技術這項功能納入到主存儲範圍之内,雖然重複資料删除技術在主存儲的應用看似還不那麼可靠,但未嘗不是一個大膽的嘗試。

  HDS。HDS公司之前一直是OEM Diligent公司的産品,之後IBM公司收購Diligent後,有消息傳出,HDS将繼續保持跟Diligent公司的良好合作。

  Data Domain。2008年,Data Domain推出了其第四代重複資料删除技術,并且進軍中國市場,發展迅速的同僚,也會發現開始遇到了很多競争對手,EMC、IBM、NetApp這些大廠的介入,讓Data Domain公司将來會遇到很大的壓力。