天天看點

由 Tivoli 軟體支援的 IBM 藍雲計算平台

  IBM在2007年11月15日推出了藍雲計算平台,為客戶帶來即買即用的雲計算平台。它包括一系列的雲計算産品,使得計算不僅僅局限在本地機器或遠端伺服器農場(即伺服器叢集),通過架構一個分布式、可全球通路的資源結構,使得資料中心在類似于網際網路的環境下運作計算。

  通過IBM的技術白皮書,我們可以一窺藍雲計算平台的内部構造。“藍雲”建立在IBM大規模計算領域的專業技術基礎上,基于由IBM軟體、系統技術和服務支援的開放标準和開源軟體。簡單地說,“藍雲”基于IBM Almaden研究中心(Almaden Research Center)的雲基礎架構,包括Xen和PowerVM虛拟化、Linux操 作系統映像以及Hadoop檔案系統與并行建構。“藍雲”由IBM Tivoli軟體支援,通過管理伺服器來確定基于需求的最佳性能。這包括通過能夠跨越多伺服器實時配置設定資源的軟體,為客戶帶來一種無縫體驗,加速性能并确 保在最苛刻環境下的穩定性。IBM新近釋出的“藍雲(Blue Cloud)”計劃,能夠幫助使用者進行雲計算環境的搭建。它通過将Tivoli、DB2、WebSphere與硬體産品(目前是x86刀片伺服器)內建, 能夠為企業架設一個分布式、可全球通路的資源結構。根據IBM的計劃,首款支援Power和x86處理器刀片伺服器系統的“藍雲”産品将于2008年正式 推出,并且計劃随後推出基于System z“大型主機”的雲環境,以及基于高密度機架叢集的雲環境。

在IBM的雲計算白皮書上,我們可以看到如下的藍雲計算平台配置情況。

由 Tivoli 軟體支援的 IBM 藍雲計算平台

圖4示範了藍雲計算的高層架構。可以看到,藍雲計算平台由一個資料中心: IBM Tivoli部署管理軟體(Tivoli Provisioning Manager)、IBM Tivoli監控軟體(IBM Tivoli Monitoring)、IBM WebSphere應用伺服器、IBM DB2資料庫以及一些虛拟化的元件共同組成。圖中的架構主要描述了雲計算的背景架構,并沒有涉及到前台的使用者界面。

藍雲的硬體平台并沒有什麼特殊的地方,但是藍雲使用的軟體平台相較于以前的分布式平台具有不同的地方,主要展現在對與虛拟機的使用以及對于大規模資料 處理軟體Apache Hadoop的部署。Hadoop是網絡開發人員根據Google公司公開的資料開發出來的類似于Google File System的Hadoop File System以及相應的Map/Reduce程式設計規範。現在也正在進一步開發類似于Google的Chubby系統以及相應的分布式資料庫管理系統 BigTable。由于Hadoop是開源的,是以可以被使用者機關直接修改,以适合應用的特殊需求。IBM的藍雲産品則直接将Hadoop軟體內建到自己 本身的雲計算平台之上。

  “藍雲”中的虛拟化

從藍雲的結構上我們還可以看出,在每一個節點上運作的軟體棧與傳統的軟體棧一個很大的不同在于藍雲内部使用了虛拟化技術。虛拟化的方式在雲計算中可以 在兩個級别上實作。一個級别是在硬體級别上實作虛拟化。硬體級别的虛拟化可以使用IBM p系列的伺服器,獲得硬體的邏輯分區LPAR。邏輯分區的CPU資源能夠通過IBM Enterprise Workload Manager來管理。通過這樣的方式加上在實際使用過程中的資源配置設定政策,能夠使得相應的資源合理地配置設定到各個邏輯分區。P系列系統的邏輯分區最小粒度 是1/10顆中央處理器(CPU)。

虛拟化的另外一個級别可以通過軟體來獲得,在藍雲計算平台中使用了Xen虛拟化軟體。Xen也是一個開源的虛拟化軟體,能夠在現有的Linux基礎之上運作另外一個作業系統,并通過虛拟機的方式靈活地進行軟體部署和操作。

通過虛拟機的方式進行雲計算資源的管理具有特殊的好處。由于虛拟機是一類特殊的軟體,能夠完全模拟硬體的執行,是以能夠在上面運作作業系統,進而能夠 保留一整套運作環境語義。這樣,可以将整個執行環境通過打包的方式傳輸到其他實體節點上,這樣就能夠使得執行環境與實體環境隔離,友善整個應用程式子產品的 部署。總體上來說,通過将虛拟化的技術應用到雲計算的平台,可以獲得一些良好的特性。

1. 雲計算的管理平台能夠動态地将計算平台定位到所需要的實體平台上,而無需停止運作在虛拟機平台上的應用程式,這比采用虛拟化技術之前的程序遷移方法更加靈活。

2. 能夠更加有效率地使用主機資源,将多個負載不是很重的虛拟機計算節點合并到同一個實體節點上,進而能夠關閉空閑的實體節點,達到節約電能的目的。

3. 通過虛拟機在不同實體節點上的動态遷移,能夠獲得與應用無關的負載平衡性能。由于虛拟機包含了整個虛拟化的作業系統以及應用程式環境,是以在進行遷移的時候帶着整個運作環境,達到了與應用無關的目的。

4. 在部署上也更加靈活,即可以将虛拟機直接部署到實體計算平台當中。

總而言之,通過虛拟化的方式,雲計算平台能夠達到極其靈活的特性,而如果不使用虛拟化的方式則會有很多的局限。

“藍雲”中的存儲結構

藍雲計算平台中的存儲體系結構對于雲計算來說也是非常重要的,無論是作業系統,服務程式還是使用者應用程式的資料都儲存在存儲體系中。雲計算并不排斥任 何一種有用的存儲體系結構,而是需要跟應用程式的需求結合起來獲得最好的性能提升。總體上來說,雲計算的存儲體系結構包含類似于Google File System的叢集檔案系統以及基于塊裝置方式的存儲區域網絡SAN兩種方式。

在設計雲計算平台的存儲體系結構的時候,不僅僅是需要考慮存儲的容量。實際上随着硬碟容量的不斷擴充以及硬碟價格的不斷下降,使用目前的磁盤技術,可 以很容易通過使用多個磁盤的方式獲得很大的磁盤容量。相較于磁盤的容量,在雲計算平台的存儲中,磁盤資料的讀寫速度是一個更重要的問題。單個磁盤的速度很 有可能限制應用程式對于資料的通路,是以在實際使用的過程中,需要将資料分布到多個磁盤之上,并且通過對于多個磁盤的同時讀寫以達到提高速度的目的。在雲 計算平台中,資料如何放置是一個非常重要的問題,在實際使用的過程中,需要将資料配置設定到多個節點的多個磁盤當中。而能夠達到這一目的的存儲技術趨勢目前有 兩種方式,一種是使用類似于Google File System的叢集檔案系統,另外一種是基于塊裝置的存儲區域網絡SAN系統。

Google檔案系統在前面已經做過一定的描述。在IBM的藍雲計算平台中使用的是它的開源實作Hadoop HDFS (Hadoop Distributed File System)。這種使用方式将磁盤附着于節點的内部,并且為外部提供一個共享的分布式檔案系統空間,并且在檔案系統級别做備援以提高可靠性。在合适的分 布式資料處理模式下,這種方式能夠提高總體的資料處理效率。Google檔案系統的這種架構與SAN系統有很大的不同。

SAN系統也是雲計算平台的另外一種存儲體系結構選擇,在藍雲平台上也有一定的展現,IBM也提供SAN的平台能夠接入到藍雲計算平台中。圖5就是一個SAN系統的結構示意圖。

由 Tivoli 軟體支援的 IBM 藍雲計算平台

從圖5中可以看到,SAN系統是在存儲端建構存儲的網絡,将多個儲存設備構成一個存儲區域網絡。前端的主機可以通過網絡的方式通路後端的儲存設備。而且,由于提供了塊裝置的通路方式,與前端作業系統無關。在SAN連接配接方式上,可以有多種選擇。

一種選擇是使用光纖網絡,能夠操作快速的光纖磁盤,适合于對性能與可靠性要求比較高的場所。另外一種選擇是使用以太網,采取iSCSI協定,能夠運作 在普通的區域網路環境下,進而降低了成本。由于存儲區域網絡中的磁盤裝置并沒有與某一台主機綁定在一起,而是采用了非常靈活的結構,是以對于主機來說可以訪 問多個磁盤裝置,進而能夠獲得性能的提升。在存儲區域網絡中,使用虛拟化的引擎來進行邏輯裝置到實體裝置的映射,管理前端主機到後端資料的讀寫。是以虛拟 化引擎是存儲區域網絡中非常重要的管理子產品。

繼續閱讀