這一兩年Spark技術很火,自己也湊熱鬧,反複的試驗、研究,有痛苦萬分也有欣喜若狂,抽空把這些整理成文章共享給大家。這個系列基本上圍繞了Spark生态圈進行介紹,從Spark的簡介、編譯、部署,再到程式設計模型、運作架構,最後介紹其元件SparkSQL、Spark Streaming、Spark MLib和Spark GraphX等。文章内容的整理一般是先介紹原理,随後是實戰例子,由于面向的是入門讀者,在實戰中多截圖,還請諒解。為了大家實驗友善,在這裡把實驗相關的測試資料和安裝包放在百度盤提供 連結: 連結: https://pan.baidu.com/s/1LP6PKGzIWQzF8e-dTklxkg 提取碼: it28
本系列部落格在部落格園和CSDN首發,位址為:
部落格園 http://www.cnblogs.com/shishanyuan
CSDN http://blog.csdn.net/yirenboy
以下為該系列文章清單:
1.Spark及其生态圈簡介 下載下傳
2.Spark編譯與部署(上)--基礎環境搭建 下載下傳
2.Spark編譯與部署(中)--Hadoop編譯安裝 下載下傳
2.Spark編譯與部署(下)--Spark編譯安裝 下載下傳
3.Spark程式設計模型(上)--程式設計模型及SparkShell實戰 下載下傳
3.Spark程式設計模型(下)--IDEA搭建及實戰 下載下傳
4.Spark運作架構 下載下傳
5.Hive(上)--Hive介紹及部署 下載下傳
5.Hive(下)--Hive實戰 下載下傳
6.SparkSQL(上)--SparkSQL簡介 下載下傳
6.SparkSQL(中)--深入了解運作計劃及調優 下載下傳
6.SparkSQL(下)--Spark實戰應用 下載下傳
7.Spark Streaming(上)--實時流計算Spark Streaming原理介紹 下載下傳
7.Spark Streaming(下)--實時流計算Spark Streaming實戰 下載下傳
8.Spark MLlib(上)--機器學習及SparkMLlib簡介 下載下傳
8.Spark MLlib(下)--機器學習庫SparkMLlib實戰 下載下傳
9.Spark圖計算GraphX 下載下傳
10.分布式記憶體檔案系統Tachyon介紹及安裝部署 下載下傳
作者:石山園 出處:http://www.cnblogs.com/shishanyuan/
本文版權歸作者和部落格園共有,歡迎轉載,但未經作者同意必須保留此段聲明,且在文章頁面明顯位置給出原文連接配接,否則保留追究法律責任的權利。如果覺得還有幫助的話,可以點一下右下角的【推薦】,希望能夠持續的為大家帶來好的技術文章!想跟我一起進步麼?那就【關注】我吧。