天天看點

《Spark大資料分析實戰》——1.5節本章小結

本節書摘來自華章社群《spark大資料分析實戰》一書中的第1章,第1.5節本章小結,作者高彥傑 倪亞宇,更多章節内容可以通路雲栖社群“華章社群”公衆号檢視

1.5 本章小結

本章首先介紹了spark分布式計算平台的基本概念、原理以及spark生态系統bdas之上的典型元件。spark為使用者提供了系統底層細節透明、程式設計接口簡潔的分布式計算平台。spark具有記憶體計算、實時性高、容錯性好等突出特點。同時本章介紹了spark的計算模型,spark會将應用程式整體翻譯為一個有向無環圖進行排程和執行。相比mapreduce,spark提供了更加優化和複雜的執行流。讀者還可以深入了解spark的運作機制與spark算子,這樣能更加直覺地了解api的使用。spark提供了更加豐富的函數式算子,這樣就為spark上層元件的開發奠定了堅實的基礎。

相信讀者已經想了解如何開發spark程式,接下來将就spark的開發環境配置進行闡述。

繼續閱讀