天天看點

《Spark與Hadoop大資料分析》——第3章 深入剖析Apache Spark

Apache Spark 的技術、社群和使用者群都在快速增長。2015 年推出了兩個新的API:DataFrame API 和 DataSet API。這兩個 API 建構在基于 RDD 的核心 API 之上。我們有必要了解 RDD 的更深層概念,包括運作時的架構和它在 Spark 各種資料總管上的表現。

本章分為以下子主題:

《Spark與Hadoop大資料分析》——第3章 深入剖析Apache Spark

繼續閱讀