天天看點

《Spark與Hadoop大資料分析》一一1.5 小結

本節書摘來自華章計算機《spark與hadoop大資料分析》一書中的第1章,第1.5節,作者:文卡特·安卡姆(venkat ankam) 更多章節内容可以通路雲栖社群“華章計算機”公衆号檢視。

使用hadoop和spark的大資料分析大緻分為兩大類:資料分析和資料科學。資料分析側重于過去和現在的統計,而資料科學側重于未來的統計。資料科學項目本質上是疊代的,而資料分析項目則不是疊代的。

apache hadoop為你提供了分布式存儲和資源管理,spark為你提供了大資料分析的記憶體級性能。在大資料分析中,需要根據用例的類型及其可行性來使用各種工具和技術。

下一章将幫助你開始學習hadoop和spark。

繼續閱讀