天天看點

《Hadoop MapReduce實戰手冊》一導讀

《Hadoop MapReduce實戰手冊》一導讀

hadoop mapreduce實戰手冊

本書目标是幫助讀者學會處理大型的複雜資料集。本書雖從簡單的例子開始,但仍然可以看到深入的内容。這是一本簡單的一站式指南,傳授如何完成複雜的事情。它以一種簡單而直接的方式呈現了90個攻略,給出了一步步的指導和真實環境的應用示例。

本書涵蓋的内容

第1章解釋了如何以單點模式以及叢集模式安裝和運作hadoop。

第2章介紹了一套進階的hdfs操作,在處理大規模資料時,無論是用hadoop mapreduce還是用非mapreduce用例,這些操作都很有用。

第3章解釋了如何改變hadoop部署的配置和安全性,以及如何調試。

第4章介紹了幾種進階的hadoop mapreduce特性,這些特性将有助于你開發高度定制化的、高效的mapreduce應用程式。

第5章介紹了其他與hadoop相關的項目,如hbase、hive和pig。

第6章解釋了如何使用hadoop來計算基本的統計分析資訊。

第7章介紹幾種可以與apache hadoop協同使用的工具和技術,讓你可以進行大規模的搜尋和索引。

第8章介紹了如果使用hadoop實作複雜的算法,如聚類、推薦和關系發現。

第9章解釋了如何使用hadoop和mahout處理海量文本資料集,以及如何使用hadoop實作資料預處理和加載操作。

第10章解釋了如何使用亞馬遜彈性mapreduce(elastic mapreduce,emr)和apache whirr在雲基礎設施上部署和執行hadoop mapreduce、pig、hive和hbase計算。

第3章 進階hadoop mapreduce運維

第4章 開發複雜的hadoop mapreduce應用程式

第5章 hadoop生态系統

第6章 分析

第7章 搜尋和索引

第8章 聚類、推薦和關系發現

第9章 海量文本資料處理

第10章 雲端部署——在雲上使用hadoop