![](https://img.laitimes.com/img/9ZDMuAjOiMmIsIjOiQnIsIyZuBnL5gTYjJTZwkTMyczNiRmZjF2MjJTYhRTZjRGNhlTYmRDZ0ImNxczMx8CXt92Yu4GZjlGbh5SZslmZxl3Lc9CX6MHc0RHaiojIsJye.png)
hadoop mapreduce實戰手冊
本書目标是幫助讀者學會處理大型的複雜資料集。本書雖從簡單的例子開始,但仍然可以看到深入的内容。這是一本簡單的一站式指南,傳授如何完成複雜的事情。它以一種簡單而直接的方式呈現了90個攻略,給出了一步步的指導和真實環境的應用示例。
本書涵蓋的内容
第1章解釋了如何以單點模式以及叢集模式安裝和運作hadoop。
第2章介紹了一套進階的hdfs操作,在處理大規模資料時,無論是用hadoop mapreduce還是用非mapreduce用例,這些操作都很有用。
第3章解釋了如何改變hadoop部署的配置和安全性,以及如何調試。
第4章介紹了幾種進階的hadoop mapreduce特性,這些特性将有助于你開發高度定制化的、高效的mapreduce應用程式。
第5章介紹了其他與hadoop相關的項目,如hbase、hive和pig。
第6章解釋了如何使用hadoop來計算基本的統計分析資訊。
第7章介紹幾種可以與apache hadoop協同使用的工具和技術,讓你可以進行大規模的搜尋和索引。
第8章介紹了如果使用hadoop實作複雜的算法,如聚類、推薦和關系發現。
第9章解釋了如何使用hadoop和mahout處理海量文本資料集,以及如何使用hadoop實作資料預處理和加載操作。
第10章解釋了如何使用亞馬遜彈性mapreduce(elastic mapreduce,emr)和apache whirr在雲基礎設施上部署和執行hadoop mapreduce、pig、hive和hbase計算。
第3章 進階hadoop mapreduce運維
第4章 開發複雜的hadoop mapreduce應用程式
第5章 hadoop生态系統
第6章 分析
第7章 搜尋和索引
第8章 聚類、推薦和關系發現
第9章 海量文本資料處理
第10章 雲端部署——在雲上使用hadoop