《Hadoop与大数据挖掘》一2.7　本章小结

2021-11-08 13:55:36

本节书摘来华章计算机《hadoop与大数据挖掘》一书中的第2章，第2.7节，张良均　樊　哲　位文超　刘名军许国杰　周　龙　焦正升　著更多章节内容可以访问云栖社区“华章计算机”公众号查看。

本章首先介绍了hadoop的基本概念、原理以及hadoop生态系统各个框架。接着，介绍了hadoop的安装配置以及开发环境ide配置。在此基础上介绍了hadoop常用的集群命令、hadoop mapreduce编程开发原理，针对mapreduce编程开发，详细介绍了map-reduce原理、单词计数源码分析，结合源码分析了mapreduce原理。在本章的最后两个小节，分别介绍了数据挖掘中的经典算法：k-means算法、tf-idf算法，并针对其hadoop mapreduce实现进行了详细分析。同时，本章中包含大量动手实践章节，这些动手实践章节要求读者自行完成（部分有示例代码参考），通过这些动手实践环节，可以加深读者对hadoop、hadoop hdfs、hadoop mapreduce的理解，同时对如何针对经典算法或者单机算法使用hadoop mapreduce模式来实现肯定会有自己的心得体会。

相信通过本章的学习，读者不仅可以对hadoop、hadoop mapreduce的原理有更深入的了解，而且对开发hadoop mapreduce程序也可以说初窥门径了。

《Hadoop与大数据挖掘》一2.7　本章小结

继续阅读

CSMA/CD1． CSMA/CD的概述2． CSMA 的工作原理3． CSMA/CD控制规程及特点4． CSMA/CD协议5． CSMA/CD的优点6．结束语

极大似然法(ML)与最大期望法(EM)

MapReduce的几个企业级经典面试案例MapReduce的几个企业级经典面试案例

9.spark Core 进阶2--Cashe

C++ 第十五周报告1--《冒泡法排序》

浅谈企业活动中进行数据分析的重要性

ubuntu14.04下安装hbse1.0.1.1

笔试面试题目：滑动窗口(二)

User Defined Hadoop DataType

数据结构与算法（27）——排序（二）

Dijkstra--简易版（最短路径）

Ambari介绍和架构原理

GitHub连夜封杀！这份阿里 10W 字内部 Java 字面试手册到底有多强？

NOSQL安全攻击

win10本地scala和spark安装安装scala安装spark

hdu7108哈希

《Hadoop与大数据挖掘》一2.7 本章小结

继续阅读

《Hadoop与大数据挖掘》一2.7　本章小结