【hadoop】Hadoop编程实例之MapReduce

2021-09-28 15:58:30

前言

首先让我们来重温一下 hadoop 的四大组件：

HDFS：分布式存储系统

MapReduce：分布式计算系统

YARN： hadoop 的资源调度系统

Common：以上三大组件的底层支撑组件，主要提供基础工具包和 RPC 框架等

MapReduce是我们再进行离线大数据处理的时候经常要使用的计算模型，MapReduce的计算过程被封装的很好，我们只用使用Map和Reduce函数，所以对其整体的计算过程不是太清楚，同时MapReduce1.0和MapReduce2.0在网上有很多人混淆。

MapReduce1.0运行模型

input ->splitting->Mapping->Shuffing->Reducing->final result

【hadoop】Hadoop编程实例之MapReduce

第1步input

第2步splitting

第3步Mappin

第4步Shuffing

第5步Reducing

mapreduce hadoop 分布式存储封装分布式计算初中4年级小说高中1年级诗歌高中7年级小学7年级小学9年级议论文 4年级

上一篇: Vue学习笔记

下一篇: hadoop安装

继续阅读