MapReduce工作流程详解全过程

2023-05-19 16:34:15

先从HDFS文件系统中读取文件
进行合并
进行逻辑切分 Split

MapReduce工作流程详解全过程

对一行数据进行切分RecordRead,以key为行首字母的偏移量value为对应的一行数据传给maptask
MapTask对数据进行处理后传给shuffle的分区partition
partition对数据进行分区处理将数据传给shuffle的sort排序
sort排序后的结果传送给shuffle的combiner(局部聚合) 将结果传给shuffle的group(分组)

MapReduce工作流程详解全过程

分组后的结果传给Reduce进行计算
reduce计算后的结果最终输出给HDFS文件系统

MapReduce工作流程详解全过程

全过程

MapReduce工作流程详解全过程

mapreduce 大数据 hadoop MapReduce工作流程

上一篇: Ruby 1.9安装tcl/tk绑定

下一篇: 大数据工作流_大数据和人工智能时代下的数字化工作流

继续阅读