Hadoop基础知识HadoopHDFSMapReduceHive

2023-03-20 12:49:28

文章目录

Hadoop
HDFS
MapReduce
Hive

Hadoop

Hadoop基础知识HadoopHDFSMapReduceHive

HDFS

HDFS 分布式文件系统读取和写入原理介绍

HDFS中的角色

NameNode：名称节点

通常仅有一个，负责文件信息管理，切割文件，为文件分配指定位置保存。

DataNode：数据阶段

通常有多个，保存数据。

写入原理：

Hadoop基础知识HadoopHDFSMapReduceHive

 当有文件要写入到HDFS的时候，

 首先NameNode将文件按照指定大小切割，

 NameNode选取合适的DataNode列表，

 写入第一快文件，

 同时将该文件的第一个副本写入另一个DataNode，

 再将第二个副本写入另另外一个DataNode。

 最后一个副本写入成功后，依次通知上一个DataNode写入完毕，

 第一个DataNode通知NameNode写入成功后，开始写入第二份文件。

读取原理：

当要读取文件的时候，NameNode找到该文件所有的存放位置，依次从头读取。

MapReduce

Hadoop基础知识HadoopHDFSMapReduceHive

Hive

Hadoop基础知识HadoopHDFSMapReduceHive

如图：

Hadoop基础知识HadoopHDFSMapReduceHive

Hadoop基础知识HadoopHDFSMapReduceHive

文章目录

Hadoop

HDFS

MapReduce

Hive

继续阅读

申请评分模型拒绝推断（RI）方法申请评分模型拒绝推断（RI）方法

专家访谈：搜索开源力量：Lucene技术前景

Sql优化一：sql语句优化

Nacos 2.0 升级前后性能对比压测

hadoop 用MR实现join操作

Centos7 下 Hadoop 2.6.4 分布式集群环境搭建摘要集群准备安装JDK 安装 Hadoop 2.6.4 部署 slaver1-slaver4 启动 hadoop 集群成功了

尚硅谷—韩顺平—图解 Java设计模式（结构型）（55～）

Storm编译打包过程中遇到的一些问题及解决方法

MapReduce的几个企业级经典面试案例MapReduce的几个企业级经典面试案例

9.spark Core 进阶2--Cashe

浅谈企业活动中进行数据分析的重要性

ubuntu14.04下安装hbse1.0.1.1

User Defined Hadoop DataType

Ambari介绍和架构原理

NOSQL安全攻击

win10本地scala和spark安装安装scala安装spark