天天看点

Ambari 架构(一)Ambari 介绍

ambari 是 apache software foundation 的一个顶级开源项目,是一个集中部署、管理、监控 hadoop 分布式集群的工具。但是这里的 hadoop 是一个广义概念,并不仅仅指的是 hadoop(hdfs、mapreduce),而是指 hadoop 生态圈(包括 spark、hive、hbase,sqoop,zookeeper、flume 等),ambari 可以使 hadoop 大数据软件更容易使用,且可以方便的集成我们自己的服务让 ambari 统一管理。

部署:自动化部署 hadoop 软件,能够自动处理服务、组件之间的依赖(比如 hbase 依赖 hdfs,datanode 启动的时候,需要 namenode 先启动等)。

管理:hadoop 服务组件的启动、停止、重启,配置文件的多版本管理。

监控:hadoop 服务的当前状态(组件节点的存活情况、yarn 任务执行情况等),当前主机的状态(内存、硬盘、cpu、网络等),而且可以自定义报警事件。

接下来我会以 ambari 1.2.1 为基础,分析一下 ambari 的架构。

下图为 ambari 的界面:

Ambari 架构(一)Ambari 介绍