天天看点

大数据王者之路 - Ambari 02 架构简介

让我们继续大数据之旅。 本文继续前篇 Ambari 初步认识 的后续补充。

Ambari架构

Ambari 自身也是一个分布式架构的软件,主要由两部分组成:Ambari Server 和 Ambari Agent。

简单理解server 和 agent

Ambari Server 通知 Ambari Agent 安装对应的软件;

Agent 会定时地发送各个机器每个软件模块的状态给 Ambari Server,最终这些状态信息会呈现在 Ambari 的 GUI,方便用户了解到集群的各种状态,并进行相应的维护。

如下图:

大数据王者之路 - Ambari 02 架构简介

解析:

Ambari Server 从整个集群上收集信息。

每个主机上都有 Ambari Agent, Ambari Server 通过

Ambari Agent 控制每部主机。

Ambari Agent收集主机上的节点信息,汇报给AmbariServer

AmbariServer讲收集的数据存储在数据库中(MySql或者Postgresql,我其他还没有试过)

用户访问Web UI,WebUI通过AmbariServer的RESTful API获取数据绘制,集群组件健康指标。

这里的数据库可以选择主流的数据。

Ambari web

这个组件提供了中央控制的web dashboard(面板)。

展示集群整体状态

展示集群节点状态

集群管理功能包括HIVE VIEW/HDFS 操作界面等等。

整合了很多组件的接口,还有很多后面细讲。

Agent 功能

Agent除了收集节点信息,实际上还包括安装其他大数据技术棧和管理上面。

这一块也比较多,本次主要是先了解整体架构。 后面还有更多介绍,我们下一篇再看。