让我们继续大数据之旅。 本文继续前篇 Ambari 初步认识 的后续补充。
Ambari架构
Ambari 自身也是一个分布式架构的软件,主要由两部分组成:Ambari Server 和 Ambari Agent。
简单理解server 和 agent
Ambari Server 通知 Ambari Agent 安装对应的软件;
Agent 会定时地发送各个机器每个软件模块的状态给 Ambari Server,最终这些状态信息会呈现在 Ambari 的 GUI,方便用户了解到集群的各种状态,并进行相应的维护。
如下图:
解析:
Ambari Server 从整个集群上收集信息。
每个主机上都有 Ambari Agent, Ambari Server 通过
Ambari Agent 控制每部主机。
Ambari Agent收集主机上的节点信息,汇报给AmbariServer
AmbariServer讲收集的数据存储在数据库中(MySql或者Postgresql,我其他还没有试过)
用户访问Web UI,WebUI通过AmbariServer的RESTful API获取数据绘制,集群组件健康指标。
这里的数据库可以选择主流的数据。
Ambari web
这个组件提供了中央控制的web dashboard(面板)。
展示集群整体状态
展示集群节点状态
集群管理功能包括HIVE VIEW/HDFS 操作界面等等。
整合了很多组件的接口,还有很多后面细讲。
Agent 功能
Agent除了收集节点信息,实际上还包括安装其他大数据技术棧和管理上面。
这一块也比较多,本次主要是先了解整体架构。 后面还有更多介绍,我们下一篇再看。