Zookeeper，也要接触起来啦

分布式的东东，就是部署也方便，但管理，想法，大集群应用是要点。。。！

参考如下url简单实现，以后应用时多留意。

http://blog.csdn.net/shirdrn/article/details/7183503

http://www.dataguru.cn/article-3292-1.html

前言

zookeeper是hadoop家族的一款高性能的分布式协作的产品。在单机中，系统协作大都是进程级的操作。分布式系统中，服务协作都是跨服务器才能完成的。在zookeeper之前，我们对于协作服务大都使用消息中间件，随着分布式系统的普及，用消息中间件完成协作，会有大量的程序开发。 zookeeper直接面向于分布式系统，可以减少我们自己的开发，帮助我们更好完成分布式系统的数据管理问题。

zookeeper介绍

zookeeper单节点安装

zookeeper伪分布式集群安装

zookeeper命令行操作

java编程现实命令行操作

zookeeper是一个为分布式应用所设计的分布的、开源的协调服务，它主要是用来解决分布式应用中经常遇到的一些数据管理问题，简化分布式应用协调及其管理的难度，提供高性能的分布式服务。zookeeper本身可以以standalone模式安装运行，不过它的长处在于通过分布式 zookeeper集群（一个leader，多个follower），基于一定的策略来保证zookeeper集群的稳定性和可用性，从而实现分布式应用的可靠性。

zookeeper是作为分布式协调服务，是不需要依赖于hadoop的环境，也可以为其他的分布式环境提供服务。

zookeeper分布式模式安装（zookeeper集群）也比较容易，这里说明一下基本要点。

下面说明分布式模式的安装配置，过程如下所示：

第一步：主机名称到ip地址映射配置

zookeeper集群中具有两个关键的角色：leader和follower。集群中所有的结点作为一个整体对分布式应用提供服务，集群中每个结点之间都互相连接，所以，在配置的zookeeper集群的时候，每一个结点的host到ip地址的映射都要配置上集群中其它结点的映射信息。

例如，我的zookeeper集群中每个结点的配置，以slave-01为例，/etc/hosts内容如下所示：

192.168.0.179 slave-01

192.168.0.178 slave-02

192.168.0.177 slave-03

zookeeper采用一种称为leader election的选举算法。在整个集群运行过程中，只有一个leader，其他的都是follower，如果zookeeper集群在运行过程中leader出了问题，系统会采用该算法重新选出一个leader。因此，各个结点之间要能够保证互相连接，必须配置上述映射。

第二步：修改zookeeper配置文件

在其中一台机器（slave-01）上，解压缩zookeeper-3.3.4.tar.gz，修改配置文件conf/zoo.cfg，内容如下所示：

ticktime=2000

datadir=/home/hadoop/storage/zookeeper

clientport=2181

initlimit=5

synclimit=2

server.1=slave-01:2888:3888

server.2=slave-02:2888:3888

server.3=slave-03:2888:3888

第三步：远程复制分发安装文件

上面已经在一台机器slave-01上配置完成zookeeper，现在可以将该配置好的安装文件远程拷贝到集群中的各个结点对应的目录下：

cd /home/hadoop/installation/

scp -r zookeeper-3.3.4/ hadoop@slave-02:/home/hadoop/installation/

scp -r zookeeper-3.3.4/ hadoop@slave-03:/home/hadoop/installation/

第四步：设置myid

在我们配置的datadir指定的目录下面，创建一个myid文件，里面内容为一个数字，用来标识当前主机，conf/zoo.cfg文件中配置的server.x中x为什么数字，则myid文件中就输入这个数字，例如：

hadoop@slave-01:~/installation/zookeeper-3.3.4$ echo "1" > /home/hadoop/storage/zookeeper/myid

hadoop@slave-02:~/installation/zookeeper-3.3.4$ echo "2" > /home/hadoop/storage/zookeeper/myid

hadoop@slave-03:~/installation/zookeeper-3.3.4$ echo "3" > /home/hadoop/storage/zookeeper/myid

按照上述进行配置即可。

第五步：启动zookeeper集群

在zookeeper集群的每个结点上，执行启动zookeeper服务的脚本，如下所示：

hadoop@slave-01:~/installation/zookeeper-3.3.4$ bin/zkserver.sh start

hadoop@slave-02:~/installation/zookeeper-3.3.4$ bin/zkserver.sh start

hadoop@slave-03:~/installation/zookeeper-3.3.4$ bin/zkserver.sh start

Zookeeper，也要接触起来啦

继续阅读

大数据技术原理与应用（最后三天备考了！！！）

Hadoop FSDataInputStream 和FSDataOutputStream 用法

Windows下Cygwin环境的Hadoop安装（3）- 运行hadoop中的wordcount实例遇到的问题和解决方法

MapReduce运行Wordcount时一直卡在INFO mapreduce.Job: Running job，web查看一直处于accepted阶段

ubuntu hadoop2.6.1，terminal下运行wordcount

MapReduce(一)：入门级程序wordcount及其分析

hadoop操作遇到的问题问题一：输出文件已存在

Hadoop之运行wordcount

jdk1.7+Eclipse+Maven3.5+Hadoop2.7.3构建hadoop项目

Eclipse运行WordCount（详细版）相关连接Eclipse运行WordCount

hadoop 用MR实现join操作

Centos7 下 Hadoop 2.6.4 分布式集群环境搭建摘要集群准备安装JDK 安装 Hadoop 2.6.4 部署 slaver1-slaver4 启动 hadoop 集群成功了

MapReduce的几个企业级经典面试案例MapReduce的几个企业级经典面试案例

ubuntu14.04下安装hbse1.0.1.1

User Defined Hadoop DataType

Ambari介绍和架构原理