大数据入门：ZooKeeper工作原理

在大数据生态当中，分布式集群当中的一个重要组件，就是Zookeeper，作为集群运行的重要管理者，正如其名字“动物园管理员”所示，负责集群运行的诸多事宜。今天的大数据入门分享，我们就来具体讲讲，ZooKeeper工作原理。

在Zookeeper的工作流程当中，各个节点当中，主要涉及到三个角色和四种状态，这也是构成Zookeeper体系架构的重要组成部分。

角色：Leader，Follower，Observer。

状态：Leading，Following，Observing，Looking。

Looking：当前Server不知道Leader是谁，正在搜寻。

Leading：当前Server即为选举出来的Leader。

Following：Leader已经选举出来，当前Server与之同步。

Observing：Observer的行为在大多数情况下与Follower完全一致，但是他们不参加选举和投票，而仅仅接受(observing)选举和投票的结果。

Leader Election

当Leader崩溃或者Leader失去大多数的Follower，这时候ZK进入恢复模式，恢复模式需要重新选举出一个新的Leader，让所有的Server都恢复到一个正确的状态。

Zk的选举算法有两种：一种是基于Basic paxos实现的，另外一种是基于Fast paxos算法实现的。

系统默认的选举算法为Fast paxos。

Fast paxos流程是在选举过程中，某Server首先向所有Server提议自己要成为Leader，当其它Server收到提议以后，解决epoch和zxid的冲突，并接受对方的提议，然后向对方发送接受提议完成的消息，重复这个流程，最后一定能选举出Leader。

Leader工作流程

Leader主要有三个功能：

Follower主要有四个功能：

Follower的消息循环处理如下几种来自Leader的消息：

Zookeeper的核心是原子广播，这个机制保证了各个Server之间的同步。Zab协议有两种模式，它们分别是恢复模式（Recovery选主）和广播模式（Broadcast同步）。

当服务启动或者在领导者崩溃后，Zab就进入了恢复模式，当领导者被选举出来，且大多数Server完成了和Leader的状态同步以后，恢复模式就结束了。状态同步保证了Leader和Server具有相同的系统状态。

为了保证事务的顺序一致性，zookeeper采用了递增的事务id号（zxid）来标识事务。所有的提议（proposal）都在被提出的时候加上了zxid。

实现中zxid是一个64位的数字，它高32位是epoch用来标识Leader关系是否改变，每次一个Leader被选出来，它都会有一个新的epoch，标识当前属于那个Leader的统治时期。低32位用于递增计数。

关于大数据入门，ZooKeeper工作原理，以上就为大家做了详细的介绍了。Zookeeper作为集群管理的常用组件，在Hadoop生态当中，地位斐然，在学习阶段，就需要相应地去掌握。

0 人点赞