ZooKeeper入门介绍

时间：2016-07-07 06:21:51 阅读：331 评论：0 收藏：0 [点我收藏+]

标签：

ZooKeeper提供一个集中式服务，包括配置维护、服务命名、分布式同步、组管理。子服务常用于分布式应用。

Zookeeper是什么：

ZooKeeper是一个典型的分布式数据一致性的解决方案，分布式程序可以基于它实现诸如数据发布/订阅、负载均衡、命名服务、分布式协调通知、集群管理、master选举、分布式锁、分布式队列等功能。ZooKeeper可以保证如下分布式一致性特性。

顺序一致性：从同一个客户端发起的事务请求，最终将严格按照其发起顺序被应用到ZooKeeper中。
原子性：更新操作要么成功要么失败，没有中间状态
单一视图：不管客户端连接哪一个服务器，客户端看到服务端的数据模型都是一致的（the same view of service）。
可靠性：一旦一个更新成功，那么那就会被持久化，直到客户端用新的更新覆盖这个更新。
实时性：Zookeeper仅保证在一定时间内，客户端最终一定能够从服务端读到最新的数据状态

Zookeeper设计目标

简单的数据模型：

Zookeeper使得分布式程序能够通过一个共享的、树形结构的名字空间来进行相互协调。它采用了类似文件系统的目录树型结构的数据模型。协调服务难于处理，特别容易出错，比如条件竞争和死锁。ZooKeeper的动机是为了减轻分布式应用实现协调服务的负担。zookeeper允许分布式应用通过共享的层次化名字空间进行相互协调。zookeeper在内存中维护数据，访问上具备高吞吐、低延迟的特点。zookeeper重视高性能、高可用、严格有序存取，因此，性能方面能够胜任大型分布式系统，可靠方面可屏蔽单点故障，严格有序存取确保客户端能够实现复杂的同步原语。

如下图：Zookeeper数据结构

zookeeper名字空间由节点znode构成，其组织方式类似文件系统，其中各个节点相当于目录和文件，通过路径作为唯一标识。与文件系统不同的是，每个节点具有与之对应的数据内容，同时也可以具有子节点。zookeeper用于存储协调数据，如状态、配置、位置等信息，每个节点存储的数据量很小，KB级别（我理解是0～1024KB）。节点维护一个stat结构（包括数据变化的版本号、ACL变化、时间戳），以允许缓存验证与协调更新。每当节点数据内容改变，版本号会增长。客户端获取数据的同时也会获取数据版本号。节点的数据内容以原子方式读写，读操作读取全部内容，写操作替换全部内容。节点具有一个访问控制列表（Access Control List - ACL）来约束哪些人能执行哪些操作。zookeeper有一种节点叫做临时节点，临时节点仅在创建该节点的会话的存存活期间存在，会话结束，临时节点自动删除。

Zookeeper的基本概念：

介绍一些zookeeper的基本概念。包括：集群角色、会话、数据节点、版本、watcher、ACL权限控制。

集群角色

Zookeeper集群中一共有三种角色，分别是：Leader、Follower，Observer。Leader服务器是整个zookeeper集群工作机制中的核心，Follower服务器是Zookeeper集群状态的跟随着，Observer服务器充当一个观察这的角色。

会话

Session会话是指客户端会话，在Zookeeper中，一个客户端链接是指客户端与服务端之间的一个TCP链接，客户端在启动的时候首先会与服务器建立一个TCP连接，通过这个链接，客户端能够通过心跳检测与服务器保持有效的会话，也能向Zookeeper服务器发送请求并获得响应。同时还能够通过该链接接收来至服务器的Wather事件通知，sessionTimeout值来设置一个客户端会话的超时时间。当由于服务器压力过大，网络故障，客户端断开等各种原因导致客户端链接断开时，只要在sessionTimeout值范围内，其客户端的会话任然有效。

数据节点：

Zookeeper节点分成两类：一类指集群中的机器，称为机器节点。第二类则是指数据模型中的数据单元-ZNode.。

Znode分为持久化节点和临时节点，持久化节点一致保存在Zookeeper上，临时节点的生命周期和客户端会话绑定，客户端会话失效，则临时节点就会被移除。Zookeeper还允许用户为每一个节点添加一个特殊属性：SEQUENTIAL（就是Zookeeper会自动在器节点后面加上一个整型数字，自增的数字），称为顺序节点。

版本：

Zookeeper会为每个Znode维护一个叫作Stat的数据结构，结构如图：

版本类型

说明

version

当前数据节点数据内容的版本号

cversion

当前数据节点子节点的版本号

aversion

当前数据节点ACL变更版本号

Wather

时间监听器，Zookeeper允许用户在指定节点上注册一些Watcher，当数据节点发生变化的时候，Zookeeper服务器会把这个变化的通知发送给感兴趣的客户端

1.一次性触发器

lient在一个节点上设置watch，随后节点内容改变，client将获取事件。当节点内容再次改变，client不会获取这个事件，除非它又执行了一次读操作并设置watch

2.发送至client，watch事件延迟

watch事件异步发送至观察者。比如说client执行一次写操作，节点数据内容发生变化，操作返回后，而watch事件可能还在发往client的路上。这种情况下，zookeeper提供有序保证：client不会得知数据变化，直到它获取watch事件。网络延迟或其他因素可能导致不同client在不同时刻获取watch事件和操作返回值。

3.设置watch的数据内容

涉及到节点改变的不同方式。比方说zookeeper维护两个watch列表：节点的数据watch和子节点watch。getData()和exists()设置了内容watch，getChildren()设置了子节点watch，操作返回的数据类型不同，前者是节点的内容，后者是节点的子节点列表。setData()触发内容watch，create()触发当前节点的"内容watch"和其父节点的"子节点watch"，delete()同时触发"内容watch"和"子节点watch"（其子节点被全部删除），以及其父节点的"子节点watch"。说白了，对当前节点的操作，要考虑到对其父节点与子节点的影响。

watch在客户端所连接的服务端本地维护。watch的设置、维护、分发操作都很轻量级。当客户端连接到新的服务端，watch将被任一会话事件触发。与服务端断开连接时，不能获取watch事件。客户端重连后，之前注册的watch将被重新注册并在需要时触发。通常这一切透明地发生，用户不会察觉到。有一种情况watch可能丢失：之前对一个尚未建立的节点的设置了exists watch，如果断开期间该节点被建立或删除，那么此watch将丢失。

对于watch，zookeeper提供以下保证：

1.watch对于其他事件、watch、异步响应是有序的。zookeeper client library保证有序分发

2.客户端监视一个节点，总是先获取watch事件，再发现节点的数据变化。

3.watch事件的顺序对应于zookeeper服务所见的数据更新的顺序。

关于watch要记住的是：

1.watch是一次性触发的，如果获取一个watch事件并希望得到新变化的通知，需要重新设置watch

2.watch是一次性触发的并且在获取watch事件和设置新watch事件之间有延迟，所以不能可靠的观察到节点的每一次变化。要认识到这一点。

3.watch object只触发一次，比如，一个watch object被注册到同一个节点的getData()和exists()，节点被删除，仅对应于exists()的watch ojbect被调用

4.若与服务端断开连接，直到重连后才能获取watch事件。

Watch事件类型：

ZOO_CREATED_EVENT：节点创建事件，需要watch一个不存在的节点，当节点被创建时触发，此watch通过zoo_exists()设置

ZOO_DELETED_EVENT：节点删除事件，此watch通过zoo_exists()或zoo_get()设置

ZOO_CHANGED_EVENT：节点数据改变事件，此watch通过zoo_exists()或zoo_get()设置

ZOO_CHILD_EVENT：子节点列表改变事件，此watch通过zoo_get_children()或zoo_get_children2()设置

ZOO_SESSION_EVENT：会话失效事件，客户端与服务端断开或重连时触发

ZOO_NOTWATCHING_EVENT：watch移除事件，服务端出于某些原因不再为客户端watch节点时触发

 ACL权限控制：

ACL是AccessControl Lists的缩写，Zookeeper采用ACL策略来进行权限控制，有一下权限：

CREATE：穿件子节点的权限

READ：获取节点数据和子节点列表的权限

WRITE：更新节点数据的权限

DELETE：删除子节点的权限

ADMIN：设置节点ACL的权限

ZooKeeper提供一个集中式服务，包括配置维护、服务命名、分布式同步、组管理。子服务常用于分布式应用。

Zookeeper是什么：

顺序一致性：从同一个客户端发起的事务请求，最终将严格按照其发起顺序被应用到ZooKeeper中。
原子性：更新操作要么成功要么失败，没有中间状态
单一视图：不管客户端连接哪一个服务器，客户端看到服务端的数据模型都是一致的（the same view of service）。
可靠性：一旦一个更新成功，那么那就会被持久化，直到客户端用新的更新覆盖这个更新。
实时性：Zookeeper仅保证在一定时间内，客户端最终一定能够从服务端读到最新的数据状态

Zookeeper设计目标

简单的数据模型：

如下图：Zookeeper数据结构

zookeeper名字空间由节点znode构成，其组织方式类似文件系统，其中各个节点相当于目录和文件，通过路径作为唯一标识。与文件系统不同的是，每个节点具有与之对应的数据内容，同时也可以具有子节点。zookeeper用于存储协调数据，如状态、配置、位置等信息，每个节点存储的数据量很小，KB级别（我理解是0～1024KB）。节点维护一个stat结构（包括数据变化的版本号、ACL变化、时间戳），以允许缓存验证与协调更新。每当节点数据内容改变，版本号会增长。客户端获取数据的同时也会获取数据版本号。节点的数据内容以原子方式读写，读操作读取全部内容，写操作替换全部内容。节点具有一个访问控制列表（Access Control List - ACL）来约束哪些人能执行哪些操作。zookeeper有一种节点叫做临时节点，临时节点仅在创建该节点的会话的存存活期间存在，会话结束，临时节点自动删除。

Zookeeper的基本概念：

介绍一些zookeeper的基本概念。包括：集群角色、会话、数据节点、版本、watcher、ACL权限控制。

集群角色

Zookeeper集群中一共有三种角色，分别是：Leader、Follower，Observer。Leader服务器是整个zookeeper集群工作机制中的核心，Follower服务器是Zookeeper集群状态的跟随着，Observer服务器充当一个观察这的角色。

会话

Session会话是指客户端会话，在Zookeeper中，一个客户端链接是指客户端与服务端之间的一个TCP链接，客户端在启动的时候首先会与服务器建立一个TCP连接，通过这个链接，客户端能够通过心跳检测与服务器保持有效的会话，也能向Zookeeper服务器发送请求并获得响应。同时还能够通过该链接接收来至服务器的Wather事件通知，sessionTimeout值来设置一个客户端会话的超时时间。当由于服务器压力过大，网络故障，客户端断开等各种原因导致客户端链接断开时，只要在sessionTimeout值范围内，其客户端的会话任然有效。

数据节点：

Zookeeper节点分成两类：一类指集群中的机器，称为机器节点。第二类则是指数据模型中的数据单元-ZNode.。

Znode分为持久化节点和临时节点，持久化节点一致保存在Zookeeper上，临时节点的生命周期和客户端会话绑定，客户端会话失效，则临时节点就会被移除。Zookeeper还允许用户为每一个节点添加一个特殊属性：SEQUENTIAL（就是Zookeeper会自动在器节点后面加上一个整型数字，自增的数字），称为顺序节点。

版本：

Zookeeper会为每个Znode维护一个叫作Stat的数据结构，结构如图：

版本类型

说明

version

当前数据节点数据内容的版本号

cversion

当前数据节点子节点的版本号

aversion

当前数据节点ACL变更版本号

Wather

时间监听器，Zookeeper允许用户在指定节点上注册一些Watcher，当数据节点发生变化的时候，Zookeeper服务器会把这个变化的通知发送给感兴趣的客户端

1.一次性触发器

lient在一个节点上设置watch，随后节点内容改变，client将获取事件。当节点内容再次改变，client不会获取这个事件，除非它又执行了一次读操作并设置watch

2.发送至client，watch事件延迟

watch事件异步发送至观察者。比如说client执行一次写操作，节点数据内容发生变化，操作返回后，而watch事件可能还在发往client的路上。这种情况下，zookeeper提供有序保证：client不会得知数据变化，直到它获取watch事件。网络延迟或其他因素可能导致不同client在不同时刻获取watch事件和操作返回值。

3.设置watch的数据内容

涉及到节点改变的不同方式。比方说zookeeper维护两个watch列表：节点的数据watch和子节点watch。getData()和exists()设置了内容watch，getChildren()设置了子节点watch，操作返回的数据类型不同，前者是节点的内容，后者是节点的子节点列表。setData()触发内容watch，create()触发当前节点的"内容watch"和其父节点的"子节点watch"，delete()同时触发"内容watch"和"子节点watch"（其子节点被全部删除），以及其父节点的"子节点watch"。说白了，对当前节点的操作，要考虑到对其父节点与子节点的影响。

watch在客户端所连接的服务端本地维护。watch的设置、维护、分发操作都很轻量级。当客户端连接到新的服务端，watch将被任一会话事件触发。与服务端断开连接时，不能获取watch事件。客户端重连后，之前注册的watch将被重新注册并在需要时触发。通常这一切透明地发生，用户不会察觉到。有一种情况watch可能丢失：之前对一个尚未建立的节点的设置了exists watch，如果断开期间该节点被建立或删除，那么此watch将丢失。

对于watch，zookeeper提供以下保证：

1.watch对于其他事件、watch、异步响应是有序的。zookeeper client library保证有序分发

2.客户端监视一个节点，总是先获取watch事件，再发现节点的数据变化。

3.watch事件的顺序对应于zookeeper服务所见的数据更新的顺序。

关于watch要记住的是：

1.watch是一次性触发的，如果获取一个watch事件并希望得到新变化的通知，需要重新设置watch

2.watch是一次性触发的并且在获取watch事件和设置新watch事件之间有延迟，所以不能可靠的观察到节点的每一次变化。要认识到这一点。

3.watch object只触发一次，比如，一个watch object被注册到同一个节点的getData()和exists()，节点被删除，仅对应于exists()的watch ojbect被调用

4.若与服务端断开连接，直到重连后才能获取watch事件。

Watch事件类型：

ZOO_CREATED_EVENT：节点创建事件，需要watch一个不存在的节点，当节点被创建时触发，此watch通过zoo_exists()设置

ZOO_DELETED_EVENT：节点删除事件，此watch通过zoo_exists()或zoo_get()设置

ZOO_CHANGED_EVENT：节点数据改变事件，此watch通过zoo_exists()或zoo_get()设置

ZOO_CHILD_EVENT：子节点列表改变事件，此watch通过zoo_get_children()或zoo_get_children2()设置

ZOO_SESSION_EVENT：会话失效事件，客户端与服务端断开或重连时触发

ZOO_NOTWATCHING_EVENT：watch移除事件，服务端出于某些原因不再为客户端watch节点时触发

 ACL权限控制：

ACL是AccessControl Lists的缩写，Zookeeper采用ACL策略来进行权限控制，有一下权限：

CREATE：穿件子节点的权限

READ：获取节点数据和子节点列表的权限

WRITE：更新节点数据的权限

DELETE：删除子节点的权限

ADMIN：设置节点ACL的权限

ZooKeeper入门介绍

标签：

原文地址：http://blog.csdn.net/peak_and_valley/article/details/51847052

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

ZooKeeper入门介绍

Zookeeper是什么：

Zookeeper设计目标

简单的数据模型：

构建集群：

顺序访问：

高性能：

Zookeeper的基本概念：

集群角色

会话

数据节点：

版本：

Wather

ACL权限控制：

Zookeeper是什么：

Zookeeper设计目标

简单的数据模型：

构建集群：

顺序访问：

高性能：

Zookeeper的基本概念：

集群角色

会话

数据节点：

版本：

Wather

ACL权限控制：

版本类型	说明
version	当前数据节点数据内容的版本号
cversion	当前数据节点子节点的版本号
aversion	当前数据节点ACL变更版本号