标签:部分 分区 网站 lower 随机选择 复制 有关 协议 规则
这次我们来说说,有关于etcd原理的一些事情。之前我们已经了解到了etcd是一个分布式的k-v存储,那么它究竟是如何保证数据是如何复制到每个节点上面去的呢?又是如何保证在网络分区的情况下能正常工作下去?raft协议到底是什么?带着这些问题我们继续往下看。
我们知道etcd使用raft协议来保证整个分布式的节点网络能正常的运转并且能正确的将数据复制到每个节点上面去。那么什么是raft协议嘞?
首先我们有这样一个背景:raft是想维护整一个网络,其中有一个领导人,这个领导人负责将收到的信息同步给网络中的其他所有节点,从而保证整个网络数据一致。
如果你有一定的英文基础,我建议直接查看下面这个网站,它用动画非常清楚的描述了raft选举的整个过程:http://thesecretlivesofdata.com/raft/
这个其实已经说明的超级棒了,如果你还看不懂,我下面会用最简单的几个要点来进行最简单的说明。
首先说明一个理论,叫做大多数理论,很简单,举个栗子:
在etcd中的应用:
下面是一些选举过程中节点的状态
leader 表示选举最终产生的领导人
candidate 候选状态,表示当前正在参与选举
follower 表示选举最终自己不是领导人,那自己就是从属节点
etcd是通过日志复制来实现数据同步的
这个图网上也很多,说明的是日志复制的规则
每个节点都有一份自己的日志,有的节点多,有的节点少,日志最多的肯定是leader。
上图还有几个要点,我看别人没提到,我就提一下:
raft之所以厉害因为即使出现一些特殊情况,整个网络在一定的时间之后也能自动恢复并正常工作。
首先最常见的情况就是一个节点出现异常,有可能是这个节点的服务器挂了,或者别的什么原因。
还有一种异常情况是由于网络导致的,网络出现异常,导致节点之间的通信存在异常,一部分节点与另一部分之间没有办法访问了。如下图所示:
上面三个follower没有办法与下面的节点进行通信。
总的来说,只要整个网络中存在大多数节点正常运行,那么etcd就是可用的,并且能够保证数据正确。当网络恢复之后也能将数据调整到最新的状态。
raft强大的地方在于它能自动的进行状态的变化,自动进行选举,并且选举遵循一定的策略,进而保证整个网络的正常运转。同时保证数据的一致性。
了解etcd的这个原理有助于我们后续的使用以及源码的阅读。
标签:部分 分区 网站 lower 随机选择 复制 有关 协议 规则
原文地址:https://www.cnblogs.com/linkstar/p/11022322.html