标签:
首先我们知道Memcached是一个分布式的缓存系统,但memcached并不像是mongodb那样,允许配置多个节点,且节点之间是自动分配数据的
也就是说memcached节点之间,是互不相通信的,因此,memcached的分布式,要靠用户去设计算法,把数据分布在多个memcached节点中。
我们来看一下常用的分布式的算法:
1.取模算法:
最容易想到的就是取模算法,即N个节点要从0-》n-1进行编号,key对N取模,余i,则key落在第i台服务器上。
就是将server的hash值与server的总台数进行求余,即hash%N,这种方法的弊端是当增减服务器时,将会有较多的缓存需要被重新分配且会造成缓存分配不均匀的情况(有可能某一台服务器分配的很多,其它的却很少).
但我们来看一下这种算法对缓存命中率的影响:
我们假设有8台服务器,运行中突然down一台,则求余的底数变成7
我们来推算一下产生的后果:
一般地,我们从数学上归纳之:
有N台服务器,变成了N-1台服务器,
每N*(N-1)个数中,只有(n-1)个单元,%n,%(n-1)得到相同的结果
所以 命中率在服务器down的短期内,急遽下降至1/(N-1)
所以 服务器越多,则down机的后果越严重!
我们来讨论下一致性hash的算法:
通俗理解一致性哈希:
把各个服务器节点放在钟表的各个时刻上,我们将Key也映射到钟表的某个时刻上,该key沿钟表顺时针走,碰到第一个比它小的节点后,则这个key就落到这台服务器上。
1 疑问1:时钟上的指针最大才11点,如果我有上百个memcached节点怎么办? 2 答: 时钟只是为了便于理解做的比喻,在实际应用中,我们可以在圆环上分布[0,2^32-1]的数字, 3 这样,全世界的服务器都可以装下了. 4 5 疑问2:我该如何把”节点名”,”键名”转化成整数? 6 答: 你可以用现在的函数,如crc32(). 7 也可以自己去设计转化规则,但注意转化后的碰撞率要低. 8 即不同的节点名,转换为相同的整数的概率要低.
好了,那我们再考虑一下当某个节点Down了之后,后产生什么样的影响?
当某个节点down后,只影响该节点顺时针之后的1个节点,而其他节点不受影响.因此,Consistent Hashing最大限度地抑制了键的重新分布
我们通过上图看到,6号节点down后,所有的压力都转移到7号节点上,造成了7号节点服务器的压力特别的大,那我们考虑是否能够将6号节点的压力注意到其余的节点上呢?
所以我们引入了虚拟节点的概念:
虚拟节点即----N个真实节点,把每个真实节点映射成M个虚拟节点, 再把M*N个虚拟节点,
散列在圆环上. 各真实节点对应的虚拟节点相互交错分布
这样,某真实节点down后,则把其影响平均分担到其他所有节点上
好了,上面就是一致性hash的理论知识点,接下来我们来考虑一下怎样实现?
下面是用php来实现的代码:
1 <?php 2 3 4 class Consistent { 5 protected $_nodes = array(); 6 7 //生成一个数值 8 public function _hash($str){ 9 return sprintf("%u",crc32($str)); 10 } 11 12 public function find($key){ 13 $point = $this->_hash($key); 14 $pos = current($this->_nodes); 15 16 foreach($this->_nodes as $k=>$v){ 17 if($point <= $k){ 18 $pos = $v; 19 break; 20 } 21 } 22 return $pos; 23 } 24 25 public function addServer($server){ 26 for($i=1;$i<=32;$i++){ 27 $pos = $this->_hash($server."-".$i); 28 $this->_nodes[$pos] = $server; 29 } 30 31 ksort($this->_nodes,SORT_REGULAR); 32 } 33 34 public function printNodes(){ 35 print_r($this->_nodes); 36 } 37 38 } 39 40 $cons = new Consistent(); 41 42 $cons->addServer(‘a‘); 43 $cons->addServer(‘b‘); 44 $cons->addServer(‘c‘); 45 46 echo $cons->_hash(‘name‘)."<br/>"; 47 echo ‘应该落在‘.$cons->find(‘name‘)."<br/>"; 48 49 $cons->printNodes(); 50 ?>
标签:
原文地址:http://www.cnblogs.com/shangzekai/p/4700084.html