码迷,mamicode.com
首页 > 其他好文 > 详细

一次基于etcd的分布式锁自动延时失败问题的排查

时间:2016-11-08 20:10:56      阅读:187      评论:0      收藏:0      [点我收藏+]

标签:时间   问题排查   时长   错误   节点   同步   404错误   返回   延长   

今天在测试基于etcd的分布式锁过程中,在测试获取锁后,释放之前超出TTL时长的情况下自动延长TTL这部分功能,在延长指定key的TTL时总是返回404错误信息,在对目标KEY更新TTL时目标KEY已不存在。

 

最终问题排查为ETCD集群3个节点之间的系统时间不一致,因为TTL延长是在KEY创建后单独一个监听线程中进行,在TTL过半之后会更新TTL,因此可能出现更新TTL之前,由于集群中时间超前的节点将目标KEY删除,导致更新TTL时找不到目标KEY的错误。

 

同步集群所有节点系统时间后问题排除:

ntpdate pool.ntp.org

 

一次基于etcd的分布式锁自动延时失败问题的排查

标签:时间   问题排查   时长   错误   节点   同步   404错误   返回   延长   

原文地址:http://www.cnblogs.com/JiaK/p/6044012.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!