标签:back ack 灾难 包含 例子 大小 listen 使用 断网
[toc]
一般来讲,集群更改通常都是执行如下操作:
如果你想更新一个节点的IP(peerURLS),首先需要知道那个节点的 ID。你可以列出所有节点,找出对应节点的ID:
etcdctl member list
4d4f508502c31ddc, started, name=etcd3 http://10.5.12.18:2380, http://10.5.12.18:2379
d20b3f1647802774, started, name=etcd2 http://10.5.12.17:2380, http://10.5.12.17:2379
fdbaf2aa62569cb3, started name=etcd1 http://10.5.12.16:2380, http://10.5.12.16:2379
假设要更新ID为fdbaf2aa62569cb3的节点的peerURLs为http://10.5.12.20:2380,操作如下:
etcdctl member update fdbaf2aa62569cb3 http://10.5.12.20:2380
删除ID为fdbaf2aa62569cb3的节点:
etcdctl member remove fdbaf2aa62569cb3
注:如果删除的是leader节点,则需要额外的时间重新选举
增加节点分为两步:通过etcdctl或对应的api注册新节点,然后根据注册新节点时给出的相关参数启动新节点
假设新加的节点取名为etcd4,peerURLs为http://10.5.12.10:2380,配置如下:
etcdctl member add etcd4 http://10.5.12.10:2380
etcd在注册完新节点后,会返回一段提示,包含三个环境变量,如下:
ETCD_NAME="etcd4"
ETCD_INITIAL_CLUSTER="etcd1=http://10.5.12.16:2830,etcd2=http://10.5.12.17:2830,etcd3=http://10.5.12.18:2830,etcd4=http://10.5.12.10:2830"
ETCD_INITIAL_CLUSTER_STATE=existing
在启动新节点时,带上这三个变量即可,新节点/opt/kubernetes/cfg/etcd.conf部分配置如下:
......
ETCD_NAME="etcd4"
ETCD_INITIAL_CLUSTER="etcd0=http://10.5.12.16:2830,etcd1=http://10.5.12.17:2830,etcd2=http://10.5.12.18:2830,etcd3=http://10.5.12.10:2830"
ETCD_INITIAL_CLUSTER_STATE=existing
......
另外,还需要说明的是,如果新添加的节点--data-dir目录下存在以前的etcd数据,需要先清空该目录 。节点删除后,集群中的成员信息会更新,新节点加入集群是作为一个全新的节点加入,如果--data-dir有数据,etcd启动时会读取己经存在的数据,启动时仍然用的老member ID,也会造成,集群不无法加入,所以一定要清空新节点的--data-dir。
注:如果原先的集群只有1个节点,在新节点成功启动之前,新集群并不能正确的形成。因为原先的单节点集群无法完成leader的选举。 直到新节点启动完,和原先的节点建立连接以后,新集群才能正确形成。
移动节点有两种方式:删除旧的节点,增加新的节点; 迁移节点。当集群的数据超过 50M 的时候,建议通过迁移节点的方式来移动节点。
迁移节点的核心就是数据目录的迁移。因为 etcd 的各个节点会将自己的 ID 存放在自己的数据目录下面,所以迁移节点不会改变节点的 ID。
迁移节点的步骤简单来说,包括以下几步:
下面通过一个例子具体说明。
假设已有集群示例如下:
etcdctl member list
4d4f508502c31ddc, started, name=etcd3 http://10.5.12.18:2380, http://10.5.12.18:2379
d20b3f1647802774, started, name=etcd2 http://10.5.12.17:2380, http://10.5.12.17:2379
fdbaf2aa62569cb3, started name=etcd1 http://10.5.12.16:2380, http://10.5.12.16:2379
移动 etcd0从10.5.12.16到10.5.12.19:
停止etcd1上的etcd进程:
pkill etcd
从10.5.12.16上复制数据目录到10.5.12.19:
tar -zcf etcd1.tar.gz /data/etcd
scp etcd1.tar.gz 10.5.12.19:/data
变更etcd1的peerURLs:
etcdctl member update fdbaf2aa62569cb3 http://10.5.12.19:2380
在新机器上启动etcd:
tar xf etcd1.tar.gz -C /data/etcd
etcd --name etcd1 --listen-peer-urls http://10.5.12.19:2380 --listen-client-urls http://10.5.12.19:2379,http://127.0.0.1:2379 --advertise-client-urls http://10.5.12.19:2379,http://127.0.0.1:2379
备份数据
需要在活着的节点上操作:
etcdctl backup --data-dir /data/etcd --backup-dir /data/backup/etcd
这个命令会将原数据备份到/data/backup/etcd目录下,并冲洗掉相关的元数据,如节点ID和集群ID等。这意味着备份数据中,只包含数据,而不包含身份信息
用备份数据重建单节点集群
etcd --name etcd1 --data-dir=/data/backup/etcd --force-new-cluster --listen-peer-urls http://10.5.12.19:2380 --listen-client-urls http://10.5.12.19:2379,http://127.0.0.1:2379 --advertise-client-urls http://10.5.12.19:2379,http://127.0.0.1:2379 --initial-advertise-peer-urls http://10.5.12.19:2380
当确定新集群正常后,就可以删除原来的集群数据,暂停新集群,将新集群的数据目录拷贝到原先数据的位置,并重新启动
pkill etcd
rm -rf /data/etcd
mv /data/backup/etcd /data/etcd
etcd --name etcd0 --data-dir /data/etcd ....
注:如果还是使用之前的节点创建集群,一定要kill掉之前的etcd进程,并清除掉之前的数据
标签:back ack 灾难 包含 例子 大小 listen 使用 断网
原文地址:https://www.cnblogs.com/breezey/p/8836385.html