Mysql双主加Keepalived

时间：2019-11-04 15:42:53 阅读：69 评论：0 收藏：0 [点我收藏+]

标签：tab software 复杂 not ipa 连接 listen ip地址 fresh

一、MySQL于keepalived简介**

前言：

在企业中，数据库高可用一直是企业的重中之重，中小企业很多都是使用mysql主从方案，一主多从，读写分离等，但是单主存在单点故障，从库切换成主库需要作改动。因此，如果是双主或者多主，就会增加mysql入口，增加高可用。不过多主需要考虑自增长ID问题，这个需要特别设置配置文件，比如双主，可以使用奇偶，总之，主之间设置自增长ID相互不冲突就能完美解决自增长ID冲突问题。

1.1、MySQL**

1.1.1、MySQL主从复制原理

复制分成三步：

\1. master将改变记录到二进制日志(binary log)中（这些记录叫做二进制日志事件，binary log events）；

\2. slave将master的binary log events拷贝到它的中继日志(relay log)；

\3. slave重做中继日志中的事件，将改变反映它自己的数据。

下图描述了这一过程：

技术图片

1.1.2、MySQL双主构建思路

1.两台mysql都可读写，互为主备，默认只使用一台（masterA）负责数据的写入，另一台（masterB）备用；

2.masterA是masterB的主库，masterB又是masterA的主库，它们互为主从；

3.两台主库之间做高可用,可以采用keepalived等方案（使用VIP对外提供服务）；

4.所有提供服务的从服务器与masterB进行主从同步（双主多从）;

5.建议采用高可用策略的时候，masterA或masterB均不因宕机恢复后而抢占VIP（非抢占模式）；

这样做可以在一定程度上保证主库的高可用,在一台主库down掉之后,可以在极短的时间内切换到另一台主库上（尽可能减少主库宕机对业务造成的影响），减少了主从同步给线上主库带来的压力；

但是也有几个不足的地方:

1.masterB可能会一直处于空闲状态（可以用它当从库，负责部分查询）；

2.主库后面提供服务的从库要等masterB先同步完了数据后才能去masterB上去同步数据，这样可能会造成一定程度的同步延时；

架构的简易图如下:

技术图片

1.1.3、MySQL双主和主从模式的区别

主从是对主操作数据，从会实时同步数据。反之对从操作，主不会同步数据，还有可能造成数据紊乱，导致主从失效。主主则是无论对那一台操作，另一个都会同步数据。一般用作高容灾方案

1.2、Keepalived介绍**

Keepalived是一个基于VRRP协议来实现的WEB 服务高可用方案，可以利用其来避免单点故障。一个WEB服务至少会有2台服务器运行Keepalived，一台为主服务器（MASTER），一台为备份服务器（BACKUP），但是对外表现为一个虚拟IP，主服务器会发送特定的消息给备份服务器，当备份服务器收不到这个消息的时候，即主服务器宕机的时候，备份服务器就会接管虚拟IP，继续提供服务，从而保证了高可用性。

1.2.1、keepalived理论工作原理

keepalived可提供vrrp以及health-check功能，可以只用它提供双机浮动的vip（vrrp虚拟路由功能），这样可以简单实现一个双机热备高可用功能。

keepalived是一个类似于layer3, 4 & 5交换机制的软件，也就是我们平时说的第3层、第4层和第5层交换。Keepalived的作用是检测web 服务器的状态。 Layer3,4&5工作在IP/TCP协议栈的IP层，TCP层，及应用层,原理分别如下：

　　Layer3：Keepalived使用Layer3的方式工作式时，Keepalived会定期向服务器群中的服务器

　　发送一个ICMP的数据包（既我们平时用的Ping程序）,如果发现某台服务的IP地址没有激活，Keepalived便报告这台服务器失效，并将它从服务器群中剔除，这种情况的典型例子是某台服务器被非法关机。Layer3的方式是以服务器的IP地址是否有效作为服务器工作正常与否的标准。在本文中将采用这种方式。

　　Layer4:如果您理解了Layer3的方式，Layer4就容易了。Layer4主要以TCP端口的状态来决定服务器工作正常与否。如web server的服务端口一般是80，如果Keepalived检测到80端口没有启动，则Keepalived将把这台服务器从服务器群中剔除。

　　Layer5：Layer5就是工作在具体的应用层了，比Layer3,Layer4要复杂一点，在网络上占用的带宽也要大一些。Keepalived将根据用户的设定检查服务器程序的运行是否正常，如果与用户的设定不相符，则Keepalived将把服务器从服务器群中剔除。

vip即虚拟ip，是附在主机网卡上的，即对主机网卡进行虚拟，此IP仍然是占用了此网段的某个IP。

1.2.2、keepalived高可用故障切换转移原理

Keepalived高可用服务对之间的故障切换转移，是通过 VRRP (Virtual Router Redundancy Protocol ,虚拟路由器冗余协议）来实现的。

核心：

　　在 Keepalived服务正常工作时，主 Master节点会不断地向备节点发送（多播的方式）心跳消息，用以告诉备Backup节点自己还活看，当主 Master节点发生故障时，就无法发送心跳消息，备节点也就因此无法继续检测到来自主 Master节点的心跳了，于是调用自身的接管程序，接管主Master节点的 IP资源及服务。而当主 Master节点恢复时，备Backup节点又会释放主节点故障时自身接管的IP资源及服务，恢复到原来的备用角色。

VRRP ,全称 Virtual Router Redundancy Protocol ,中文名为虚拟路由冗余协议，VRRP的出现就是为了解决静态踣甶的单点故障问题，VRRP是通过一种竞选机制来将路由的任务交给某台VRRP路由器的。

1.3、目的：

解决mysql数据库Master-Slave 单点故障问题。

1.3,1、实现方式：

\1. Master-Master Replication 实现数据同步。

2.通过keepalived虚拟IP 从网络层实现单点故障时IP自动切换，从而实现高可用。

3.通过keepalived配置实现read读指向Slave节点，实现读写分离。

缺点：根据线上实际应用情况，只考虑单点网络故障及机器设备故障时虚拟ip自动切换（只切换一次）。不考虑mysql服务异常等情况，数据库异常可通过nagios等监控，防止多次来回切换，造成数据混乱！且故障节点恢复时，要人工操作及注意步骤。

1.3.2、MySQL双主读写分离模式

1、使用两个MySQL数据库db01,db02，互为Master和Slave，即：

一边db01作为db02的master，一旦有数据写向db01时，db02定时从db01更新

另一边db02也作为db01的master，一旦有数据写向db02时，db01也定时从db02获得更新

(这不会导致循环，MySQL Slave默认不会记录Master同步过来的变化)

2、但从AppServer的角度来说，同时只有一个结点db01扮演Master，另外一个结点db02扮演Slave，不能同时两个结点扮演Master。即AppSever总是把write操作分配某个数据库(db01)，除非db01 failed，被切换。

3、如果扮演Slave的数据库结点db02 Failed了：

a)此时appServer要能够把所有的read,write分配给db01，read操作不再指向db02

b)一旦db02恢复过来后，继续充当Slave角色，并告诉AppServer可以将read分配给它了.

4、如果扮演Master的数据库结点db01 Failed了

a)此时appServer要能够把所有的写操作从db01切换分配给db02，也就是切换Master由db02充当

b)db01恢复过来后，充当Slave的角色，Master由db02继续扮演。

测试环境：

服务器：

DB1:192.168.25.31、centos7.6、mysql5.7、keepalived、hostname：DB1

DB2:192.168.25.32、centos7.6、mysql5.7、keepalived、hostname：DB2

Slave1：192.168.25.34、cenots7.6、mysql5.7、hostname：slave

VIP：192.168.25.200（虚拟）

远程客户端：192.168.25.35（用来调用vip测试）

步骤

二：实现两台MySQL主主同步

2.1、安装MySQL

DB1、DB2两台服务器分别安装MySQL，这两台均已安装过程省略

2.2、修改MySQL配置文件

分别修改配置文件，在/etc/my.cnf文件中得[mysqld]段加配置信息

 DB1:
 ?
 [root@DB1 ~]# vim /etc/my.cnf 
 ?
 server-id=1
 ?
 log-bin=mysql-bin
 ?
 relay-log=mysql-relay-bin
 ?
 replicate-wild-ignore-table=mysql.%
 ?
 replicate-wild-ignore-table=test.%
 ?
 replicate-wild-ignore-table=information_schema.%
 ?
  
 ?
 auto-increment-increment = 2
 ?
 auto-increment-offset = 1
 ?
 slave-skip-errors = all

解释：

server-id=1（节点标识，每台的server-id不能养，必须全局唯一）

log-bin=mysql-bin（开启binlog日志，用于主从数据复制）

relay-log=mysql-relay-bin（开启relay-log日志，relay-log日志记录的是从服务器I/O 线程将主服务器的二进制日志读取过来记录到从服务器本地文件，然后SQL线程会读取relay-log日志的内容并应用到从服务器）

replicate-wild-ignore-table=mysql.%（复制过滤选项）

auto-increment-increment = 2（字段一次递增多少）

auto-increment-offset = 1（自增字段的起始值：1、3、5、7、等奇数）

保存重启，使其配置生效

 [root@DB1 ~]# service mysqld restart
 ?
 Shutting down MySQL.. SUCCESS! 
 ?
 Starting MySQL. SUCCESS! 
 ?
 DB2:
 ?
 [root@DB2 ~]# vim /etc/my.cnf
 ?
 server-id=2
 ?
 log-bin=mysql-bin
 ?
 relay-log=mysql-relay-bin
 ?
 replicate-wild-ignore-table=mysql.%
 ?
 replicate-wild-ignore-table=test.%
 ?
 replicate-wild-ignore-table=information_schema.%
 ?
  
 ?
 auto-increment-increment = 2
 ?
 auto-increment-offset = 2
 ?
 slave-skip-errors = all
 ?
 保存重启，使其配置生效
 ?
 [root@DB2 ~]# service mysqld restart
 ?
 Shutting down MySQL.. SUCCESS! 
 ?
 Starting MySQL. SUCCESS! 
 ?
 Slave1:
 ?
 [root@slave1 ~]# vim /etc/my.cnf
 ?
 [mysqld]
 ?
  
 ?
 server-id=3
 ?
 log-bin=mysql-bin
 ?
 log-slave-updates
 ?
 relay-log=mysql-relay-bin
 ?
 replicate-wild-ignore-table=mysql.%
 ?
 replicate-wild-ignore-table=test.%
 ?
 replicate-wild-ignore-table=information_schema.%
 ?
  
 ?
 auto-increment-increment = 2
 ?
 auto-increment-offset = 3
 ?
 slave-skip-errors = all

#注：在执行主主互备之前要保证两台服务器上MySQL数据一致

2.3、MySQL配置DB1、DB2主主模式

2.3.1、先查看log bin日志和pos位置

DB1:

 [root@DB1 ~]# mysql -uroot -pwww.123
 ?
 mysql> show master status;

技术图片

 DB2:
 ?
 [root@DB2 ~]# mysql -uroot -pwww.123
 ?
 mysql> show master status;

技术图片

2.3.2、DB1、DB2互相提升访问权限

DB1：

在DB1的数据库创建DB2的复制用户并授权

 mysql> grant replication slave on *.* to ‘cproot‘@‘192.168.25.32‘ identified by ‘cpwww.123‘;
 ?
 Query OK, 0 rows affected, 1 warning (0.02 sec)
 ?
 刷新并查看log bin日志和pos位置
 ?
 mysql> flush privileges;
 ?
 Query OK, 0 rows affected (0.02 sec)
 ?
  
 ?
 mysql> show master status;

技术图片

DB2:

 mysql> grant replication slave on *.* to ‘cproot‘@‘192.168.25.31‘identified by ‘cpwww.123‘; 
 ?
 Query OK, 0 rows affected, 1 warning (0.02 sec)
 ?
 mysql> flush privileges;
 ?
 Query OK, 0 rows affected (0.01 sec)
 ?
 mysql> show master status;

在DB2的数据库中将DB1设置为自己得主服务器

 mysql> change master to master_host=‘192.168.25.31‘,master_user=‘cproot‘,master_password=‘cpwww.123‘,master_log_file=‘mysql-bin.000001‘,master_log_pos=613;
 ?
 Query OK, 0 rows affected, 2 warnings (0.11 sec)

技术图片

DB1:

在DB1的数据库中将DB2设置为自己的主服务器

 mysql> change master to master_host=‘192.168.25.32‘,master_user=‘cproot‘,master_password=‘cpwww.123‘,master_log_file=‘mysql-bin.000001‘,master_log_pos=613;
 ?
 Query OK, 0 rows affected, 2 warnings (0.11 sec)

技术图片

分别查看DB1、DB2服务器状态

DB2:

mysql> start slave;
Query OK, 0 rows affected (0.01 sec)
mysql> show slave status\G;

技术图片

如果slave_io不是yes是技术图片这样得话那就有三种可能错误需要排查

1，网络不通

2，密码不正确

3，Pos不对

4，防火墙没关

我这次遇到的就是防火墙没关，并且用service iptables stop还不好使，我是这样解决的

先看提示得错误

技术图片

提示用/bin/systemctl stop iptables.service这样得方式去关闭，这里需要先安装iptables.services然后在关闭防火墙

[root@DB2 data]# yum -y install iptables-services

[root@DB2 ~]# systemctl stop iptables

DB1:

mysql> start slave;
Query OK, 0 rows affected (0.01 sec)
mysql> show slave status\G;

到此主主同步配置完成，查看状态slave_io和slave_sql都是yes说明主主同步成功

2.4、测试主主同步

在DB1上创建一个数据库one，然后在DB2上查看是否同步成功

注意：在创建之前最好再次重启一下MySQL数据库不然可能会同步不成功

DB1:

mysql> create database one;

Query OK, 1 row affected (0.02 sec)

 

mysql> show databases;

+--------------------+

| Database           |

+--------------------+

| information_schema |

| mysql              |

| one                |

| performance_schema |

| sys                |

+--------------------+

5 rows in set (0.00 sec)

DB2:

mysql> show databases;

+--------------------+

| Database           |

+--------------------+

| information_schema |

| mysql              |

| one                |

| performance_schema |

| sys                |

+--------------------+

5 rows in set (0.00 sec)

在DB2把新建的数据库one删除掉，看看DB1上是否还存在

mysql> drop database one;

Query OK, 0 rows affected (0.01 sec)

 

mysql> show databases;

+--------------------+

| Database           |

+--------------------+

| information_schema |

| mysql              |

| performance_schema |

| sys                |

+--------------------+

4 rows in set (0.00 sec)

DB1:

mysql> show databases;

+--------------------+

| Database           |

+--------------------+

| information_schema |

| mysql              |

| performance_schema |

| sys                |

+--------------------+

4 rows in set (0.00 sec)

双向操作没问题，都可以同步成功，主主已经搭建成功

2.5、配置slave从服务器

DB1

在DB1的数据库创建slave1的复制用户并授权

mysql> grant replication slave on *.* to ‘cproot‘@‘192.168.25.34‘ identified by ‘cpwww.123‘;

Query OK, 0 rows affected, 1 warning (0.01 sec)

 

mysql> flush privileges;

Query OK, 0 rows affected (0.01 sec)

 

mysql> show master status;

技术图片

在slave里的数据库里把DB1设置为主服务器

Slave1：

mysql> change master to master_host=‘192.168.25.31‘,master_user=‘cproot‘,master_password=‘cpwww.123‘,master_log_file=‘mysql-bin.000003‘,master_log_pos=774;

Query OK, 0 rows affected, 2 warnings (0.05 sec)

mysql> start slave;

Query OK, 0 rows affected (0.01 sec)

mysql> show slave status\G

技术图片

查看状态slave_io和slave_sql都是yes，这里主从就同步成功了

测试在DB1数据库新建two

DB1：

mysql> create database two;

Query OK, 1 row affected (0.02 sec)

 

mysql> show databases;

技术图片

Slave1：

在slave1上查看是否同步

技术图片

主从同步成功

同步错误问题总结：如果slave_io不是yes多看看防火墙是否关闭，还有就是授权是输入得账号密码和pos是否输入正确了

三、安装并配置keepalived

3.1、两台都需要安装keepalived

DB1、DB2:

安装keepalived并将其配置成系统服务。DB1和DB2都要进行如下操作：

[root@DB1 ~]# yum install -y openssl-devel

[root@DB1 ~]# cd /usr/local/src/

[root@DB1 src]# wget http://www.keepalived.org/software/keepalived-1.3.5.tar.gz

[root@DB1 src]# tar -zxvf keepalived-1.3.5.tar.gz 

[root@DB1 src]# cd keepalived-1.3.5

[root@DB1 keepalived-1.3.5]# ./configure --prefix=/usr/local/keepalived

执行这个后会发现在最后会报错configure: error: libnfnetlink headers missing（没有的话忽略）

然后执行

[root@DB1 keepalived-1.3.5]# yum -y install libnfnetlink-devel

再重新执行./configure

[root@DB1 keepalived-1.3.5]# ./configure --prefix=/usr/local/keepalived

[root@DB1 keepalived-1.3.5]# make && make install

在执行这一条的时候如果遇到这样的错误可能是没有依赖包

技术图片

解决方法：

[root@DB2 keepalived-1.3.5]# yum -y install libnl libnl-devel libnfnetlink-devel openssl-devel

（最好是在安装之前全部执行这条语句以防发生错误）

[root@DB1 keepalived-1.3.5]# cp /usr/local/src/keepalived-1.3.5/keepalived/etc/init.d/keepalived /etc/rc.d/init.d/

[root@DB1 keepalived-1.3.5]# cp /usr/local/keepalived/etc/sysconfig/keepalived /etc/sysconfig/

[root@DB1 keepalived-1.3.5]# mkdir /etc/keepalived/

[root@DB1 keepalived-1.3.5]# cp /usr/local/keepalived/etc/keepalived/keepalived.conf /etc/keepalived/

[root@DB1 keepalived-1.3.5]# cp /usr/local/keepalived/sbin/keepalived /usr/sbin/

[root@DB1 keepalived-1.3.5]# echo "/etc/init.d/keepalived start" >>/etc/rc.local

3.2、DB1上的keepalived.conf配置

DB1:

[root@DB1 ~]# cp /etc/keepalived/keepalived.conf /etc/keepalived/keepalived.conf.bak

[root@DB1 ~]# vim /etc/keepalived/keepalived.conf

! Configuration File for keepalived

?       

global_defs {

notification_email {

ops@wangshibo.cn

tech@wangshibo.cn

}

?       

notification_email_from ops@wangshibo.cn

smtp_server 127.0.0.1 

smtp_connect_timeout 30

router_id MASTER-HA

}

?       

vrrp_script chk_mysql_port {     #检测mysql服务是否在运行。有很多方式，比如进程，用脚本检测等等

?    script "/opt/chk_mysql.sh"   #这里通过脚本监测

?    interval 2                   #脚本执行间隔，每2s检测一次

?    weight -5                    #脚本结果导致的优先级变更，检测失败（脚本返回非0）则优先级 -5

?    fall 2                    #检测连续2次失败才算确定是真失败。会用weight减少优先级（1-255之间）

?    rise 1                    #检测1次成功就算成功。但不修改优先级

}

?       

vrrp_instance VI_1 {

?    state BACKUP 

?    interface ens160      #指定虚拟ip的网卡接口

?    mcast_src_ip 192.168.25.31

?    virtual_router_id 79    #路由器标识，MASTER和BACKUP必须是一致的

?    priority 100            #定义优先级，数字越大，优先级越高，在同一个vrrp_instance下，MASTER的优先级必须大于BACKUP的优先级。这样MASTER故障恢复后，就可以将VIP资源再次抢回来 

  \#  nopreempt

?    advert_int 1         

?    authentication {   

?        auth_type PASS 

?        auth_pass 1111     

?    }

?    virtual_ipaddress {    

?        192.168.25.200

?    }

?      

track_script {               

   chk_mysql_port             

}

}

编写切换脚本。KeepAlived做心跳检测，如果Master的MySQL服务挂了(3306端口挂了),那么它就会选择自杀。Slave的KeepAlived通过心跳检测发现这个情况，就会将VIP的请求接管

[root@DB1 ~]# vim /opt/chk_mysql.sh

\#!/bin/bash

counter=$(netstat -na|grep "LISTEN"|grep "3306"|wc -l)

if [ "${counter}" -eq 0 ]; then

?	/etc/init.d/keepalived stop

fi

[root@DB1 ~]# chmod 755 /opt/chk_mysql.sh 

[root@DB1 ~]# /etc/init.d/keepalived start

3.2、DB2上配置keepalived，DB2服务器上的keepalived.conf文件只修改priority为99、nopreempt不设置

DB2:

[root@DB2 ~]# cp /etc/keepalived/keepalived.conf /etc/keepalived/keepalived.conf.bak

[root@DB2 ~]# >/etc/keepalived/keepalived.conf

[root@DB2 ~]# vim /etc/keepalived/keepalived.conf

! Configuration File for keepalived

?       

global_defs {

notification_email {

ops@qq.com

tech@qq.com

}

?       

notification_email_from ops@wangshibo.cn

smtp_server 127.0.0.1 

smtp_connect_timeout 30

router_id MASTER-HA

}

?       

vrrp_script chk_mysql_port {

?    script "/opt/chk_mysql.sh"

?    interval 2            

?    weight -5                 

?    fall 2                 

?    rise 1               

}

?       

vrrp_instance VI_1 {

?    state BACKUP

?    interface ens160 

?    mcast_src_ip 192.168.25.32

?    virtual_router_id 79    

?    priority 99          

?    advert_int 1         

?    authentication {   

?        auth_type PASS 

?        auth_pass 1111     

?    }

?    virtual_ipaddress {    

?       192.168.25.200

?    }

?      

track_script {               

   chk_mysql_port             

}

}

[root@DB2 ~]# cat /opt/chk_mysql.sh 

\#!/bin/bash

counter=$(netstat -na|grep "LISTEN"|grep "3306"|wc -l)

if [ "${counter}" -eq 0 ]; then

?    /etc/init.d/keepalived stop

fi

[root@DB2 ~]# chmod 755 /opt/chk_mysql.sh 

[root@DB2 ~]# /etc/init.d/keepalived start

####常用的指令说明

（1）notification_email：收件箱

（2）notification_email_from：发件箱

（3）vrrp_mcast_group4：VRRP多播地址，必须为D类地址，即可用IP范围为224.0.0.0~239.255.255.255

（4）script：自定义检查脚本路径

（5）interval：自定义检查脚本的执行时间间隔，单位为秒

（6）vrrp_instance：配置虚拟路由器实例

（7）state：MASTER或BACKUP，当前节点在此虚拟路由器上的初始状态，只能有一个为MASTER，其余的都应该为BACKUP，此处都需要配置为BACKUP

（8）nopreempt：定义工作模式为非抢占模式，默认为抢占模式

（9）preempt_delay：抢占模式下，节点上线后触发新选举操作的延迟时长，单位为秒

（10）interface：绑定当前虚拟路由器使用的物理接口

（11）virtual_router_id：当前虚拟路由器的唯一标识，取值范围为0~255，两个节点必须一致

（12）priority：当前主机在此虚拟路由器中的优先级，取值范围为0~255

（13）advert_int：VRRP通告心跳信息和优先级信息的时间间隔，单位为秒

（14）auth_type：认证类型

（15）auth_pass：认证密码，两个节点必须一致

（16）virtual_ipaddress：VIP地址

（17）可通过命令# man keepalived.conf查看keepalived.conf配置文件的详细帮助文档

现在查看一下vip在那一台机器，在DB1上是正确的

技术图片

在DB1下是正确的

3.3、测试：

首先先测试vip能不能正常切换

在DB1上操作关闭MySQL，看看能不能飘移到DB2上，然后在启动能不能正常飘移到DB1上

DB1:

[root@DB1 ~]# /etc/init.d/mysqld stop

[root@DB1 ~]# ip addr

查看得知，关闭msyql后vip已经没了

技术图片

DB2:

[root@DB2 ~]# ip addr

此时VIP已经飘移到DB2上

技术图片

启动DB1的MySQL和keepalived

注意：先启动MySQL在启动keepalived，因为脚本里MySQL没有启动的话keepalived启动后会再次关闭的

DB1:

[root@DB1 ~]# /etc/init.d/mysqld start

Starting MySQL. SUCCESS! 

[root@DB1 ~]# /etc/init.d/keepalived start

Starting keepalived (via systemctl):                       [  确定  ]

[root@DB1 ~]# ip addr

此时VIP已经成功飘移回DB1上

技术图片

3.4、故障转移高可用测试

首先在DB1和DB2上都要授权允许root用户远程登录，用于在客户端登录测试！

并在两台机器上设置IPtables防火墙规则

DB1:

授权：

[root@DB1 ~]# mysql -uroot -pwww.123

mysql> grant all on *.* to root@‘192.168.25.%‘ identified by "www.123";

Query OK, 0 rows affected, 1 warning (0.02 sec)

 

mysql> flush privileges;

Query OK, 0 rows affected (0.01 sec)

添加防火墙规则：

[root@DB1 ~]# vim /etc/sysconfig/iptables

-A INPUT -s 192.168.0.0/24 -d 224.0.0.18 -j ACCEPT       #允许组播地址通信

-A INPUT -s 192.168.0.0/24 -p vrrp -j ACCEPT             #允许VRRP（虚拟路由器冗余协）通信

-A INPUT -m state --state NEW -m tcp -p tcp --dport 3306 -j ACCEPT    #开放mysql的3306端口

[root@DB1 ~]# systemctl start iptables

DB2:

[root@DB2 ~]# mysql -uroot -pwww.123

mysql>  grant all on *.* to root@‘192.168.25.%‘ identified by "www.123";

Query OK, 0 rows affected, 1 warning (0.01 sec)

 

mysql> flush privileges;

Query OK, 0 rows affected (0.01 sec)

[root@DB2 ~]# vim /etc/sysconfig/iptables

-A INPUT -s 192.168.0.0/24 -d 224.0.0.18 -j ACCEPT       #允许组播地址通信

-A INPUT -s 192.168.0.0/24 -p vrrp -j ACCEPT             #允许VRRP（虚拟路由器冗余协）通信

-A INPUT -m state --state NEW -m tcp -p tcp --dport 3306 -j ACCEPT    #开放mysql的3306端口

[root@DB2 ~]# systemctl start iptables

注意：如果在启动防火墙报错（没有文件或目录时在防火墙规则里加一条

“IPTABLES -P INPUT ACCEPT”然后保存退出会生成/etc/sysconfig/下的iptables配置文件：使用service iptables save之后再重新启动iptables就可以了）

Monitor:

通过MySQL客户端通过VIP连接，看是否可以连接成功。（连接是需要提前在服务器端授权的）

[root@monitor ~]# mysql -h 192.168.25.200 -uroot -pwww.123

技术图片

创建一个数据库，然后在库中创建一个表，并插入数据。

mysql> show variables like "%hostname%";      （这条语句可查看当前VIP在那台服务器上）

技术图片

mysql> show databases;

技术图片

mysql> create database one;

Query OK, 1 row affected (0.01 sec)

 

mysql> use one;

Database changed

mysql> create table test_table(id int, name varchar(32));

Query OK, 0 rows affected (0.08 sec)

 

mysql> show tables;

+----------------+

| Tables_in_one |

+----------------+

| one_table     |

+----------------+

1 row in set (0.00 sec)

mysql> insert into one_table(id,name) values(1,‘glt‘);

Query OK, 1 row affected (0.02 sec)

验证数据：

分别查看DB1和DB2的数据同步情况

DB1:

[root@DB1 ~]# mysql -uroot -pwww.123

mysql> show databases;

+--------------------+

| Database           |

+--------------------+

| information_schema |

| mysql              |

| performance_schema |

| sys                |

| one               |

+--------------------+

5 rows in set (0.00 sec)

mysql> use one;

Database changed

mysql> show tables;

+----------------+

| Tables_in_one |

+----------------+

| one_table     |

+----------------+

1 row in set (0.00 sec)

mysql> select * from one_table;

+------+------+

| id   | name |

+------+------+

|    1 | glt  |

+------+------+

1 row in set (0.00 sec)

DB2:

mysql> show databases;

+--------------------+

| Database           |

+--------------------+

| information_schema |

| mysql              |

| one                |

| performance_schema |

| sys                |

+--------------------+

5 rows in set (0.00 sec)

mysql> use one

Database changed

mysql> show tables;

+---------------+

| Tables_in_one |

+---------------+

| one_table     |

+---------------+

1 row in set (0.00 sec)

 

mysql> select * from one_table

?    -> ;

+------+------+

| id   | name |

+------+------+

|    1 | glt  |

+------+------+

1 row in set (0.00 sec)

3.5故障测试：

停止DB1中的MySQL，通过VIP登录查看当前的在那一台服务器上并继续在one库上插入数据，然后在重启DB1看是否可以同步数据。

DB1:

[root@DB1 ~]# service mysqld stop

Shutting down MySQL............ SUCCESS!

Monitor：

[root@monitor ~]# mysql -h 192.168.25.200 -uroot -pwww.123

mysql> show variables like "%hostname%";

+---------------+-------+

| Variable_name | Value |

+---------------+-------+

| hostname      | DB2   |

+---------------+-------+

1 row in set (0.00 sec)

当前连接的是DB2，故障自动切换成功。

mysql> use one;

Database changed

mysql> insert into one_table(id,name)values(2,‘hhh‘);

Query OK, 1 row affected (0.03 sec)

 

mysql> select * from one_table;

+------+------+

| id   | name |

+------+------+

|    1 | glt  |

|    2 | hhh  |

+------+------+

2 rows in set (0.00 sec)

启动DB1查看同步情况

DB1:

[root@DB1 ~]# /etc/init.d/mysqld start

Starting MySQL. SUCCESS! 

[root@DB1 ~]# mysql -uroot -pwww.123

mysql> show databases;

+--------------------+

| Database           |

+--------------------+

| information_schema |

| mysql              |

| one                |

| performance_schema |

| sys                |

+--------------------+

5 rows in set (0.00 sec)

mysql> use one;

Reading table information for completion of table and column names

You can turn off this feature to get a quicker startup with -A

 

Database changed

mysql> show tables;

+---------------+

| Tables_in_one |

+---------------+

| one_table     |

+---------------+

1 row in set (0.00 sec)

 

mysql> select * from one_table

?    -> ;

+------+------+

| id   | name |

+------+------+

|    1 | glt  |

|    2 | hhh  |

+------+------+

2 rows in set (0.00 sec)

数据同步成功

到此，双机热备全部完成

四、增加读写分离配置**

在之前的基础上改动以下环境；如下：

192.168.25.31 MySQL+keepalived

192.168.25.32 MySQL+keepalived

写入VIP：192.168.25.200（31主，32从）

读取VIP：192.168.25.100（32主，31从）

4.1、MySQL配置文件增加一条配置（两台都要做）

[root@DB1 ~]# cp /etc/my.cnf /etc/my.cnf.bak

[root@DB1 ~]# vim /etc/my.cnf

binlog_format=mixed

4.2、配置keepalived

DB1：

[root@DB1 ~]# cp /etc/keepalived/keepalived.conf /etc/keepalived/keepalived.conf.bak2

[root@DB1 ~]# vim /etc/keepalived/keepalived.conf

修改如下

! Configuration File for keepalived

?       

global_defs {

notification_email {

ops@wangshibo.cn

tech@wangshibo.cn

}

?       

notification_email_from ops@wangshibo.cn

smtp_server 127.0.0.1 

smtp_connect_timeout 30

router_id MASTER-HA

}

?       

vrrp_script chk_mysql_port {     #检测mysql服务是否在运行。有很多方式，比如进程，用脚本检测等等

?    script "/opt/chk_mysql.sh"   #这里通过脚本监测

?    interval 2                   #脚本执行间隔，每2s检测一次

?    weight -5                    #脚本结果导致的优先级变更，检测失败（脚本返回非0）则优先级 -5

?    fall 2                    #检测连续2次失败才算确定是真失败。会用weight减少优先级（1-255之间）

?    rise 1                    #检测1次成功就算成功。但不修改优先级

}

?       

vrrp_instance VI_1 {

?    state BACKUP 

?    interface ens160      #指定虚拟ip的网卡接口

?    mcast_src_ip 192.168.25.31

?    virtual_router_id 79    #路由器标识，MASTER和BACKUP必须是一致的

?    priority 100            #定义优先级，数字越大，优先级越高，在同一个vrrp_instance下，MASTER的优先级必须大于BACKUP的优先级。这样MASTER故障恢复后，就可以将VIP资源再次抢回来 

?    nopreempt #不主动抢占资源，只有在优先级高的机器上设置即可，优先级低的机器不设置

?    advert_int 1         

?    authentication {   

?        auth_type PASS 

?        auth_pass 1111     

?    }

?    virtual_ipaddress {    

?        192.168.25.200  #写入虚拟VIP

?    }

}

?      

track_script {               

   chk_mysql_port             

vrrp_instance VI_2{

?	state BACKUP #另一台配置为MASTER

?	interface ens160

?	virtual_router_id 44 #注意id和上面的不同（另一台和这个ID一样）

?	priority 90 #优先级，另一台为100

?	advert_int 1

?	authentication {

?	auth_type pass

?	auth_pass 1111

?	}

?	virtual_ipaddress {

?	192.168.25.100 #读取虚拟VIP

?	}

}

}

技术图片

DB2:

##注意:在此次的环境中不知道为什么DB2的keepalived必须要在/usr/local/keepalived/var/run/这个路径下把keepalived.pid文件放进去，不然启动不了，并且每启动一次这个文件就会消失一次，需要再次拷贝过去，原keepalived.pid文件在/run/keepalived.pid

[root@DB2 ~]# cp /run/keepalived.pid /usr/local/keepalived/var/run/**

 

[root@DB2 ~]# cp /etc/keepalived/keepalived.conf /etc/keepalived/keepalived.conf.bak2

[root@DB2 ~]# vim /etc/keepalived/keepalived.conf

! Configuration File for keepalived

?       

global_defs {

notification_email {

ops@qq.com

tech@qq.com

}

?       

notification_email_from ops@wangshibo.cn

smtp_server 127.0.0.1 

smtp_connect_timeout 30

router_id MASTER-HA

}

?       

vrrp_script chk_mysql_port {

?    script "/opt/chk_mysql.sh"

?    interval 2            

?    weight -5                 

?    fall 2                 

?    rise 1               

}

?       

vrrp_instance VI_1 {

?    state BACKUP #两台此处都是BACKUP

?    interface ens160 #网卡接口

?    \#mcast_src_ip 192.168.25.32

?    virtual_router_id 79    

?    priority 90          

?    advert_int 1         

?    authentication {   

?        auth_type PASS 

?        auth_pass 1111     

?    }

?    virtual_ipaddress {    

?       192.168.25.200  #写入虚拟VIP

?    }

?      

track_script {               

   chk_mysql_port             

}

}

vrrp_instance VI_2{

?	state MASTER #用于MySQL读

?	interface ens160 #网卡接口

?	virtual_router_id 44 #注意id和上面的不同（另一台和这个ID一样）

?	priority 100 #优先级，另一台为90

?	advert_int 1

?	authentication {

?	auth_type pass

?	auth_pass 1111

?	}

?	virtual_ipaddress {

?	192.168.25.100 #读取虚拟VIP

?	}

}

}

技术图片

4.3、查看当前ip是否做成了读写分离

DB1和DB2重启keepalived查看此时的虚拟ip

DB1：

[root@DB1 ~]# ip addr

1: lo: <LOOPBACK,UP,LOWER_UP> mtu 65536 qdisc noqueue state UNKNOWN group default qlen 1000

?    link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00

?    inet 127.0.0.1/8 scope host lo

?       valid_lft forever preferred_lft forever

?    inet6 ::1/128 scope host 

?       valid_lft forever preferred_lft forever

2: ens160: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP group default qlen 1000

?    link/ether 00:50:56:9d:45:0a brd ff:ff:ff:ff:ff:ff

?    inet 192.168.25.31/24 brd 192.168.25.255 scope global noprefixroute ens160

?       valid_lft forever preferred_lft forever

?    inet 192.168.25.200/32 scope global ens160

?       valid_lft forever preferred_lft forever

?    inet6 fe80::779a:c241:de68:1ca8/64 scope link noprefixroute 

?       valid_lft forever preferred_lft forever

DB1的虚拟ip是写入ip没问题

DB2：

[root@DB2 ~]# ip addr

1: lo: <LOOPBACK,UP,LOWER_UP> mtu 65536 qdisc noqueue state UNKNOWN group default qlen 1000

?    link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00

?    inet 127.0.0.1/8 scope host lo

?       valid_lft forever preferred_lft forever

?    inet6 ::1/128 scope host 

?       valid_lft forever preferred_lft forever

2: ens160: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP group default qlen 1000

?    link/ether 00:50:56:9d:54:61 brd ff:ff:ff:ff:ff:ff

?    inet 192.168.25.32/24 brd 192.168.25.255 scope global noprefixroute ens160

?       valid_lft forever preferred_lft forever

?    inet 192.168.25.100/32 scope global ens160

?       valid_lft forever preferred_lft forever

?    inet6 fe80::5a60:abe2:4734:487e/64 scope link noprefixroute 

?       valid_lft forever preferred_lft forever

此时DB2的虚拟ip是读取ip没得问题

4.4、故障处理（测试）

故障一：31(写)服务器或者网络故障，虚拟ip 200切换到32

1、 31服务器恢复后，不要插上网线或者修改31的iP（防止数据自动同步，导致数据污染）

2、暂时关闭keepalive（默认开机不启动）

3、启动31的mysql并停掉slave，防止32数据同步到31，同时插上网线或者修改iP为31；

4、检查32的slave状态是有主键冲突，如果有主键冲突，导出31上的数据，并做删除；

5、重启32的slave，查看是否还有主键冲突，如果有继续上步操作，直到32的slave状态恢复正常；

6、开启31的slave并查看slave状态，正常情况下应该不会出现主键冲突，如果有主键冲突，导出数据并分析原因，(根据实际情况处理)

7、检查31与32服务器数据是否一致，如果数据一致，切换VIP 100(读虚拟IP)到31,修改步骤如下:

a)修改32的keepalive配置vrrp_instance VI_2 中state状态为BACKUP、priority 修改为90

b)重启32 keepalive（确保31的keepalive是关闭状态）

c)修改31的keepalive配置vrrp_instance VI_2 中state状态为MASTER、priority 修改为180

d)重启31的keepalive

e)检查VIP 100（读虚拟IP）是否切到31上，并且VIP 200（写虚拟IP）应该保留在32上。

8、线上应用测试（读与写）

故障修复后的状态应该是：

1.192.168.25.31 mysql+keepalive

2.192.168.25.32 mysql+keepalive

3.写入VIP：192.168.25.200（32主，31从）

4.读取VIP：192.168.25.100(31主，32从)

故障二、32(读)数据库出现故障，VIP 100（读虚拟IP）切到31服务器

1、修复32服务器之前应断开网线或者修改ip(防止读VIP自动切回)

2、关闭keepalive 所以服务器上的keepalive 最好设计成开不会自动启动命令如下：chkconfig keepalived off

3、检查32数据库的slave状态是否正常，数据库数据同步是否正常

4、数据同步完成后启动keepalive，检查读取数据的虚拟IP 100应该切回本服务器，写数据的虚拟IP不变。

5、应用测试读写数据是否正常

故障三、两台数据库服务器同时故障

1、开启31和32数据库之前，先断网线

2、分别检查31和32服务器的mysql更新的最新时间

3、如果31数据比较新，先插上31的网线，使其对外提供服务。

3.1检查读和写的虚拟iP是否都在31上

3.2关闭32上的keepalive，并且开启32上msyql的salve，同步31上的数据

3.3如果同步正常启动keepalive

3.4测试读写数据是否正常

4、如果32的数据比较新，就先插上32的网线，使其对外提供服务

4.1 检查读和写的虚拟ip是否都在32上

4.2 关闭31上的keepalive，并且开启31上mysql的save，开始同步32上的数据

4.3如果同步正常，启动31的keepalive

4.4测试读写数据是否正常

4.5应用测试程序是否正常

Mysql双主加Keepalived

标签：tab software 复杂 not ipa 连接 listen ip地址 fresh

原文地址：https://www.cnblogs.com/clllum/p/11791913.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

Mysql双主加Keepalived

一、MySQL于keepalived简介**

1.1、MySQL**

1.1.1、MySQL主从复制原理

1.1.2、MySQL双主构建思路

1.2、Keepalived介绍**

1.2.1、keepalived理论工作原理

1.2.2、keepalived高可用故障切换转移原理

1.3、目的：

1.3,1、实现方式：

1.3.2、MySQL双主读写分离模式

测试环境：

二：实现两台MySQL主主同步

2.1、安装MySQL

2.2、修改MySQL配置文件

2.3、MySQL配置DB1、DB2主主模式

2.3.1、先查看log bin日志和pos位置

2.3.2、DB1、DB2互相提升访问权限

2.4、测试主主同步

2.5、配置slave从服务器

三、安装并配置keepalived

3.1、两台都需要安装keepalived

3.2、DB1上的keepalived.conf配置

3.3、测试：

3.4、故障转移高可用测试

3.5故障测试：

四、增加读写分离配置**

4.1、MySQL配置文件增加一条配置（两台都要做）

4.2、配置keepalived

DB1：

DB2:

4.3、查看当前ip是否做成了读写分离

DB1：

DB2：

4.4、故障处理 （测试）

故障一：31(写)服务器或者网络故障，虚拟ip 200切换到32

故障二、32(读)数据库出现故障，VIP 100（读虚拟IP）切到31服务器

故障三、两台数据库服务器同时故障

4.4、故障处理（测试）