标签:
使用Heartbeat构建Linux双机热备系统
本文档版本号: V1.0
版 本 历 史 |
|
|
|
版本号 |
更新时间 |
说 明 |
创建者 |
V1.0 |
2013-3-23 |
修改版 |
金桥 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 部署环境
OS: Red Hat Enterprise Linux release 6.0 Beta (Santiago)
kernel: 2.6.32-19.el6.x86_64
Software:
Heartbeat ver3.0.5
Libnet ver1.1.6
2 Heartbeat简介
Heartbeat是Linux-HA的一个开源的Linux High-Availability群集项目, 支持如下应用群集:
3 安装Heartbeat
3.1 添加用户和组
# groupadd -g 800 haclient
# useradd -u 800 -g haclient hacluster
# yum install -y cluster-glue wget net-snmp-devel net-snmp OpenIPMI glib2-devel libxml2-devel bzip2-devel libuuid-devel docbook-utils docbook-dtds libtool-ltdl libxslt perl-TimeDate openssl-devel docbook-style-xsl e2fsprogs-devel mailx glib2-devel libtool-ltdl-devel net-snmp-devel bzip2-devel ncurses-devel openssl-devel libtool libxml2-devel gettext bison flex zlib-devel mailx which docbook-style-xsl PyXML shadow-utils opensp autoconf automake libxslt libxslt-devel libgcrypt-devel pkgconfig libgpg-error-devel sgml-common opensp openjade xml-common docbook-style*
# rpm –ivh libtool-ltdl-devel
# yum install -y intltool
# yum install -y pacemaker
3.2 编译和安装libnet库
# su - root
# cp libnet.tar.gz /usr/local
# cd /usr/local
# tar xzvf libnet.tar.gz
# cd libnet
# ./configure
# make
# make install
# cd libnet-1.1.6/src/.libs/
# cp libnet.so.1 /usr/lib64/
3.3编译和安装Reusable-Cluster-Components-glue--glue
# bunzip2 Reusable-Cluster-Components-glue--glue-1.0.9.tar.bz2
# tar xvf Reusable-Cluster-Components-glue--glue-1.0.9.tar
# cd Reusable-Cluster-Components-glue--glue-1.0.9
# ./autogen.sh
# ./configure && make && make install
3.4编译和安装ClusterLabs-resource-agents
# tar xzvf ClusterLabs-resource-agents-v3.9.2-0-ge261943.tar.gz
# cd ClusterLabs-resource-agents-b735277/
# ./autogen.sh
# ./configure && make && make install
metadata-IPv6addr.xml:1: parser error : Document is empty
metadata-IPv6addr.xml:1: parser error : Start tag expected, ‘<‘ not found
unable to parse metadata-IPv6addr.xml
gmake[2]: *** [ocf_heartbeat_IPv6addr.xml] Error 6
gmake[2]: Leaving directory `/home/soft/ClusterLabs-resource-agents-b735277/doc‘
gmake[1]: *** [all-recursive] Error 1
gmake[1]: Leaving directory `/home/soft/ClusterLabs-resource-agents-b735277‘
make: *** [all] Error 2
遇到此错误,将此安装包删除,重新解压,再次执行,
3.4 编译和安装heartbeat HA
# su - root
# bunzip2 Heartbeat-3-0-7e3a82377fa8.tar.bz2
# tar xvf Heartbeat-3-0-7e3a82377fa8.tar
# cd Heartbeat-3-0-7e3a82377fa8
#./bootstrap
# cp /usr/include/heartbeat/*.h /usr/include/
# cp /root/Reusable-Cluster-Components-glue--glue-1.0.9/include/clplumbing/*.h /usr/include/
# cp /root/Reusable-Cluster-Components-glue--glue-1.0.9/include/*.h /usr/include/
#./ConfigureMe configure && make && make install
此处configure应该指定安装路径,默认安装在/usr/etc下
heartbeat 启动后,关闭出现异常,提示问题/etc/init.d/heartbeat: line 253: /ResourceManager: No such file or directory 解决方式: vi /etc/ha.cf/shellfuncs
增加如下信息: : ${HA_NOARCHBIN:=/usr/share/heartbeat}
4 配置Heartbeat service
4.1 配置/etc/hosts
在所有节点上配置:
192.168.209.50 kingserver60
192.168.209.60 kingserver50
4.2 配置/etc/ha.d/ha.cf
以root身份编辑所有节点的配置文件ha.cf:
其中auto_failback on表示主节点在错误状态恢复正常之后,会重新接管HA,
bcast eth0 表示是eth0网卡为ha工作网络
node kingserver60
node kingserver50 分别表示ha的主节点和备节点的主机名
ping 192.168.209.1,可以设置为ping一个可用的节点即可。
serial /dev/ttyS0 串口如果没有心跳线,就不要配置啊!
debugfile /var/log/ha-debug
logfile /var/log/ha-log
logfacility local0
keepalive 2
deadtime 30
warntime 10
udpport 694
bcast eth0
ucast eth0 192.168.209.1
auto_failback on
node kingserver60
node kingserver10
ping 192.168.209.41
respawn hacluster /usr/lib64/heartbeat/ipfail
4.3 配置/etc/ha.d/authkeys(所有节点)
auth 1
1 crc
以root身份更改授权文件的权限
# chmod 600 authkeys
4.4 配置/etc/ha.d/haresources
如果是配置heartbeat本身支持的服务,可以直接调用heartbeat的默认脚本,形如:
kingserver60 IPaddr::192.168.209.100/24/eth0 httpd
如果是需要自己定义的程序脚本,需要配置所有节点:
Node1 表示的是主节点主机名,192.168.0.26表示ha的工作IP,haserver.sh表示ha的切换脚本
单网卡SHQZ-PS-WCITY-SV-MMS01 172.17.60.73/255.255.255.128/eth0 harmserver.sh
多网卡
SHQZ-PS-WCITY-CL02 IPaddr::192.168.156.10/255.255.255.0 clserver1.sh
SHQZ-PS-WCITY-CL02 IPaddr::10.11.25.10/255.255.255.224 clserver2.sh
node1 192.168.0.26 haserver.sh
其中haserver.sh为HA在切换时运行的脚本。位于/etc/rc.d/init.d目录下.
如: /etc/rc.d/init.d/haserver.sh
此处一定要记得传参数
date >> /tmp/ha.txt
su - vas -c "vas_server.sh $1"
exit 0
用户vas脚本vas_server.sh如下:
if [ $1 = "start" ]; then
echo "Starting vas..."
/home/vas/vas/bin/billing.sh &
echo "* * * * * /home/vas/vas/bin/billing.sh > /dev/null" > /tmp/cron.vas
echo "0,30 * * * * /home/vas/watch1.1/watch.sh > /dev/null" >> /tmp/cron.vas
crontab /tmp/cron.vas
fi
if [ $1 = "stop" ]; then
echo "Stopping vas..."
crontab -r
echo "Sleep 65 seconds..."
sleep 65
app_name="billing"
ps -ef | grep ${app_name} | awk ‘{print $2}‘ | xargs kill -9 >/dev/null 2>&1
app_name="SMSAgent"
ps -ef | grep ${app_name} | awk ‘{print $2}‘ | xargs kill -9 >/dev/null 2>&1
fi
exit 0
4.5 启动和停止Heartbeat
# /etc/init.d/heartbeat start
# /etc/init.d/heartbeat stop
# /etc/init.d/heartbeat start
5 测试Heartbeat
5.1 测试service IP是否成功
可以用ping命令测试service IP(如192.168.0.26)是否成功, 也可以在HA的Active机器上使用ifconfig查看网卡是否绑定多个IP地址。
5.2 服务脚本是否运行正常
可以观察2台机器(1台Active, 1台Standby)是否运行了服务脚本haserver.sh.
5.3 HA切换是否正常
手工模拟网卡坏掉的情况,将处于Active状态的机器的网卡拔掉,然后监测日志/var/log/ha.log,这时service应从Active切换到Standby的机器,然后利用上面的方法测试Service IP和服务脚本是否运行正常。
手工模拟机器当机的情况,将处于Active状态的机器人工关机,依照上面的方法测试HA切换是否正常。
标签:
原文地址:http://www.cnblogs.com/krainbow/p/3870527.html