一. Ganglia的搭建
Ganglia是一个分布式的,监控服务器,集群的开源软件,能够用曲线图表现最近一个小时,最近一天,最近一周,最近一月,最近一年的服务器或者集群的cpu负载,内存,网络,硬盘等指标。
Ganglia的强大在于:ganglia服务端能够通过一台客户端收集到同一个网段的所有客户端的数据,ganglia集群服务端能够通过一台服务端收集到它下属的所有客户端数据。这个体系设计表示一台服务器能够通过不同的分层能够管理上万台机器。这个功能是其他mrtg,nagios,cacti所不能比拟。
ganglia有两个Daemon, 分别是:客户端Ganglia Monitoring Daemon (gmond)和服务端Ganglia Meta Daemon (gmetad),还有Ganglia PHP Web Frontend(基于web的动态访问方式组成)是一个Linux下图形化监控系统运行性能的软件,界面美观、丰富,功能强大。
(1)安装ganglia
可以将tar包制作成rpm包然后快速安装。
在服务机(server3)上
#yum install -y libart_lgpl-devel gcc-c++ python-devel libconfuse-devel-2.6.3.e16.x86_64.rpm pcre-devel expat-devel rrdtool-devel apr-devel rpm-build //制作ganglia的rpm包依赖这些组件。
#rpmbuild -tb ganglia-3.4.0.tar.gz ganglia-web-3.4.2.tar.gz //制作ganglia.rpm 和 ganglia-web.rpm
#rpm -ivh /root/rpmbuild/RPMS/noarch/ganglia-web-3.4.2.1.noarch.rpm /root/rpmbuild/RPMS/x86_64/* //安装ganglia-web gmetad gmond
#cd /root/rpmbuild/RPMS/x86_64
#scp ganglia-gmond-3.4.0-1.x86_64.rpm ganglia-gmond-modules-python-3.4.0-1.x86_64.rpm libganlia-3.4.0-1.x86_64.rpm 172.25.0.2:
#scp ~/libconfuse* 172.25.0.2: //复制相应组件到客户端
#vim /etc/ganglia/gmetad.conf
将data_source后面改为自定义名称如 big cluster //修改集群名称
#/etc/init.d/gmetad start //启动gmetad服务
#vim gmond.conf 将name后面改为 big cluster
#/etc/init.d/gmond start //启动gmond服务(监控本机,所以启动gmond服务)
#service httpd start
在客户端(server2)上
#rpm -ivh ganglia-gmond* libganglia-3.4.0-1.x86_64.rpm libconfuse* //安装gmond
#vim /etc/ganglia/gmond.conf 将name后面改为big cluster
启动gmond
Firefox上输入 172.25.0.3/gweb 如图
(2) 将ganglia整合到nagios中
在server3上
#tar zxf ganglia-3.4.0.tar.gz
#cd ganglia-3.4.0/contrib
#cp check_ganglia.py /usr/local/nagios/libexec
#chown nagios.nagios check_ganglia.py
#vim check_ganglia.py
编辑成如下图
//将大于阈值时报警改为低于阈值报警
#cd /var/lib/ganglia/rrds/big\ cluster
可以看到很多以rrd结尾的文件,这些都是ganglia采集的数据
#/usr/local/nagios/libexec/check_ganglia.py -h server2.example.com -m disk_free_precent_rootfs -w 20 -c 10 //查看根分区使用情况
下面是修改nagios的配置文件(cfg文件)来整合ganglia。
在nagios的command.cfg中,添加
define command {
command_name check_ganglia
command_line $USER1$/check_ganglia.py -h $HOSTADDRESS$ -m $ARG1$ -w
$ARG2$ -c $ARG3$
}
在hosts.cfg中,添加
define host {
use linux-server
host_name server4.example.com
address 172.25.0.4
}
define hostgroup {
hostgroup_name ganglia-servers
alias ganglia-servers
members server4.example.com
}
并在hostgroup中添加server4.example.com //添加了被监控机server4,相应配置与server2一样
在templates.cfg中,添加
define service {
use local-service
name ganglia-service
hostgroup_name ganglia-server
sservice_groups ganglia-metrics
}
在nagios的service.cfg中,添加
define servicegroup {
servicegroup_name ganglia-metrics
alias Ganglia Metrics
}
define service{ ganglia-service
use ganglia-service
Service-description根分区
check_command check_ganglia!disk_free_percent_rootfs!20!10
}
define service{
use ganglia-service
service_description 内存空闲
check_command check_ganglia!mem_free!50000!30000
}
#service nagios retart
整合完成。
二. Zabbix的搭建
Zabbix 是一款功能强大的分布式开源监控系统,可以提供企业级的开源分布式监控解决方案。天生自带分布式监控,大批量主机运维监控优势明显。
Zabbix 通过 C/S 模式采集数据,通过 B/S 模式在 web 端展示和配置。
被监控端:主机通过安装 agent 方式采集数据,网络设备通过 SNMP 方式采集数据
Server 端:通过收集 SNMP 和 agent 发送的数据,写入数据库(MySQL,ORACLE 等),再通过 php+apache 在 web 前端展示。
Zabbix 运行条件:
Server:Zabbix Server 需运 行在 LAMP( Linux+Apache+Mysql+PHP)环 境下( 或者
LNMP),对硬件要求低
Agent:目前已有的 agent 基本支持市面常见的 OS,包含 Linux、HPUX、Solaris、Sun、
windows
SNMP:支持各类常见的网络设备
(1) 安装zabbix
在server端(server3)上
#yum install -y zabbix-2.4.5-1.e16.x86_64.rpm zabbix-agent-2.4.5-1.e16.x86_64.rpm zabbix-server-mysql-2.4.5.-1.e16.x86_64.rpm zabbix-web-2.4.5-1.e16.noarch.rpm zabbix-web-mysql-2.4.5-1.e16.noarch.rpm php-bcmath-5.3.3-26.e16.x86_64.rpm php-mbstring-5.3.3-26.e16.x86_64.rpm zabbix-server-2.4.5-1.e16.x86_64.rpm fping-2.4b2-16.e16.x86_64.rpm iksemel-1.4.2-e16.x86_64.rpm //安装zabbix-server,zabbix-agent,zabbix的web支持
在agent端(server2)上
#rpm -ivh zabbix-agent-2.4.5-1.e16.x86_64.rpm zabbix-2.4.5-1.e16.x86_64.rpm //安装zabbix-agent
在server3上,
在mysql上创建zabbix库并加入一个 zabbix用户 密码redhat
#cd /usr/share/doc/zabbix-server-mysql-2.4.5/create/
#mysql -uzabbix -predhat zabbix < schema.sql
#mysql -uzabbix -predhat zabbix < image.sql
#mysql -uzabbix -predhat zabbix < data.sql //将zabbix的mysql组件导入到zabbix用户的zabbix库中
#vim /etc/zabbix/zabbix_server.conf
将DBPassword后面改为 redhat,(修改zabbix配置文件的数据库密码)
重启httpd,zabbix-server
在浏览器上输入172.25.0.3/zabbix/,启动zabbix 的web界面。配置如下
Database type Mysql
Database host localhost
Database port 0 (0为数据库默认端口)
Databasename zabbix
User zabbix
Password redhat
点击test connection,成功后点击next,然后配置如下:
Host 172.25.0.3
Port 10051
Name server3.example.com
点击next后输入默认用户名和密码为Admin/zabbix
在server2上,
#vim /etc/zabbix/zabbix_agentd.conf //修改zabbix_agent配置
将Hostname 改为server2.example.com,
重启zabbix-agent服务。
在server3上,同上。不过server2改为server3.
(2) 让zabbix发现主机。
在zabbix的web界面上,点击 configuration-> actions -> create action
自定义name
在operation选项卡中
添加 add host 自动注册主机添加到hosts列表
Add to host groups 自动注册主机加入任一组如linux servers
Link to templates 自动注册主机应用模板 template os linux
点击configuration -> hosts可以看到新加的主机
(3)配置监控服务
以http服务为例,点击configure -> templates 选择需要链接的模板template app http service
选择需要链接的主机 server2.example.com
这样主机server2.example.com的监控项中就出现了http服务
监控zabbix_server上的mysql服务
在/etc/zabbix/zabbix_agentd.d/userparameter_mysql.conf 文件中指定了 zabbix agent 如何获取 mysql服务的各种信息, 可以在 zabbix_server.conf 文件中找到密码。
在server3上,
#mysqladmin -uzabbix -pwestos ping //检查mysqld是否运行
#mkdir /var/lib/zabbix
#vim /var/lib/zabbix/.my.cnf //在/var/lib/zabbix目录中新建“.my.cnf”文件,用以指定 zabbix agent 如何登陆数据库,默认使用的是 zabbix 用户
写入
[mysql]
host = localhost
user = zabbix
password = westos
socket = /var/lib/mysql/mysql.sock
[mysqladmin]
host = localhost
user = zabbix
password = westos
socket = /var/lib/mysql/mysql.sock
重启zabbix-agent zabbix-server
在web上即可看到统计图表
点击Configuration->hosts->zabbix server Graphs即可看到关于mysql的两个监控图形
(4)Zabbix报警
使用110云告警:
登陆www.onealert.com 注册帐号,扫描二维码绑定微信。按照网页中的文档说明安装配置110云告警插件。告警方式有邮件,微信,电话,短信等。
总结
zabbix的主要特点:
- 安装与配置简单,学习成本低
- 支持多语言(包括中文)
- 免费开源
- 自动发现服务器与网络设备
- 分布式监视以及WEB集中管理功能
- 可以无agent监视
- 用户安全认证和柔软的授权方式
- 通过WEB界面设置或查看监视结果
- email等通知功能
Zabbix主要功能:
- CPU负荷
- 内存使用
- 磁盘使用
- 网络状况
- 端口监视
- 日志监视
本文出自 “linux札记” 博客,转载请与作者联系!
原文地址:http://simplelinux.blog.51cto.com/5505221/1789370