标签:zabbix
监控cpu的负载
分析:
安装完zabbix后,在Template OS Linux这个模板下面默认有监控cpu负载的触发器,但是这个默认的触发器是以cpu负载的个数为触发值的,由于agent客户机每台的cpu核数是不一样的,所以,以负载的个数为触发值不是很好,下面我设置的触发值是cpu负载占cpu核数的百分比
步骤:
1、(agent端)
mkdir -p /etc/zabbix/itemscripts (创建一个脚本目录,所有的zabbix agent的脚本都放在这里,方便管理)
cd /etc/zabbix/itemscripts
vi cpu_load.sh (创建一个cpu负载的脚本)
#!/bin/bash
cpucore=`cat /proc/cpuinfo | grep ‘processor‘ |wc -l` (cpu的总核数)
cpuload=`top -n 1 | grep ‘load average‘ | awk -F":" ‘{print $5}‘ | awk -F"," ‘{print $1*100}‘` (top命令查看cpu的负载时,负载值是一个两位小数,乘100后变为整数)
cpuload_percent=`${cpuload}/${cpucore}`
echo $cpuload_percent
注意:
shell脚本里默认是不支持小数计算的
cpuload_percent:这个值最终乘100了
[root@www run]chmod 755 cpu_load.sh (给脚本加可执行权限)
[root@www run]./cpu_load.sh (注意:当执行脚本时是有返回值的)
0
2、(agent端)
cd /etc/zabbix/zabbix_agentd.d (key值文件存放的目录,必须是这个目录)
vi userparameter_cpu.conf (文件名)
UserParameter=cpu_load_percent,cd /etc/zabbix/itemscripts;./cpu_load.sh
注意:
cpu_load_percent:key值名称
/etc/init.d/zabbix_agentd restart (重启zabbix_agent服务)
3、(server端)
在zabbix server端执行zabbix_get,却出现一个问题:
当执行zabbix_get -s 192.168.186.128 -k cpu_load_percent时,没有返回任何值,而是返回一个空值
在这里我研究了一下午,一直没有解决,不知道是为什么
一气之下,我干脆写了一个计划任务,然后每分钟执行一次,如下:
(agent端)
[root@www run]#crontab -l
#分 时 日 月 周 用户名 命令
*/1 * * * * cd /etc/zabbix/itemscripts;./cpu_load.sh > /etc/zabbix/itemscripts/cpuloadpercent
4、(agent端)
cd /etc/zabbix/zabbix_agentd.d
vi userparameter_cpu.conf
UserParameter=cpu_load_percent,cat /etc/zabbix/itemscripts/cpuloadpercent
/etc/init.d/zabbix_agentd restart (重启zabbix_agent服务)
5、(server端)
这次再执行zabbix_get -s 192.168.186.128 -k cpu_load_percent时,却显示正常
6、
到web界面添加相应的监控项
注意:正常情况下,cpu的负载值不会超过cpu的总核数
在设置触发值条件时,我们可以设置,持续5分钟内若cpu的负载与cpu总核数比例大于99,则触发报警
总结:
从上面的步骤来看,zabbix监控cpu的负载与cpu总核数比例的方法,不是很理想
若:被监控的agent机,有上百台或上千台的话,这种方法就废了
不过:如果我们的线上配置了puppet或是saltstack的话,就非常方便了,我们只需要在master端进行相应的配置,然后把数据推送给agent端,搞定!!!!
本文出自 “见” 博客,请务必保留此出处http://732233048.blog.51cto.com/9323668/1639486
标签:zabbix
原文地址:http://732233048.blog.51cto.com/9323668/1639486