标签:log file 大致 col $0 功能 parameter 添加 name
公司有大量测试环境的url需要监控是否能够访问,即url状态不为200即报警。状态为200即正常。
因url比较多,且经常发生改变,如通过web场景配置(我没配过)会比较繁琐,工作量比较大。
通过网上查找资料,可通过脚本结合zabbix的自动发现功能即可批量监控,只需维护一个url列表即可。
1.在任意的zabbix agent端添加如下脚本,我这里是在客户机的/opt/zabbix/scripts/目录下新建的web_site_code_status.sh
#!/bin/bash UrlFile="/opt/zabbix/scripts/WEB.txt" IFS=$‘\n‘ web_site_discovery () { WEB_SITE=($(cat $UrlFile|grep -v "^#")) printf ‘{\n‘ printf ‘\t"data":[\n‘ num=${#WEB_SITE[@]} for site in ${WEB_SITE[@]} do num=$(( $num - 1 )) url=$(echo $site|awk ‘{print $1}‘) ip=$(echo $site|awk ‘{print $2}‘) if [ $num -ne 0 ] ; then printf "\t\t{\"{#SITENAME}\":\""${url}"\",\"{#PROXYIP}\":\""${ip}"\"},\n" else printf "\t\t{\"{#SITENAME}\":\""${url}"\",\"{#PROXYIP}\":\""${ip}"\"}\n" printf ‘\t]\n‘ printf ‘}\n‘ fi done } web_site_code () { if [ "$2" == "" ]; then curl -s --connect-timeout 2 -m 4 -o /dev/null -w %{http_code} $1 elif echo $2 |grep ‘:‘ &>/dev/null ; then curl -s --connect-timeout 2 -m 4 -o /dev/null -w %{http_code} $1 -x $2 else curl -s --connect-timeout 2 -m 4 -o /dev/null -w %{http_code} $1 -x $2:80 fi } case "$1" in web_site_discovery) web_site_discovery ;; web_site_code) web_site_code $2 $3 ;; *) echo "Usage:$0 {web_site_discovery|web_site_code [URL]}" ;; esac
2.在/opt/zabbix/scripts/新建WEB.txt文件,格式如下
http://www.baidu.com http://www.sina.com.cn http://www.163.com 10.10.10.10 http://www.sohu.com 115.23.16.97:80 http://www.111.com
3.在zabbix客户端加配置文件:
#vim /etc/zabbix/zabbix_agentd.d/web_site_discovery.conf UserParameter=web.site.discovery,/opt/zabbix/scripts/web_site_code_status.sh web_site_discovery UserParameter=web.site.code[*],/opt/zabbix/scripts/web_site_code_status.sh web_site_code $1 $2
4.在服务端测试是否正常
#yum install zabbix-get #安装zabbix-get工具 #zabbix_get -s 192.168.10.234 -k web.site.discovery #ip为客户端地址,运行会返回一些josn数据即正常
5.在web界面配置,大致步骤如下
1.在配置>主机>找到安装了脚本的客户机。创建自动发现(其余默认) 名称:web.site.discovery 类型:Zabbix客户端 键值:web.site.discovery 1.1过滤器添加宏{#SITENAME},表达式为空 2.监控原型处添加(其余默认) 名称:http_code ON {#SITENAME} 类型:Zabbix客户端 键值:web.site.code[{#SITENAME}] 3.触发器类型问题表达式(通过选择原型添加自动生成表达式) {Linux CentOS7 3.10.0-693.2.2.el7.x86_64 _1 SMP Tue Sep 12 22_26_13 UTC 2017 x86_64_3:web.site.code[{#SITENAME}].last(#3,5)}<>200 4.触发器类型恢复表达式(通过选择原型添加自动生成表达式) {Linux CentOS7 3.10.0-693.2.2.el7.x86_64 _1 SMP Tue Sep 12 22_26_13 UTC 2017 x86_64_3:web.site.code[{#SITENAME}].last(#1,60)}=200
参考链接:
https://www.cnblogs.com/cdw0724/p/10912470.html
http://www.52yunwei.net/704.html
https://blog.51cto.com/215687833/1886671
标签:log file 大致 col $0 功能 parameter 添加 name
原文地址:https://www.cnblogs.com/cpw6/p/11937021.html