码迷,mamicode.com
首页 > 其他好文 > 详细

告警系统邮件引擎, 运行告警系统

时间:2018-07-19 10:54:55      阅读:173      评论:0      收藏:0      [点我收藏+]

标签:cat   print   mon   cron   之间   就是   核心   空格   恢复   

告警系统邮件引擎
  • 因为之前做zabbix的时候,做过mail.py的脚本,在这里,直接复制到
    mail目录下就行
  • 但是告警邮件引擎核心,conf主配置文件调用到的都是mail.sh ,所以这里需要定义调用mail.py的sh脚本
  • mail.sh目的是做告警收敛,如果不想做告警收敛,在发现问题的时候直接告警就好,但是,可能会发生1分钟前发现问题,1分钟户问题解决,这样就会变成误报,这样会很麻烦
  • 收敛的目的就是1分钟前发现问题,然后到10分钟后,服务还没有恢复,就会告诉管理人员10分钟了服务还未恢复
    #!/bin/bahs
    log=$1   
    t_s=`date +%s`
    t_s2=`date -d "2 hours ago" +%s`  #定义2个小时前的时间戳
    #日志不存在就创建日志
    if [ ! -f /tmp/$log ]
    then
    echo $t_s2 > /tmp/$log
    fi
    #下面这段,等同于一个计时器
    t_s2=`tail -1 /tmp/$log|awk ‘{print $1}‘`
    echo $t_s>>/tmp/$log
    v=$[$t_s-$t_s2]   //时间戳对比
    echo $v
    #当结果大于3600秒,就会进行告警
    if [ $v -gt 3600 ]
    then
    ./mail.py  $1  $2  $3
    echo "0" > /tmp/$log.txt  //等同于计数器
    else
    #不然就重新计数
    if [ ! -f /tmp/$log.txt ]
    then
        echo "0" > /tmp/$log.txt
    fi
    nu=`cat /tmp/$log.txt`
    nu2=$[$nu+1]
    echo $nu2>/tmp/$log.txt
    if [ $nu2 -gt 10 ]
    then
         ./mail.py  $1 "trouble continue 10 min $2" "$3"
         echo "0" > /tmp/$log.txt   //邮件告警结束以后,重新开始计数
    fi
    fi 

    运行告警系统

  • 可以每分钟执行一次主脚本来运行告警系统
    crontab -e
    * * * * * cd /usr/local/sbin/mon/bin ; bahs main.sh
  • 调试,监控发送邮件的部分,有三个参数(发给谁,邮件名称,内容),参数之间尽量少用空格,因为mail.py发送邮件是以空格来定义三个参数的

告警系统邮件引擎, 运行告警系统

标签:cat   print   mon   cron   之间   就是   核心   空格   恢复   

原文地址:http://blog.51cto.com/akui2521/2147039

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!