标签:ogr ado 中断 技术分享 消息 http 检测 boot date
java实时程序在运行过程中偶尔出现异常信息中断的情况,通过shell脚本即可完成自启动。
以下为监控一个实时的java程序的shell脚本。
通过每10秒检查一次java程序的进程,来判断程序是否处于运行中。如果未发现程序,则执行程序的启动脚本。
对于启动过程中的状态信息,会通过钉钉机器人实时发送到监控群中,让维护人员了解到程序的异常。
在脚本中通过maxRetry来设置最大尝试的次数。
#!/bin/sh # 最大尝试次数 maxRetry=3 # 尝试次数计数器 retryTimes=0 # 消费者参数 consumer_bootstrap_server=192.168.0.1:9092 consumerGroup=bigdata consumerTopic=test1 consumerAutoOffsetReset=earliest # 生产者参数 producer_bootstrap_server=10.10.10.10:9092 producerTopic=test2 # log logfile=programe.log # 发送钉钉的消息参数 # 注意: ${nowtime}对应的日期参数不能有空格 # 注意: ${programe}为执行的jar程序的主程序名 url=‘https://oapi.dingtalk.com/robot/send?access_token=xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx‘ programe=xxxxxprograme server=192.168.0.1 content=‘‘ # 发送钉钉的调用函数 function sendDingtalk(){ java -Djava.ext.dirs=/home/hadoop/shell/robot/lib com.DingtalkRobot ${1} ${2} ${3} ${4} ${5} } #sendDingtalk ${url} ${programe} ${server} ${nowtime} ${content} ( while true; do count=`ps -ef | grep ${programe} | grep -v grep|wc -l` #echo ‘进程个数:‘$count >> ${logfile} nowtime=`date --date=‘0 days ago‘ "+%Y-%m-%d_%H:%M:%S"` if [ ${count} -lt 1 ]; then retryTimes=$[$retryTimes+1] content=‘检测到程序【‘${programe}‘】未启动,正在尝试启动......第‘"${retryTimes}"‘次‘ echo ${nowtime} ${content} >> ${logfile} sendDingtalk ${url} ${programe} ${server} ${nowtime} ${content} if [ $retryTimes -ge $maxRetry ]; then content=‘检测到程序【‘${programe}‘】异常,尝试启动‘"${maxRetry}"‘次失败,程序退出,请手工解决‘ echo ${content} >> ${logfile} sendDingtalk ${url} ${programe} ${server} ${nowtime} ${content} break fi nohup java -Djava.ext.dirs=lib com.xxx.Programe ${consumer_bootstrap_server} ${consumerGroup} ${consumerTopic} ${consumerAutoOffsetReset} ${producer_bootstrap_server} ${producerTopic} 2>&1 & else if [ $retryTimes -gt 0 ]; then content=‘程序【‘${programe}‘】启动成功......第‘"${retryTimes}"‘次‘ echo ${content} >> ${logfile} sendDingtalk ${url} ${programe} ${server} ${nowtime} ${content} else echo ${nowtime} ‘程序【‘${programe}‘】......正在运行中‘ >> ${logfile} fi let retryTimes=0 fi sleep 10 done ) & >> shell.log
脚本启动后:
可以查看到钉钉群中实时监控信息:
程序启动成功后,提示以下信息:
shell+钉钉机器人完成java程序中断后自启动和实时监控
标签:ogr ado 中断 技术分享 消息 http 检测 boot date
原文地址:https://www.cnblogs.com/30go/p/9078309.html