现场:跑着数据库的主机A报警应用连接不上数据库,我们无法ssh到主机。第一反应是通过telnet到远程控制口,发现数据库资源和硬件资源在被切换到HA架构的主机B(备机,通常性能比主机A的差,抗不住应用)。此时HA已经把数据库切到了备机上,勉强抗着应用。分析:一、查看故障机(主机A)的操作系统日志和o...
分类:
其他好文 时间:
2014-11-17 17:13:44
阅读次数:
179
公司线上的MySQL慢日志,之前一直没有做好监控。趁着上周空闲,我就把监控脚本写了下,今天特地把代码发出来与51博友分享一下。针对脚本的注解和整体构思,我会放到脚本之后为大家详解。#!/bin/bash
#
#本脚本用来在指定频率内监控MySQL慢日志的变化,并在发生增长时及时报警
#..
分类:
数据库 时间:
2014-11-17 12:31:44
阅读次数:
331
Cacti 在英文中的意思是仙人掌的意思,Cacti是一套基于PHP,MySQL,SNMP及RRDTool开发的网络流量监测图形分析工具,使用PHP开发,它是由一些PHP页面组成软件,主要针对企业的大量网络设备、服务器主机***能监测服务,可提供对CPU负载、内存占用、运行进程数、磁盘空间、网卡流量等各种数据信息的监测,cacti注重的是状态监控,报警和服务恢复功能比较差。
官方...
分类:
系统相关 时间:
2014-11-16 21:41:35
阅读次数:
418
项目加了些拦截器代码后,CPU报警,显示CPU使用率超过100%;想要查找到底是哪些代码消耗的资源过多,从网上找到一篇博文,转载如下:http://blog.csdn.net/guixunlong/article/details/8450897在知道哪个Java进程CPU占用率过高以后:1.使用命令...
分类:
编程语言 时间:
2014-11-16 19:59:14
阅读次数:
309
Shell脚本:向磁盘中批量写入数据一、关于本文工作要做的监控系统需要监控磁盘空间的使用率并报警。在测试这个功能的时候需要模拟两个场景:一是磁盘空间不断增长超过设定的阈值时,需要触发报警机制;二是磁盘空间降落到低于报警阈值的时候,不再进行报警。为了测试这两个场景,我写了下面三个脚本:1)initia...
分类:
系统相关 时间:
2014-11-16 18:42:55
阅读次数:
283
Nagios简介Nagios是一款开源的电脑系统和网络监视工具,能有效监控Windows、Linux和Unix的主机状态,交换机路由器等网络设置,打印机等。在系统或服务状态异常时发出邮件或短信报警第一时间通知网站运维人员,在状态恢复后发出正常的邮件或短信通知。Nagios原名为NetSaint,由E..
分类:
移动开发 时间:
2014-11-15 06:44:11
阅读次数:
315
前几天研究nagios,搭建了一个监控网络设备的服务器,不算什么高端技术,但是对于我这样的linux菜鸟来说也是值得高兴一阵子的事,nagios说也挺麻烦在这里写一下搭建过程也算复习一下。
分类:
移动开发 时间:
2014-11-14 01:51:21
阅读次数:
160
一、关于本文 工作要做的监控系统需要监控磁盘空间的使用率并报警。在测试这个功能的时候需要模拟两个场景:一是磁盘空间不断增长超过设定的阈值时,需要触发报警机制;二是磁盘空间降落到低于报警阈值的时候,不...
分类:
系统相关 时间:
2014-11-13 16:54:35
阅读次数:
300
邮件报警插件 1 #!/usr/bin/python 2 #coding:utf-8 3 4 import smtplib 5 from email.MIMEText import MIMEText 6 import os 7 import argparse 8 import logging 9 ....
分类:
其他好文 时间:
2014-11-13 10:34:01
阅读次数:
411
本文首发于烂泥行天下。今天在ESXI上的一台windows系统的虚拟机(以下简称VM),突然nagios报警提示说:该机器发生故障。既然问题出来了,就要解决。先在本机ping下那台VM,发现不能ping通。使用vsphere登录到ESXI,发现该VM还处于运行状态,但是无法远程进去,一直显示的是黑..
分类:
其他好文 时间:
2014-11-12 12:04:07
阅读次数:
222