最近公司领导要求,要对客户那边写一个自动化的脚本,用来监控客户那边CPU使用率和硬盘空间,并通过邮件来报警。刚好参考老男孩李导最近的案例,测试了下,可以正常使用。CPU监控:top-n1查看1次就退出1Cpu(s):0.3%us,0.3%sy,0.0%ni,99.3%id,0.0%wa,0.0%hi,0.0%si,0.0%st99.3%i..
分类:
系统相关 时间:
2017-04-18 11:47:00
阅读次数:
410
小米开发的,小米、金山云、美团、京东金融等公司在用。 简析运维监控系统:http://blog.csdn.net/puma_dong/article/details/51895063 Open-Falcon编写的整个脑洞历程:https://mp.weixin.qq.com/s?__biz=MjM5 ...
分类:
其他好文 时间:
2017-04-10 18:33:59
阅读次数:
199
注意:本文不涉及性能测试、性能优化中的监控,所有文字的出发点都是日常运维监控。 在开始之前,我们还是先统一下认识:要监控一个对象,需要掌握哪些东西呢? 监控对象的理解:要监控的对象你是否了解呢?比如CPU到底是如何工作的? 监控对象的指标:我们要监控这个东西的什么属性?比如CPU的CPU使用率、负载 ...
分类:
其他好文 时间:
2017-04-02 13:50:23
阅读次数:
314
From:http://www.cnblogs.com/qiulang/p/6557782.html ...
分类:
移动开发 时间:
2017-03-20 13:03:32
阅读次数:
493
在我们日常的工作中,有时候需要监控和管理平台的运行状况,而服务运行是否存在异常,是否有软硬件bug等,均需要第一时间知道。对服务状态了如指掌,是一个很重要的事情。那么这个如何做到呢,我们之前在进行私有云平台研发过程中,曾经用过一些工具,在一定程度上能帮到大家,这里记录一下,希望对有需要的同学有帮助。 ...
分类:
移动开发 时间:
2017-03-16 18:34:11
阅读次数:
376
初中级Linux运维人员们系统学习并迅速掌握Linux的运维实战技能。学习路线大纲如下: 入门基础篇 系统运维篇 Web运维篇 数据库运维篇 集群实战篇 运维监控篇 第一篇:Linux入门(安装、配置、shell命令)基础篇 一、 学习Linux的经验与技巧 1.1 Linux在各领域发展的现状和趋 ...
分类:
系统相关 时间:
2017-02-28 15:32:29
阅读次数:
246
最近,线上一个应用,发现socket数缓慢增长,并且不回收,超过警告线之后,被运维监控自动重启了。 首先到zabbix上观察JVM历史记录,发现JVM-Perm space最近两周没有数据,猜测是程序从JDK7切换到JDK8了。问过开发人员之后,程序已经很久没有重启了,最近才重新发布的。而在这期间, ...
分类:
Web程序 时间:
2017-02-19 12:07:43
阅读次数:
607
研发人员应该以下方面去梳理技术体系。包括工具的使用、技术的更新。 需求分析 分析需求,用合理合适的架构、技术模型去解决需求问题。 开发 架构的搭建,工具的使用,coding管理。 测试 系统测试、安全测试、压力测试。 部署 多机房、负载。 运维 监控、报警、trace跟踪。 ...
分类:
其他好文 时间:
2017-02-04 12:33:31
阅读次数:
286
在《使用Akka构建集群(一)》一文中通过简单集群监听器的例子演示了如何使用Akka搭建一个简单的集群,但是这个例子“也许”离我们的实际业务场景太远,你基本不太可能去做这样的工作,除非你负责运维、监控...
分类:
其他好文 时间:
2017-01-16 11:14:18
阅读次数:
220
#!/usr/bin/ksh export ORACLE_BASE=/oracle/ export ORACLE_SID=epmln1 export ORACLE_HOSTNAME=pmlnpdb1 export ORA_NLS33=/oracle/db/ocommon/nls/admin/data... ...
分类:
其他好文 时间:
2016-12-14 18:29:55
阅读次数:
283