原文链接:https://www.liaoxuefeng.com/wiki/1016959663602400/1183565811281984 用Python来编写脚本简化日常的运维工作是Python的一个重要用途。在Linux下,有许多系统命令可以让我们时刻监控系统运行的状态,如ps,top,fr ...
分类:
编程语言 时间:
2019-09-13 10:42:15
阅读次数:
123
器化zabbix。容器部署zabbix更简单准备两台机器:192.168.22.200zabbix-server192.168.22.8zabbix-agent软件版本:docker:18.06.1-cezabbix:4.0.1安装docker可以使用阿里镜像源的repo安装:https://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.r
分类:
其他好文 时间:
2019-09-06 11:08:03
阅读次数:
282
在上面的章节中,只是简单介绍了Centreon的几个基础监控项,例如添加主机、服务等,这些对于一个监控系统来说是远远不够的,本节将重点介绍对一些扩展服务的监控,也就是对一些常见应用的监控。 一、 Nagios/centreon插件编写规范 作为运维人员,相信大家对脚本并不陌生,而Nagios插件就是 ...
分类:
数据库 时间:
2019-08-31 23:43:53
阅读次数:
162
一、 Centreon概述 Centreon是一款功能强大的分布式IT监控系统,它通过第三方组件可以实现对网络、操作系统和应用程序的监控:首先,它是开源的,我们可以免费使用它;其次,它的底层采用nagios作为监控软件,同时nagios通过ndoutil模块将监控到的数据定时写入数据库中,而Cent ...
分类:
其他好文 时间:
2019-08-31 23:42:47
阅读次数:
167
一、什么是Ganglia 对于这个工具,大家可能比较陌生,但是它功能非常强大,如果我们想收集所有服务器、网络设备的数据,那么ganglia绝对是首选,在深入学习之前,还是先从基础概念了解起吧! Ganglia是一款为HPC(高性能计算)集群而设计的可扩展的分布式监控系统,它可以监视和显示集群中的节点 ...
分类:
其他好文 时间:
2019-08-31 23:33:21
阅读次数:
117
一、Prometheus简介 Prometheus是一套开源的系统监控报警框架。它受启发于Google的Brogmon监控系统,由工作在SoundCloud的前google员工在2012年创建,作为社区开源项目进行开发,并于 2015年正式发布。 2016年,Prometheus正式加入Cloud ...
分类:
其他好文 时间:
2019-08-31 23:17:45
阅读次数:
146
一、安装 docker pull influxdb docker pull grafana/grafana docker run -d -p 8086:8086 -p 8083:8083 --name=jmeterdb influxdb #启动influxdb 报漏8086 8083接口 分别对应时 ...
分类:
数据库 时间:
2019-08-30 23:13:16
阅读次数:
205
19 08 01 大数据实战:测试工具领域应对海量数据的解决方案_孔祥云 质量工具面临的数据挑战 稳定性监控系统的数据挑战 实时应对方案,智能接口平台的数据挑战 整体方案之机器学习 19 08 02 Node专场——阿里Node.js运维和开发最佳实践_陈仲寅 现状,数据增长分析 指标埋点,集群运维 ...
分类:
其他好文 时间:
2019-08-30 23:13:02
阅读次数:
159
haproxy 2.0 已经发布一段时间了,提供内部直接暴露的prometheus metrics 很方便 ,可以快速的监控系统的状态 以下是一个简单的demo 环境准备 docker-compose 文件 version: "3" services: grafana: image: grafana ...
分类:
其他好文 时间:
2019-08-30 15:53:24
阅读次数:
347