WGCLOUD基于java语言开发,是高性能高并发的分布式监控平台,核心模块包括:服务器集群监控,ES集群监控,CPU监控,内存监控,数据监控(mysql,oracle,pg等),服务心跳检测,应用进程管理,磁盘IO监控,系统负载监控,监控告警信息推送。englishreadme使用中若cache过大导致内存报警不准确,可以将内存使用率告警值改大,如memWarnVal:150,该阈值可以大于10
分类:
其他好文 时间:
2020-05-22 16:56:02
阅读次数:
79
Prometheus Prometheus 是由 SoundCloud 开源监控告警解决方案,从 2012 年开始编写代码,再到 2015 年 GitHub 上开源以来,已经吸引了 9k+ 关注,以及很多大公司的使用;2016 年 Prometheus 成为继 Kubernetes 之后,成为 CN ...
分类:
其他好文 时间:
2020-05-14 11:20:28
阅读次数:
69
本文结合配置内存不足10%触发报警的需求,zabbix给我们提供的模板,里面都已经配置好了item和trigger。但是给我们的模板是当内存小于20M的时候才会触发报警,这样不能满足我们的需求,我们需要在内存不足10%的时候触发,这时候需要我们自定义一个item和trigger。 1、在Templa ...
分类:
其他好文 时间:
2020-04-29 15:12:52
阅读次数:
90
最近小张的爬虫程序越来越多,可当爬虫程序报错,不能及时的发现,从而造成某些重要信息不能及时获取的问题,更有甚者,遭到领导的批评。于是就在想有没有一种方法,当爬取信息报错的时候,可以通过邮件或者短信的方式及时通知小张呢,于是我进行相关搜索,还真让我找到了^_^。 为了避免大家踩坑,以下为自己亲测,其中 ...
分类:
系统相关 时间:
2020-04-22 16:31:04
阅读次数:
159
Prometheus(普罗米修斯) 新型完整的监控告警工具 主要特点: 1. 多维数据模型,时间序列数据由度量名称和键/值对标识 2. 一种灵活的查询语言来利用这种维度 3. 不依赖分布式存储;单个服务器节点是自治的 4. 时间序列收集通过HTTP上的拉模型进行 5. 通过中间网关支持时间序列的推送 ...
分类:
其他好文 时间:
2020-04-10 00:22:22
阅读次数:
361
简介 Prometheus是一个开源的监控、告警整体解决方案,最初由SoundCloud构建。从2012年开始,大量的公司开始适配Prometheus,拥有大量的开发者和非常活跃的用户社区。目前已作为独立的项目在运营,并与2016年加入CNCF,是继Kubernetes之后第二个被CNCF托管的项目 ...
分类:
其他好文 时间:
2020-03-20 17:21:22
阅读次数:
78
容量管理与分析以及对虚拟基础设施资源的成本进行统计分析是性能监控工具提供的其他功能。
分类:
其他好文 时间:
2020-02-24 22:20:39
阅读次数:
79
一、安装elastalert 环境 CentOS:7.4 Python:3.6.9 pip:19.3 "elastalert" :0.2.1 elk:7.3.2 2、配置Python3.6.9环境 安装依赖包 下载包 安装 配置 注意,所有依赖python2的脚本,都需要更改为python2.7,因 ...
分类:
其他好文 时间:
2020-01-11 18:10:01
阅读次数:
2483
https://www.jianshu.com/p/6b8a08d6f941 1、Zabbix介绍 Zabbix功能 Zabbix应用 2、zabbix安装教程 安装包安装Zabbix docker方式安装Zabbix 3、使用教程 添加监控 告警设置 1、Zabbix介绍 Zabbix简介 Zab ...
分类:
其他好文 时间:
2020-01-05 19:02:52
阅读次数:
97
[TOC]关于SkyWalking的基础使用参考:基于SkyWalking实现服务链路追踪官方文档:SkyWalking文档中文版(社区提供)ApacheSkyWalking官方文档SkyWalking告警功能SkyWalking告警功能是在6.x版本新增的,其核心由一组规则驱动,这些规则定义在config/alarm-settings.yml文件中。告警规则的定义分为两部分:告警规则:它们定义了
分类:
其他好文 时间:
2020-01-03 19:29:07
阅读次数:
1119