前言 睿象云前段时间发表了一篇《 Zabbix 实现电话、邮件、微信告警通知的实践分享》的技术文章。它帮助我们非常轻松地支持了各种告警通知方式,但是存在一个严重的问题,我们经常接到各种相类似或者相关联告警,短信太多,难免会出现漏看情况,告警通知几乎变成垃圾短信,也就形成了一种告警风暴。为此 Clou ...
分类:
其他好文 时间:
2020-03-11 15:40:47
阅读次数:
67
为何要压缩告警?运维监控工具/平台,一般是通过配置固定阈值,达到阈值后自动触发/生成告警。如网络中断、闪断;系统升级更新;设备多监控内容多等情况下,更会产生海量告警。以下为告警管理常见问题:故障期间,告警风暴,手机/邮箱会被海量告警淹没;运维人员很难从海量告警从筛选出重要告警,容易忽略重要告警;固定阈值控制,频繁误报、漏报告警;如何实现告警压缩与降噪?睿象云智能告警平台CloudAlert(后文为
分类:
其他好文 时间:
2020-03-05 19:23:43
阅读次数:
497
一、Zabbix运行架构Zabbix是一个企业级的分布式开源监控解决方案。它能够监控各种服务器的健康型、网络的稳定性以及各种应用系统的可靠性。当监控出现异常时,Zabbix通过灵活i的告警策咯,可以为任何事件配置基于邮件、短信、微信等告警机制。而这所有的一切,都可以通过Zabbix提供的Web界面进行配置和操作,基于Web的前端页面还提供了出色的报告和数据可视化功能。这些功能和特性使运维人员可以非
分类:
其他好文 时间:
2020-01-25 14:11:01
阅读次数:
122
在编写web应用中,我们常常会遇到这样的需求,比如,我们需要上报每个API的运行时间到运维监控系统。这时候你可以像下述代码一样将统计的逻辑写到每个路由函数中。 然而,这显然有悖 原则,我们需要将这些非业务逻辑剥离出来以实现解耦。这时候,中间件就能派上用场了,为了简单起见,我们这里将采用标准库 来实现 ...
分类:
Web程序 时间:
2019-12-21 20:27:02
阅读次数:
119
运维技术的改变和进步很大,现在和未来的企业级运维早已经不在仅仅局限于服务的稳定运行,反观高可用、高并发、高性能却都已经成了基本的要求,作为一名运维工程师或者iT工程师要有全域运维的概念,那么数据的可视化,尤其是运维数据的可视化就显得的格外有帮助,图形图表化的工具Zabbix与Grafana与工具课程值得参考学习!===============课程目录===============├─(1)LNMP
分类:
其他好文 时间:
2019-12-14 19:36:01
阅读次数:
101
一、 推荐文章 1、以下来自OSChina的 mingxungu https://itzones.cn/ RocketMQ运维监控 RocketMQ刷盘策略 RocketMQ消息重试 RocketMQ内存映射 RocketMQ权限控制 RocketMQ主从同步 RocketMQ事务消息 Rocket ...
分类:
其他好文 时间:
2019-12-07 10:25:25
阅读次数:
118
一、智能运维监控报警平台的组成 随着大数据时代的来临,运维工作的难度越来越大,每个运维人员都要面临不计其数的服务器和海量的数据,如何保证众多服务器和业务系统稳定高效地运行并尽量减少死机时间,成为考核运维工作的重要指标,而要实现大规模的运维,必须要有一套行之有效的智能运维监控管理系统,本章就详细介绍下 ...
分类:
其他好文 时间:
2019-08-31 23:50:41
阅读次数:
263
众所周知Zabbix是一款用来监控IT基础设施的监控套件,同时也具有很多方便运维人员使用的优秀功能,如:支持多条件告警,支持多种告警方式,支持多组模板、支持模板继承,因此在众多的开源运维监控软件中独占鳌头,受到了众多企业青睐。暇瑜不掩,Zabbix在告警方式还是有一定局限性,如Email发送告警配置繁琐,需要调用邮件引擎脚本通过SMTP发送邮件;如用微信接收告警,需要申请一个微信公众号,接入复杂周
分类:
微信 时间:
2019-08-20 01:17:15
阅读次数:
146