码迷,mamicode.com
首页 >  
搜索关键字:监控报警    ( 171个结果
python3.8 微信发送服务器监控报警代码
python版本 代码 urllib是python3.8内置的 效果 ...
分类:微信   时间:2019-11-05 13:19:13    阅读次数:178
线上问题复盘
1.事件回顾: 2019.10.29日上线反欺诈优化功能,10月30日上午收到异常监控报警,随后业务反馈属地案调和总部案调无法正常提交。经核实,是因为属地案调和总部案调提交时,由于没有验证案调是否为总部、是否为补充调查。导致调用了发往属地代码,引发系统异常。BUG于10月30日中午一点半处理完毕。 ...
分类:其他好文   时间:2019-10-30 22:39:12    阅读次数:140
Rancher2.x 一键式部署 Prometheus + Grafana 监控 Kubernetes 集群
[toc] 1、Prometheus & Grafana 介绍 Prometheus 是一套开源的系统监控、报警、时间序列数据库的组合,Prometheus 基本原理是通过 Http 协议周期性抓取被监控组件的状态,而通过 Exporter Http 接口输出这些被监控的组件信息,而且已经有很多 E ...
分类:Web程序   时间:2019-10-28 17:31:42    阅读次数:391
大型网站如何保证稳定性
直接说内容: 监控报警策略实战 冗余设计理念实战 限流原理与实现 降级的策略与实现 回滚策略规范与实践 重试技术策略理解 峰值应对: 面对峰值到来时候, 应该准备的工作。 分为了事前,事中, 事后 三个阶段来进行介绍。 其中比较重点的 全链路压测 步骤包含哪些东西。 线上问题实战:异常问题排查的实战 ...
分类:Web程序   时间:2019-10-15 19:23:38    阅读次数:93
稳定性保障思路
https://blog.csdn.net/ligeforrent/article/details/82464540 稳定性保障思路1. 线上系统稳定性 容灾切换 流控方案2. 系统依赖 超时设置与监控报警 降级方案 熔断处理 强弱依赖梳理,保证核心流程3. 系统运维 蓝绿部署 回滚规范 自动化运维 ...
分类:其他好文   时间:2019-10-15 13:21:10    阅读次数:130
Ganglia与Centreon整合构建智能化监控报警平台
一、智能运维监控报警平台的组成 随着大数据时代的来临,运维工作的难度越来越大,每个运维人员都要面临不计其数的服务器和海量的数据,如何保证众多服务器和业务系统稳定高效地运行并尽量减少死机时间,成为考核运维工作的重要指标,而要实现大规模的运维,必须要有一套行之有效的智能运维监控管理系统,本章就详细介绍下 ...
分类:其他好文   时间:2019-08-31 23:50:41    阅读次数:263
Prometheus简介
一、Prometheus简介 Prometheus是一套开源的系统监控报警框架。它受启发于Google的Brogmon监控系统,由工作在SoundCloud的前google员工在2012年创建,作为社区开源项目进行开发,并于 2015年正式发布。 2016年,Prometheus正式加入Cloud ...
分类:其他好文   时间:2019-08-31 23:17:45    阅读次数:146
在k8s集群中安装prometheus
在早期的版本中Kubernetes提供了heapster、influxDB、grafana的组合来监控系统,现在更加流行的监控工具是prometheus,prometheus是Google内部监控报警系统的开源版本Prometheus相比于其他传统监控工具主要有以下几个特点:具有由metric名称和键/值对标识的时间序列数据的多维数据模型有一个灵活的查询语言不依赖分布式存储,只和本地磁盘有关通过H
分类:其他好文   时间:2019-08-25 00:59:12    阅读次数:133
大数据平台CentOS7+CDH5.12.1集群搭建
1.CM(Cloudera Manager)介绍 1.1 简介 Cloudera Manager是一个拥有集群自动化安装、中心化管理、集群监控、报警功能的一个工具,使得安装集群从几天的时间缩短在几个小时内,运维人员从数十人降低到几人以内,极大的提高集群管理的效率。 对比Apache / CDH / ...
分类:其他好文   时间:2019-08-16 22:35:14    阅读次数:257
内存泄漏排查之:Show me your Memory
java 语言有个神奇的地方,那就是你时不时会去关注下内存。(当然了,任何牛逼的同学都应该关注内存) 今天我们就来这么场景吧:某应用运行了一段时间后,ecs监控报警了,内存比较高了,怎么办?随着时间的推移,发现内存越来越高(但是又不会打到100%),怎么办? 凡事讲究证据,报警说内存紧张就紧张吗,还 ...
分类:其他好文   时间:2019-08-11 15:33:04    阅读次数:156
171条   上一页 1 ... 3 4 5 6 7 ... 18 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!