这次主要给大家介绍一下从几十台到几千台服务器的运维过程中,监控系统的变迁经历。常说一千个人心中有一千个哈姆雷特,一千个运维的心中有一千种运维的方法,没有一个方法是万能的、可以适用所有的场景,具体问题还得具体分析一、服务器数量小于200台的阶段这个时期一般需要满足基础监控需求,我们主要考虑的是简单易用、稳定运行、监控报警三个方面。云帮手资源监控系统全程可视化界面,一键傻瓜式操作,新手小白也能快速上手
分类:
其他好文 时间:
2020-01-17 09:24:48
阅读次数:
328
彩食鲜开源基础框架csx-bsf-all, BSF集成了自研的监控报警,用来监控各个服务系统的性能及异常告警。集成并封装Apollo,Rocket MQ,Redis, Elastic Search,ELK,XXLJOB, Sharding JDBC,Cat,Eureka,七牛云等第三方中间件,提供简... ...
分类:
其他好文 时间:
2020-01-03 14:08:52
阅读次数:
96
一、prometheus简介Prometheus是一套开源的系统监控报警框架。它以给定的时间间隔从已配置的目标收集指标,评估规则表达式,显示结果,并在发现某些情况为真时触发警报。作为新一代的监控框架,Prometheus具有以下特点:强大的多维度数据模型:(1)时间序列数据通过metric名和键值对来区分;(2)所有的metrics都可以设置任意的多维标签;(3)数据模型更随意,,不需要刻意设置为
分类:
其他好文 时间:
2019-12-24 19:02:07
阅读次数:
138
由于docker容器的特殊性,传统的zabbix无法对k8s集群内的docker状态进行监控,所以需要使用prometheus来进行监控: 什么是Prometheus? Prometheus是由SoundCloud开发的开源监控报警系统和时序列数据库(TSDB)。Prometheus使用Go语言开发 ...
分类:
Web程序 时间:
2019-12-17 20:54:54
阅读次数:
348
什么是Prometheus? Prometheus是由SoundCloud开发的开源监控报警系统和时序列数据库(TSDB)。Prometheus使用Go语言开发,是Google BorgMon监控系统的开源版本。2016年由Google发起Linux基金会旗下的原生云基金会(Cloud Native ...
分类:
其他好文 时间:
2019-12-09 12:18:13
阅读次数:
111
ELK+监控报警全步骤 需求: 公司要求对出在windows服务器上的日志进行日志分析并根据关键字进行报警,并配置kibana权限控制。下面为详细步骤 环境: centos 7.6 elk版本7.50 (因为7.50版本自带xpack功能,可以满足kibana角色权限控制) 1. windows字符 ...
分类:
其他好文 时间:
2019-12-06 13:42:50
阅读次数:
292
场景描述: 收到zabbix监控报警,晋中生产机器出现磁盘空间不足报警。 远程到该服务器,排查占员工磁盘空间的原因,发现tomcat日志过多,于是清除3天前的日志。 日志清理后,发现磁盘空间没有释放,如下是处理过程和原因分析: 日志清理后,查看磁盘空间: [root@jzreport2 ~]# df ...
分类:
系统相关 时间:
2019-11-14 16:39:21
阅读次数:
92
logrus 通过实现 接口扩展 hook 机制,可以根据需求将日志分发到任意的存储介质, 比如 es, mq 或者监控报警系统,及时获取异常日志。可以说极大的提高了日志系统的可扩展性。 hook 内部实现 接口定义如下: 那 的内部是怎么实现触发的呢, 中有个内部结构 用来存储所有定义的 hook ...
分类:
其他好文 时间:
2019-11-10 15:19:38
阅读次数:
156
邮件常常是Linux下监控报警手段之一。Linux下的mail命令可以方便,快速的完成发送邮件。下面以CentOS为例 1、安装 # yum install mailx 2、配置 vi /etc/mail.rc 在文件尾加上如下配置 (注:因为163的设置相对简单些,以163邮箱为例,QQ邮箱等,其 ...
分类:
系统相关 时间:
2019-11-10 10:13:04
阅读次数:
115