[TOC] 说明 基于上一篇 "文章" 的基础,这里做一些关于 CPU、内存、磁盘的一些基础查询语句。 CPU 通过查询 metric值为 来获取当前CPU 的所有信息 直接通过此参数参数,会查到的数据是当前CPU的所有相关的收集到的数据。 此时就需要使用 函数,用于计算距离向量中的实际序列的每秒顺 ...
分类:
其他好文 时间:
2019-11-26 17:55:39
阅读次数:
223
前言 本文来自Prometheus官网手册1、Prometheus官网手册2 和 Prometheus简介 说明 Prometheus从根本上存储的所有数据都是时间序列: 具有时间戳的数据流只属于单个度量指标和该度量指标下的多个标签维度。除了存储时间序列数据外,Prometheus还可以生成临时派生 ...
分类:
其他好文 时间:
2019-11-26 17:47:53
阅读次数:
193
安装Prometheus Server Prometheus基于Golang编写,编译后的软件包,不依赖于任何的第三方依赖。用户只需要下载对应平台的二进制包,解压并且添加基本的配置即可正常启动Prometheus Server。 从二进制包安装 对于非Docker用户,可以从https://prom ...
分类:
其他好文 时间:
2019-11-25 16:53:42
阅读次数:
71
Prometheus+Altermanager钉钉报警 一、添加钉钉机器人 参考钉钉官方文档:https://ding-doc.dingtalk.com/doc#/serverapi2/qf2nxq 二、在k8s上部署钉钉告警deployment,这里我们引用第三方的插件。 [root@cn-hon ...
分类:
其他好文 时间:
2019-11-23 13:07:40
阅读次数:
317
花了两天部署了一套监控服务 prometheus+node-exporter+grafana,公司的gitlab服务器准备部署node-exporter的时候突然发现gitlab已经有了这些服务, 也懒得去研究gitlab为啥要这些服务,既然gitlab服务器已经包含了node-exporter服务 ...
分类:
其他好文 时间:
2019-11-22 19:17:56
阅读次数:
148
写在前面 之前部署web网站的时候,架构图中有一环节是监控部分,并且搭建一套有效的监控平台对于运维来说非常之重要,只有这样才能更有效率的保证我们的服务器和服务的稳定运行,常见的开源监控软件有好几种,如zabbix、Nagios、open flcon还有prometheus,每一种有着各自的优劣势,感 ...
分类:
其他好文 时间:
2019-11-22 13:44:16
阅读次数:
931
如上图,prometheus的data文件夹时间久了会变得很大,听说是保留15天的数据。但是实际上,我只需要保留3天的数据就够了,之前试过用批处理文件清理,但是强行删除会导致peometheus崩溃,运维新手不知道怎么在哪里配置修改。请广大网友支招。 ...
Prometheus+grafana部署使用 主机列表: 192.168.161.130 : Prometheus 192.168.161.128 : node 1 192.168.161.129 : node 2 二进制手动部署 解压 prometheus 2.14.0.linux amd64.t ...
分类:
其他好文 时间:
2019-11-16 12:28:23
阅读次数:
70
prometheus 告警 prometheus 通过alertmanager进行告警 实现监控告警的步骤: 在prometheus中定义告警规则 alertmanager配置告警告警动作,分组,抑制,静默等功能 alertmanager安装route定义的规则向终端:邮箱,企业微信等发生告警信息 ...
分类:
其他好文 时间:
2019-11-16 12:27:38
阅读次数:
140
Prometheus2.14.0新特性Prometheus2.14.0现在(2019.11.11)已经发布,在上个月的2.13.0之后又进行了一些修正和改进。这次最大的新功能是基于React的新UI,与现有UI大体相同。该UI还在持续开发中。现有的UI还获得了headcardinality统计信息。这次的更新新增了按状态进行的警报过滤。修复了压缩后的远程写延迟,在无法发送样本时避免重新分片等多个B
分类:
其他好文 时间:
2019-11-15 09:27:55
阅读次数:
80