码迷,mamicode.com
首页 > 其他好文 > 详细

Zabbix“专家坐诊”第82期问答汇总

时间:2020-10-30 11:48:32      阅读:19      评论:0      收藏:0      [点我收藏+]

标签:存在   cse   proc   ica   users   ng2   RoCE   通过   snmp   

Q:我所有的监控项都是通过自动发现获取的item和值,这个数据获取的时间是怎么控制的,现在感觉都是无序的,我想控制在每个整点的10分左右更新数据。
技术图片

A:zabbix获取数据是轮询的。有时候数据会出现采集超时的情况,时间上并不是很好控制。建议是从zabbix自身、数据库等方面进行优化,减小采集item的耗时,这样数据获取的时间基本都不会有大的差距。
Q:那应该要怎么优化的能提供下思路吗,不知道改怎么优化
A:zabbix自身的优化,可以从自身的进程方面,比如poller过于繁忙,那么适当加大进程;数据库则是做表分区、存储过程;在硬件这块可以上ssd等。 在网上有很多zabbix优化的资料,你可以查下看看。
Q:好的,这个LLD获取数据的时间,是根据主机启动的时间开始获取的吗?
A:从启用监控的那个时间开始去获取数据。

Q:请问下,如果部署时候软件版本是5.0;新版本5.0.5;也升级到5.0.5、但是已有的Template还是5.0的,针对5.0 - 5.0.5中间这些版本新增修复的Template如何进行升级呢?有办法进行Template的更新吗?
A:部署一台5.0.5的,然后对比下template,有差别对比后再决定是否要导入更新上。 如果目前监控是满足需求的,也可以不做模板的升级。

Q:最近监控trap告警,有几个疑惑请帮忙:
在trap中,示 SNMPv2-SMI::enterprises.2file:///C:\Users\admin\AppData\Roaming\Tencent\QQTempSys\%W@GJ$ACOF(TYDYECOKVDYB.png011.2.235.1.1.500.10.13.114,而不是HUAWEI-SERVER-IBMC-MIB::hwRAIDRebuildDeassert, 把HUAWEI-SERVER-iBMC-MIB.mib文件放到mibdir目录了,如下图:
技术图片

A:你最后要达到的目的是什么呢?
Q:看网上别人配置后显示是这样的,比数字好理解:
技术图片
看着数字不明白是什么意思,还需要对照文档才能理解每个参数

A:能发下你这边的配置步骤/参考网址看下不?br/>Q:参考网址:file:///C:\Users\admin\AppData\Roaming\Tencent\QQTempSys\%W@GJ$ACOF(TYDYECOKVDYB.pnghttps://www.cnblogs.com/lwops/p/10148392.html
我在/etc/snmp/snmp.conf中添加总提示语法不对,然后参考其他文章在/etc/profile中引入了:
export MIBS=ALL
Q:请教一个问题,zabbix保存到数据库的数据有哪些呢?我想取一些主机的性能数据,cpu 内存这些
A: zabbix保存历史数据的表是history、history_log、history_str、history_text、history_uint,一般像cpu内存这些浮点/整数的数据,可以看下history跟history_uint
Q:我用api获取类似没分钟的cpu负载,取平均值作为每小时的cpu平均负载,这个做法可行么?
A:可以的
Q:OK

Q:请问下,自动发现做了过滤器,怎么还会有这些提示。br/>![](https://s4.51cto.com/images/blog/202010/29/0979d85b697e2409f4ce98fbec20da7e.jpg?x-oss-process=image/watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_90,type_ZmFuZ3poZW5naGVpdGk=)
A:上图看下预处理是怎么做的?
Q:不匹配0的才做自动发现。discovery[{#ENTPHYSICALNAME},file:///C:\Users\admin\AppData\Roaming\Tencent\QQTempSys\%W@GJ$ACOF(TYDYECOKVDYB.png1.3.6.1.file:///C:\Users\admin\AppData\Roaming\Tencent\QQTempSys\%W@GJ$ACOF(TYDYECOKVDYB.png2.1.47.1.file:///C:\Users\admin\AppData\Roaming\Tencent\QQTempSys\%W@GJ$ACOF(TYDYECOKVDYB.png1.1.1.7,{#HWENTITYOPTICALTYPE},file:///C:\Users\admin\AppData\Roaming\Tencent\QQTempSys\%W@GJ$ACOF(TYDYECOKVDYB.png1.3.6.1.4.1.2file:///C:\Users\admin\AppData\Roaming\Tencent\QQTempSys\%W@GJ$ACOF(TYDYECOKVDYB.png011.5.25.31.file:///C:\Users\admin\AppData\Roaming\Tencent\QQTempSys\%W@GJ$ACOF(TYDYECOKVDYB.png1.1.3.1.10]
技术图片

Q:还有一个问题,一条trap告警信息有重复发送的情况,也就是隔一段时间又发送一次,为避免这总情况,我创建了一个fallback,给每种trap错误创建了一个触发器, {Huawei_PCServer_2288Hv5:snmptrap.fallback.str(SNMPv2-SMI::enterprises.2file:///C:\Users\admin\AppData\Roaming\Tencent\QQTempSys\%W@GJ$ACOF(TYDYECOKVDYB.png011.2.235.1.1.500.10.13.113)}=1 跟 {Huawei_PCServer_2288Hv5:snmptrap.fallback.str(SNMPv2-SMI::enterprises.2file:///C:\Users\admin\AppData\Roaming\Tencent\QQTempSys\%W@GJ$ACOF(TYDYECOKVDYB.png011.2.235.1.1.500.10.13.1)}=1同时存在的情况下,后一个被触发,前一个永远无法触发。
我想问一下,trap告警这样处理合适吗? 表达式如何写才能避免这种情况A:2file:///C:\Users\admin\AppData\Roaming\Tencent\QQTempSys\%W@GJ$ACOF(TYDYECOKVDYB.png011.2.235.1.1.500.10.13.113是 RAID rebuild detected,2file:///C:\Users\admin\AppData\Roaming\Tencent\QQTempSys\%W@GJ$ACOF(TYDYECOKVDYB.png011.2.235.1.1.500.10.13.1是Storage device presence detected。
我刚模拟了下,你这边做依赖是可以实现的。个人是觉得根据不同trap OID 分多个成监控项会比较方便。
Q:谢谢,我试试依赖,分多个监控项也有同样的问题,就是1 和113会先匹配1

Q:大神也帮我看看呀,为什么显示问题呢?
技术图片
A:你这里监控项返回的值不等于0,就触发了告警了

Zabbix“专家坐诊”第82期问答汇总

标签:存在   cse   proc   ica   users   ng2   RoCE   通过   snmp   

原文地址:https://blog.51cto.com/14483703/2544865

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!