节点NotReady Traints: node.kubernetes.io/unreachable:NoExecute node.kubernetes.io/unreachable:NoSchedule 解决办法: 查看 kube-controller-manager, kube-schedule ...
分类:
系统相关 时间:
2021-06-13 10:17:02
阅读次数:
0
可参考原作者:https://blog.csdn.net/a5671667/article/details/101078681?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522161841235716780269888983%2522% ...
分类:
其他好文 时间:
2021-04-15 12:39:26
阅读次数:
0
如果我们所在公司的业务量比较大,在生产环境经常会出现JVM内存溢出的现象,那我们该如何快速响应,快速定位,快速恢复问题呢?本文将通过一个线上环境JVM内存溢出的案例向大家介绍一下处理思路与分析方法。案例:架构组接到某项目组反馈,Zabbix监控上显示JMX不可用,请求协助处理。分析思路:JMX不可用,往往是由于垃圾回收时间停顿时间过长、内存溢出等问题引起的。线上故障分析的原则是首先要采取措施快速恢
分类:
其他好文 时间:
2020-12-08 12:46:27
阅读次数:
4
1、背景公司一个RocketMQ集群由4主4从组成,突然其中3台服务器“竟然”在同一时间下线,其监控显示如下:依次查看三台机器的监控图形,时间戳几乎完美“吻合”,不可思议吧。2、故障分析出现问题,先二话不说,马上重启各服务器,尽快恢复集群,降低对业务的影响,接下来开始对日志进行分析。Java进程自动退出(rocketmq本身就是一个java进程),一种最常见的问题是由于内存溢出或由于内存泄漏导致进
分类:
系统相关 时间:
2020-12-07 12:49:05
阅读次数:
15
Slack的512宕机故障分析:负载均衡策略的失误本文描述了2020年5月12日导致Slack宕机的技术细节,要想了解更多关于此故障背后的过程,请参阅RyanKatkov的文章AllHandsonDeck(1)。2020年5月12日,Slack发生了很长时间以来的一次重大故障。我们在事件发生后不久就发表了一份故障说明(2),但这是一个有意思的问题,我想更详细地介绍一下围绕它的一些技术问题。用户可见
分类:
其他好文 时间:
2020-11-13 12:37:20
阅读次数:
4
本文带您重点理解GC原理,以及gc引起的磁盘不回收故障分析总结
分类:
数据库 时间:
2020-08-11 17:30:45
阅读次数:
93
GPS对时设备(北斗授时服务器)为您开启精准时刻 GPS对时设备(北斗授时服务器)为您开启精准时刻 京准电子科技官微——ahjzsz 在现代电网中,统一的时间系统对于电力系统的故障分析、监视控制及运行管理具有重要意义。变电站的对时是指站内的保护、测量、监控设备为了统一时间的需要,采用相应的对时方法, ...
分类:
其他好文 时间:
2020-07-10 19:02:22
阅读次数:
246
1 典型的错误信息如下: 消息 * 错误 0xc02020a1: 数据流任务: 数据转换失败。列“列 2”的数据转换返回状态值 4 和状态文本“文本被截断,或者一个或多个字符在目标代码页中没有匹配项。”。 (SQL Server 导入和导出向导) * 错误 0xc020902a: 数据流任务: “输 ...
分类:
数据库 时间:
2020-07-03 17:36:01
阅读次数:
73
客户说数据库的CPU使用率为100%,应用相应迟缓。发现是latch: cache buffers chains 作祟故障分析思路 查看等待事件,判断故障起因 1 SQL>select * from (select sid,event,p1,p2,p3,p1text,WAIT_TIME,SECOND ...
分类:
系统相关 时间:
2020-06-15 18:04:23
阅读次数:
73
客户说数据库的CPU使用率为100%,应用相应迟缓。发现是latch: cache buffers chains 作祟故障分析思路 查看等待事件,判断故障起因 1 SQL>select * from (select sid,event,p1,p2,p3,p1text,WAIT_TIME,SECOND ...
分类:
系统相关 时间:
2020-06-15 17:36:04
阅读次数:
67