您已经完成了光纤安装,现在正在使用光纤损耗测试仪(OLTS)对电缆设备进行认证——这是进行1级认证并准确测量损耗以确保应用支持的理想工具。遗憾的是,您发现一些关键光纤链路的损耗远超该应用的损失预算。现在您需要对这些链路进行故障诊断和排除,以便解决问题,找到问题的速度越快,解决问题的速度就越快。OLTS无法准确确定链路每个连接点的损耗情况,您根本没有时间检查每条故障链路的连接器是否被污染,或利用可视
分类:
其他好文 时间:
2020-02-25 19:42:35
阅读次数:
61
【服务器故障情况概述】今天介绍的是服务器raid5阵列因为不明原因导致阵列崩溃后的故障排查方法,以及服务器数据恢复过程。下面简单介绍一下需要恢复数据的服务器硬件配置情况:本次数据恢复案例中的服务器型号为某品牌X3850型号,服务器上组建了一个raid5磁盘阵列,阵列里包含4块成员盘和1块热备盘一共5块。服务器再正常使用过成功突然崩溃,管理员查看raid阵列状态时发现阵列中有2块硬盘掉线,热备盘没有
分类:
其他好文 时间:
2020-02-21 16:33:38
阅读次数:
92
前言创建kubernetes集群并部署容器化应用只是第一步,一旦集群运行起来,我们需要确保运行正常,所有必要组件就位并各司其职,有足够的资源满足应用的要求。kubernetes是一个复杂的系统,运维团队需要有一套工具帮助他们获知集群的实时状态,并为故障排查提供及时和准确的数据支持。kubernetes常用的监控方案:一,Weavescope简介WeaveScope是Docker和kubernete
分类:
其他好文 时间:
2020-02-12 09:12:42
阅读次数:
189
web界面(Dashboard)之前在kubernetes中完成的所有操作都是通过命令行工具kubectl完成的,为了提供更丰富的用户体验,kubernetes还开发了一个基于web的用户界面(Dashboard)。用户可以使用Dashboard部署容器化的应用,还可以监控应用的状态,执行故障排查以及管理kubernetes中各种资源。在kubernetesDashboard中可以查看集群中应用的
分类:
Web程序 时间:
2020-02-08 09:59:45
阅读次数:
294
查看pod状态如下图所示,当前状态为CreateContainerError。 通过kube describe命令去查看Pod的状态发现没有提示任何错误。但是当通过命令kube logs查看pod的日志时,可以看到提示日志“Failed to update lock: Operation canno ...
分类:
Web程序 时间:
2020-02-07 10:18:27
阅读次数:
280
线上系统突然变得卡顿或无法访问,排除网络异常的情况下,检查服务器资源占用情况,如果CPU、内存、磁盘IO等资源占用过高,就会导致无法继续处理HTTP请求。 如果是CPU占用飙高,有可能是程序中存在死循环、死锁导致的,也有可能是内存紧张从而频繁GC导致的,要具体问题具体分析。 排查过程 这里记录一次线 ...
分类:
其他好文 时间:
2020-02-06 11:07:57
阅读次数:
75
对于后端程序员,特别是 Java 程序员来讲,排查线上问题是不可避免的。各种 CPU 飚高,内存溢出,频繁 GC 等等,这些都是令人头疼的问题。那么,遇到这些问题该如何解决呢? 首先,出现问题,肯定要先定位问题所在,然后分析问题原因,再然后解决问题,最后进行总结,防止下次再次出现。线上问题千奇百怪, ...
分类:
其他好文 时间:
2020-01-28 15:37:24
阅读次数:
68
事故经过排查总结事故经过【2019-12-2718:00周五】业务方突然找来说调用我们程序大量提示“触发限流”,但是我们没有收到任何监控报警。紧急查看了下ServiceMeshsidecar代理监控发现流量持续在减少,但是监控中没有任何触发限流的httpcode429占比,如果有触发限流我们会收到报警。后来通过排查是程序中有一个历史限流逻辑触发了,但是程序中触发限流返回的httpcode是200,
分类:
其他好文 时间:
2020-01-27 00:04:50
阅读次数:
63
1.回顾: 某在线主机深夜连续接到告警系统的disk Used 超限告警。 登陆主机查看却遇到了困惑:在检查磁盘使用量 df –h 出来的磁盘使用量确实和告警信息一样,已经被100%占用,但是查看目录大小 du 时,却显示实际目录大小并非这样,而是有很大空闲空间。 如图:磁盘用量 df –h 结果为 ...
分类:
系统相关 时间:
2020-01-26 17:19:33
阅读次数:
84
业务方突然找来说调用我们程序大量提示“触发限流”,但是我们没有收到任何监控报警。紧急查看了下 _`ServiceMesh sidecar`_ 代理监控发现流量持续在减少,但是监控中没有任何触发限流的 _http code 429_ 占比,如果有触发限流我们会收到报警。
后来通过排查是程序中有一个历... ...
分类:
其他好文 时间:
2020-01-26 14:28:11
阅读次数:
63