前言 对于后端程序员,特别是 Java 程序员来讲,排查线上问题是不可避免的。各种 CPU 飚高,内存溢出,频繁 GC 等等,这些都是令人头疼的问题。楼主同样也遇到过这些问题,那么,遇到这些问题该如何解决呢? 首先,出现问题,肯定要先定位问题所在,然后分析问题原因,再然后解决问题,最后进行总结,防止 ...
分类:
其他好文 时间:
2019-11-04 11:30:31
阅读次数:
74
问题: Linux安装了docker,docker启动了一个nginx容器,通过 80 端口无法正常访问 故障排查: 1、检查 nginx 容器启动的命令或者yaml文件,查看是否有跟本机端口进行绑定 启动nginx容器的时候,需要将本地的80端口(其他端口同理)跟nginx容器80端口(也可以是其 ...
分类:
系统相关 时间:
2019-11-02 18:22:02
阅读次数:
1255
网络的功能:1,信息传递2,资源共享3,增加可靠4,增加系统处理能力网络不同发展阶段的关键技术60年代分组交换70~80年代TCP/IP90年代web技术WAN广域网LAN局域网网络设备的品牌思科华为企业级网络设备路由器router交换机switch组建网络的拓扑结构1,点对点链接广域网2,星形容易实现易于扩展,易于故障排查3,网状高可靠OSI7层模型理论框架TCP/IP5层模型实际应用应用层PC
分类:
Web程序 时间:
2019-10-31 00:57:25
阅读次数:
108
JVM 线上故障排查基本操作 CPU 飚高 线上 CPU 飚高问题大家应该都遇到过,那么如何定位问题呢? 思路:首先找到 CPU 飚高的那个 Java 进程,因为你的服务器会有多个 JVM 进程。然后找到那个进程中的 “问题线程”,最后根据线程堆栈信息找到问题代码。最后对代码进行排查。 如何操作呢? ...
分类:
其他好文 时间:
2019-10-25 18:18:19
阅读次数:
57
内存问题排查 说完了 CPU 的问题排查,再说说内存的排查,通常,内存的问题就是 GC 的问题,因为 Java 的内存由 GC 管理。有2种情况,一种是内存溢出了,一种是内存没有溢出,但 GC 不健康。 内存溢出的情况可以通过加上 -XX:+HeapDumpOnOutOfMemoryError 参数 ...
分类:
其他好文 时间:
2019-10-25 18:11:12
阅读次数:
68
记录一次阿里云服务器故障排查思路公司网络是nat环境问题:同一个服务有两台服务器172.19.19.252172.19.19.187两台服务器要连node5发现172.19.19.252这台服务器连不通思路:1.两台服务器是同一个安全组环境相同所以排除安全组防火墙的问题2.pingnode5发现可以ping通telnet不通tcpdump抓包尝试抓包,主机能收到,但是没有给出响应经过查找资料找到解
分类:
其他好文 时间:
2019-10-20 00:56:50
阅读次数:
109
用WeaveScope监控集群创建Kubernetes集群并部署容器化应用只是第一步。一旦集群运行起来,我们需要确保一起正常,所有必要组件就位并各司其职,有足够的资源满足应用的需求。Kubernetes是一个复杂系统,运维团队需要有一套工具帮助他们获知集群的实时状态,并为故障排查提供及时和准确的数据支持。Kubernetes常用的监控方案WeaveScopeWeaveScope是Docker和Ku
分类:
其他好文 时间:
2019-10-18 09:39:40
阅读次数:
148
前面章节Kubernetes所有的操作我们都是通过命令行工具kubectl完成的。为了提供更丰富的用户体验,Kubernetes还开发了一个基于Web的Dashboard,用户可以用KubernetesDashboard部署容器化的应用、监控应用的状态、执行故障排查任务以及管理Kubernetes各种资源。在KubernetesDashboard中可以查看集群中应用的运行状态,也能够创建和修改各种
分类:
其他好文 时间:
2019-10-18 09:18:48
阅读次数:
120
最近遇到一个kafka方面的问题,大致就是由于consumer处理业务超时,导致无法正常提交Offset,进而导致无法消费新消息的问题。下面我想从以下几个方面对此次故障排查进行复盘分析:业务背景、问题描述、排查思路、经验教训。
分类:
其他好文 时间:
2019-10-09 19:22:43
阅读次数:
1356
记录一次阿里云服务器故障排查思路 公司网络是nat 环境 问题: 思路: ...
分类:
其他好文 时间:
2019-10-09 14:03:50
阅读次数:
99