标签:现象 eth odi alias tin wrapper red 大量 err
关键词: 丢包 网卡 bond0 telnet tcpdump ifconfig 连接失败
一、故障表现:
2018年1月11日下午18点,适配平台 192.168.120.1/2报警 日志提示 redis连接上不。
在120.1 上执行 telnet 192.168.120.2 6379 发现执行5次,有1次连接上不。现象看上去像网络不稳定。
二、处理过程:
A. telnet 其它端口,看是否redis问题。 ------ 可排除是否应用问题。
120.1 上telnet 120.2 的22端口,发现失败率近20%。排除redis的问题。
B. 抓包分析tcp的握手建立过程,确认问题所有
使用tcpdump 抓两边的包,看tcp握手情况
120.1
|
120.2
|
|
---|---|---|
tcpdump -s 0 -i bond0 dst port 9999 | tcpdump -s 0 -i bond0 port 9999 | 双边都抓包 |
telnet 192.168.120.1 9999 | nc -l 9999 | 在120.2上监听端口9999然后再120.1上发起telnet |
结果如下:
结论:120.2回包正确,120.1收不到120.2返回的sync的ack确认包,所以120.1不停的重试。
基于以上分析,有两种可能:
继续使用排除法:由于外部问题不好定位,好么先确定主机问题。
使用ifconfig查看网络情况:
从图可见,bond0网卡 RX(接收) dropped掉大量包,正常情况应该是0。至此基本可确认是 bond0将收到的握手包drop掉了。
标签:现象 eth odi alias tin wrapper red 大量 err
原文地址:https://www.cnblogs.com/hnhycnlc888/p/9708557.html