码迷,mamicode.com
首页 > 其他好文 > 详细

Connection refused间歇性出现的问题定位

时间:2020-01-20 22:45:15      阅读:230      评论:0      收藏:0      [点我收藏+]

标签:服务商   没有   命令   tomcat   火墙   导致   防火   stat   监听   

出现Connection refused的问题原因一般有三种:

1. 服务器的端口没有打开       这种直接就是一直会Connection refused,不会间歇出现,可以直接排除;

2. 服务器的防火墙没有开白名单    很多跟外部对接的时候,是需要将公司出口ip加到对方防火墙白名单,这种也会直接Connection refused,不会间歇出现,可以直接排除;

3. 服务器上的backlog设置的太小,导致连接队列满了,服务器可能会报Connection refused,或者Connecttion reset by peer,这个看服务器上的连接队列满时的设置;

详细的异常堆栈信息如下:

技术图片

 

 看保持方法:

技术图片

 

 是个native方法,毫不意外。因为是跟第三方云服务商对接,只能让他们查服务器配置的backlog大小,这里回顾一下tcp三次握手的过程。

第一步:client 发送syn到server发起握手;

第二步:  server收到syn后回复syn + ack 给client;

第三步:client收到syn + ack后,回复server一个ack表示收到server的syn + ack;

Tcp连接是有张如下图的:

技术图片

 

 1. 服务端调用bind()  & listen() 函数后,会监听本地某个端口;

 2. 客户端发SYN,服务端收到,连接状态变为SYN_RCVD,将连接放到半连接队列中,同时回复syn+ack给client;

 3. 客户端收到syn + ack,客户端连接状态变为ESTABLISHED,回复ack,将连接放到全连接队列。

其中半连接队列的大小看: max(64, /proc/sys/net/ipv4/tcp_max_syn_backlog

技术图片

 

上面是我机器上半连接的配置,挺大的,26万。

全连接队列的大小: min(backlog, somaxconn), backlog是在socket创建的时候传入的,somaxconn是一个os级别的系统参数。

代码涉及到Socket这一层的操作时,需要自己传backlog的大小,否则默认值是50.

public ServerSocket(int port, int backlog) throws IOException {
        this(port, backlog, null);
}

所有上面Connection Refused很容易因为backlog设置的太小而发生,例如,nginx的配置就有backlog, 默认是511,Tomcat 默认是100。

一般来说,如果是公司自己的服务器,可以通过TCP建连接的时候全连接队列(accept队列)满了,通过一些命令可以查询队列情况:

 
netstat -s 命令

通过netstat -s | egrep "listen" 看队列的溢出统计数据,多执行几次,看全连接队列overflow次数有没有增长:

技术图片

 

ss 命令

技术图片

 

 上面看Send-Q的值就是listen端口上全连接队列的最大值,Recv-Q就是当前全连接队列用了多少。

netstat跟ss命令一样也能看到Send-Q、Recv-Q这些状态信息,不过如果这个连接不是Listen状态的话,Recv-Q就是指收到的数据还在缓存中,还没被进程读取,这个值就是还没被进程读取的 bytes;而 Send 则是发送队列中没有被远程主机确认的 bytes 数。

技术图片

因此如果出现间歇性Connection Refused,检查是否有设置backlog, backlog设置的是否过小。

Connection refused间歇性出现的问题定位

标签:服务商   没有   命令   tomcat   火墙   导致   防火   stat   监听   

原文地址:https://www.cnblogs.com/zhengwangzw/p/12219478.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!