美文网首页收藏
【tcp/ip】关于 java tcp/ip异常问题原因分析

【tcp/ip】关于 java tcp/ip异常问题原因分析

作者: Bogon | 来源:发表于2022-04-30 00:26 被阅读0次

1. java.net.SocketTimeoutException

这 个异 常比较常见,socket 超时。
一般有 2 个地方会抛出这个,一个是 connect 的 时 候 , 这 个 超 时 参 数 由connect(SocketAddress endpoint,int timeout) 中的后者来决定,还有就是 setSoTimeout(int timeout),这个是设定读取的超时时间。
它们设置成 0 均表示无限大。

2. java.net.BindException:Address already in use: JVM_Bind

该 异 常 发 生 在 服 务 器 端 进 行 new ServerSocket(port) 或者 socket.bind(SocketAddress bindpoint)操作时。
原因是与 port 一样的一个端口已经被启动,并进行监听。
此时用 netstat –an 命令,可以看到一个 Listending 状态的端口。
只需要找一个没有被占用的端口就能解决这个问题。

3. java.net.ConnectException: Connection refused: connect

该异常发生在客户端进行 new Socket(ip, port)或者 socket.connect(address,timeout)操作时,原 因一般是指定 ip 地址的机器不能找到(也就是说从当前机器不存在到指定 ip 路由),或者是该 ip 存在,但找不到指定的端口进行监听。

应该首先检查客户端的 ip 和 port是否写错了,假如正确则从客户端 ping 一下服务器看是否能 ping 通,假如能 ping 通(服务服务器端把 ping 禁掉则需要另外的办法),则看在服务器端的监听指定端口的程序是否启动。

4. java.net.SocketException: Socket is closed

该异常在客户端和服务器均可能发生。
异常的原因是一方主动关闭了连接后(调用了 Socket 的 close 方法),另一方再对网络连接进行读写操作。

5. java.net.SocketException: Connection reset 或者Connect reset by peer:Socket write error

connection reset by peer在调用write或者read的时候都会出现。
按照glibc的说法,是such as by the remote machine rebooting or an unrecoverable protocol violation。
从字面意义上来看,是表示远端机器重启或者发生不可恢复的错误。

从我的测试来看,目前只出现在对端直接kill掉进程的情况。这两种情况有什么不同呢?
对比tcpdump的截包图来看,直接kill掉远端进程的话,远端并没有发送FIN序号,来告诉对方,我已经关闭管道,而是直接发送了RST序号,而远端如果调用close或者shutdown的话,是会发送FIN序号的。
按照TCP的四次挥手来看,是需要FIN这个序号的。

个人猜测,如果在本端没有收到对方的FIN序号而直接收到了RST序号的话,表明对端出现了machine rebooting or an unrecoverable protocol violation,这时候对这个管道的IO操作,就会出现connection reset by peer错误。

该异常在客户端和服务器端均有可能发生,引起该异常的原因有两个:

第一个就是假如一端的 Socket 被关闭(或主动关闭或者因为异常退出而引起的关闭), 另一端仍发送数据,发送的第一个数据包引发该异常(Connect reset by peer)。

另一个是一端退出,但退出时并未关闭该连接,另 一 端 假 如 在 从 连 接 中 读 数 据 则 抛 出 该 异 常(Connection reset)。

简单的说就是在连接断开后的读和写操作引起的。

还有一种情况,如果一端发送RST数据包中断了TCP连接,另外一端也会出现这个异常。

如果是tomcat,异常如下:

org.apache.catalina.connector.ClientAbortException: java.io.IOException: Connection reset by peer

阿里的tcp方式的健康检查为了提高性能,省去挥手交互,直接发送一个RST来终断连接,就会导致服务器端出现这个异常。

对于服务器,一般的原因可以认为:

a) 服务器的并发连接数超过了其承载量,服务器会将其中一些连接主动 drop掉

b) 在数据传输的过程中,浏览器或者接收客户端关闭了,而服务端还在向客户端发送数据

6. java.net.SocketException: Broken pipe

image.png

该异常在客户端和服务器均有可能发生。
在抛出SocketExcepton:Connect reset by peer:Socket write error 后,假如再继续写数据则抛出该异常。
前两个异常的解决方法是首先确保程序退出前关闭所有的网络连接,其次是要检测对方的关闭连接操作,发现对方关闭连接后自己也要关闭该连接。
broken pipe只出现在调用write的时候。
broken pipe的意思是对端的管道已经断开,往往发生在远端把这个读/写管道关闭了,你无法在对这个管道进行读写操作。

从tcp的四次挥手来讲,远端已经发送了FIN序号,告诉你我这个管道已经关闭。
这时候,如果你继续往管道里写数据,第一次,你会收到一个远端发送的RST信号,如果你继续往管道里write数据,操作系统就会给你发送SIGPIPE的信号,并且将errno置为Broken pipe(32)。如果你的程序默认没有对SIGPIPE进行处理,那么程序会中断退出。

一般情况下,可以用signal(SIGPIPE,SIG_IGN)忽略这个信号,这样的话程序不会退出,但是write会返回-1并且将errno置为Broken pipe(32)。

broken pipe只会出现在往对端已经关闭的管道里写数据的情况下,在收到对端的RST序号后第一次写不会出现broke pipe,而是write返回-1,这时候正确的做法应该是本端也close这个管道,如果继续write,那么就会出现这个错误。

java.net.SocketException: Broken pipe (Write failed)
        at java.net.SocketOutputStream.socketWrite0(Native Method)
        at java.net.SocketOutputStream.socketWrite(SocketOutputStream.java:111)
        at java.net.SocketOutputStream.write(SocketOutputStream.java:155)
        at sun.security.ssl.OutputRecord.writeBuffer(OutputRecord.java:431)
        at sun.security.ssl.OutputRecord.write(OutputRecord.java:417)
        at sun.security.ssl.SSLSocketImpl.writeRecordInternal(SSLSocketImpl.java:886)
        at sun.security.ssl.SSLSocketImpl.writeRecord(SSLSocketImpl.java:857)
        at sun.security.ssl.AppOutputStream.write(AppOutputStream.java:123)
        at org.apache.http.impl.io.SessionOutputBufferImpl.streamWrite(SessionOutputBufferImpl.java:124)
        at org.apache.http.impl.io.SessionOutputBufferImpl.write(SessionOutputBufferImpl.java:160)
        at org.apache.http.impl.io.ContentLengthOutputStream.write(ContentLengthOutputStream.java:113)
        at org.apache.http.impl.io.ContentLengthOutputStream.write(ContentLengthOutputStream.java:120)
        at org.apache.http.entity.StringEntity.writeTo(StringEntity.java:167)
        at org.apache.http.impl.DefaultBHttpClientConnection.sendRequestEntity(DefaultBHttpClientConnection.java:156)
        at org.apache.http.impl.conn.CPoolProxy.sendRequestEntity(CPoolProxy.java:160)
        at org.apache.http.protocol.HttpRequestExecutor.doSendRequest(HttpRequestExecutor.java:238)
        at org.apache.http.protocol.HttpRequestExecutor.execute(HttpRequestExecutor.java:123)
        at org.apache.http.impl.execchain.MainClientExec.execute(MainClientExec.java:272)
        at org.apache.http.impl.execchain.ProtocolExec.execute(ProtocolExec.java:185)
        at org.apache.http.impl.execchain.RetryExec.execute(RetryExec.java:89)
        at org.apache.http.impl.execchain.RedirectExec.execute(RedirectExec.java:110)
        at org.apache.http.impl.client.InternalHttpClient.doExecute(InternalHttpClient.java:185)
        at org.apache.http.impl.client.CloseableHttpClient.execute(CloseableHttpClient.java:83)
        at org.apache.http.impl.client.CloseableHttpClient.execute(CloseableHttpClient.java:108)

对于 4 和 5 这两种情况的异常,需要特别注意连接的维护。
在短连接情况下还好,如果是长连接情况,对于连接状态的维护不当,则非常容易出现异常。

基本上对长连接需要做的就是:

a) 检测对方的主动断连。(对方调用了 Socket 的 close 方法)。
因为对方主动断连,另一方如果在进行读操作,则此时的返回值是-1,所以一旦检测到对方断连,则主动关闭己方的连接(调用 Socket 的 close 方法)。

b) 检测对方的宕机、异常退出及网络不通,一般做法都是心跳检测。
双方周期性的发送数据给对方,同时也从对方接收“心跳数据”,如果连续几个周期都没有收到 对方心跳,则可以判断对方或者宕机或者异常退出或者网络不通,此时也需要主动关闭己方连接;
如果是客户端可在延迟一定时间后重新发起连接,虽然 Socket 有一个keep alive 选项来维护连接,如果用该选项,一般需要两个小时才能发现对方的宕机、异常退出及网络不通。当然这块可以根据需要调优参数配置。

7. java.net.SocketException: Too many open files

操作系统的中打开文件的最大句柄数受限所致,常常发生在很多个并发用户访问服务器的时候。
因为为了执行每个用户的应用服务器都要加载很多文件(new 一个socket 就需要一个文件句柄),这就会导致打开文件的句柄的缺乏。

解决方式:

a) 尽量把类打成 jar 包,因为一个 jar 包只消耗一个文件句柄,如果不打包,一个类就消耗一个文件句柄。

b) java 的 GC 不能关闭网络连接打开的文件句柄,如果没有执行 close()则文件句柄将一直存在,而不能被关闭。

你也可以考虑设置 socket 的最大打开 数来控制这个问题,对操作系统做相关的设置,增加最大文件句柄数量。

ulimit -a 可以查看系统目前资源限制,ulimit -n 10240 则可以修改,这个修改只对当前窗口有效。

8 Cannot assign requested address

  1. 端口号被占用,导致地址无法绑定:
    java.net.BindException: Cannot assign requested address: bind:是由于IP地址变化导致的
  1. 服务器网络配置异常:
    /etc/hosts 中配置的地址错误;

3.还有一种情况是执行ipconfig 发现没有环路地址,这是因为环路地址配置文件丢失了

参考

没有打印日志时,排查生产问题,怎么办?
https://blog.csdn.net/zqz_zqz/article/details/115899544

java.io.IOException 断开的管道 解决方法
https://blog.csdn.net/zqz_zqz/article/details/52235479

Broken pipe错误终极解释
https://www.cnblogs.com/metoy/p/6565486.html

相关文章

网友评论

    本文标题:【tcp/ip】关于 java tcp/ip异常问题原因分析

    本文链接:https://www.haomeiwen.com/subject/wkveyrtx.html