《TCP协议到TCP通讯各种异常现象和分析》的学习

正如文章所说,正常情况大家都不会去关注其协议细节,但在网络不稳定或嵌入式设备上没有完毕的TCP/IP协议像LINUX那样提供安全可靠保证,相关的网络问题就会变得很复杂。

  • 客户端试图与一个不存在的端口建立连接(主机正常)

    客户端的SYNC包到达服务端时,返回一个RST的错误报文。TCP的服务端实际上就是从网卡的寄存器中读取数据,然后进行解析(端口的套接字)。

  • 建立链接后服务器的主机发送了宕机:

    此时客户端并不知道,根据场景又分为刚宕机和宕机一段时间。

    刚宕机:客户端会每隔一段时间重发SYN包。

         宕机好一段时间:

  • 建立链接后服务器的主机僵死(内核,应用程序线程:

     服务端通过accept接口返回一个新的套接字,说明3次握手完成了可以建立连接,否则accept会被阻塞。accept本质:它会通过软中断陷入内核中,最终会调用tcp协议的inet_csk_accept函数,该函数会从队列中查找是否有处于ESTABLISHED状态的套接字。如果有则返回该套接字,否则阻塞当前进程。也就是说这里只是一个查询的过程,并不参与三次握手的任何逻辑。

  • 客户端在TCP Server的进程/线程crash时访问

    此时客户端会收到RST报文。

  • TCP Server的进程/线程被KILL时:

    此时服务器端会发出FIN报文,其实kill进程是通过shell想内核发送了SIGKILL或者SIGTERM,内核接收到该信号之后会进行相应的扫尾工作.

  • TCP Server的进程/线程所在主机关机:

  init进程会给所有进程发送SIGTERM信号,等待一段时间(5~20秒),然后再给所有仍在运行的进程发送SIGKILL信号。当服务器进程死掉时,会关闭所有文件描述符。带来的影响和上面杀死server相同

TCP Server的进程/线程所在主机宕机:

  包括2种情况,一种是内核panic,另外一种情况是出现了掉电。

  panic:突然性,没有时间杀死进程和关闭所有打开的文件描述符,此时客户端发送请求因为得不到ACK会重复发送企图得到ACK(大约持续几分钟),直到得到一个ETIMDOUT错误。对同步通讯这会导致阻塞而不能接受。虽然通过设置SO_SNDTIMEO,服务器端要做去重处理。

  • 客户端在TCP Server的关闭->重启间发送分节内容:

  因为TCP Server丢失了之前的连接信息,即此时收到了一个不存在的链接上,所以会响应RST分节。

posted on 2021-04-09 15:02  杰瑞鼠  阅读(381)  评论(0编辑  收藏  举报