TCP 和 UDP
本文总结运输层的 2 个重要协议, TCP (Transmission Control Protocol) 和 UDP (User Datagram Protocol) 的知识点。
参考文章。
对比
TCP | UDP |
---|---|
可靠传输 | 不可靠传输,尽最大可能交付 |
有连接,面向字节流(把应用层传下来的报文看成字节流,把字节流组织成大小不等的数据块) | 无连接,面向报文(对于应用程序传下来的报文不合并也不拆分,只是添加 UDP 首部) |
有流量控制、拥塞控制 | 无 |
一对一 | 支持一对一、一对多、多对一和多对多 |
可靠传输,意味着 TCP 传输的数据报文无差错、不丢失、不重复到达目的地。为了实现可靠交付,TCP 中实现了以下重要的机制:
- 滑动窗口
- 超时重传
- 流量控制
- 拥塞控制
UDP
UDP 首部 8 个字节:源端口、目的端口、长度、校验和。12 字节的伪首部是为了计算检验和临时添加的,不参与任何传输过程。
可以看出,长度占 2 个字节,因此 UDP 报文最长可以是 65535 字节。
特点
- 无连接:发送数据前不需要建立连接。
- 面向报文:发送方的 UDP 对应用程序交下来的报文,在添加首部后直接交付下一层的 IP 层(不像 TCP 那样,进行拆分后分组发送),如下图所示。
针对「面向报文」这一特点,应用程序应当选择合适大小的报文进行发送,如果太长, IP 层在传输时可能会进行分片,这会影响 IP 层的效率。如果太短,IP 首部的相对长度太长,也会影响效率。
TCP
首部格式
TCP 首部大小可变,但有 20 字节是固定的,如下图所示。
解释:
- 序号:用于对字节流进行编号,例如序号为 301,表示第一个字节的编号为 301,如果携带的数据长度为 100 字节,那么下一个报文段的序号应为 401。
- 确认号:期望收到的下一个报文段的序号。例如 B 正确收到 A 发送来的一个报文段,序号为 501,携带的数据长度为 200 字节(该报文的字节序号为 501 - 700),因此 B 期望下一个报文段的序号为 701,B 发送给 A 的确认报文段中确认号就为 701。
- 数据偏移:指的是数据部分距离报文段起始处的偏移量,实际上指的是首部的长度。
- 确认 ACK:当 ACK=1 时确认号字段有效,否则无效。TCP 规定,在连接建立后所有传送的报文段都必须把 ACK 置 1。
- 同步 SYN :在连接建立时用来同步序号。当 SYN=1,ACK=0 时表示这是一个连接请求报文段。若对方同意建立连接,则响应报文中 SYN=1,ACK=1。
- 终止 FIN :用来释放一个连接,当 FIN=1 时,表示此报文段的发送方的数据已发送完毕,并要求释放连接。
- 窗口 :窗口值作为接收方让发送方设置其发送窗口的依据。之所以要有这个限制,是因为接收方的数据缓存空间是有限的。
三次握手
A 为客户端,B 为服务端。\(ack\) 是指上述的确认号,而不是 ACK 比特位;\(seq\) 是上述的序号。SYN, ACK
才是指上述的 SYN,ACK 比特位。
为什么需要 3 次握手?
- 第三次握手是为了防止失效的连接请求到达服务器,让服务器错误打开连接。
- 客户端发送的连接请求如果在网络中滞留,那么就会隔很长一段时间才能收到服务器端发回的连接确认。客户端等待一个超时重传时间之后,就会重新请求连接。但是这个滞留的连接请求最后还是会到达服务器,如果不进行三次握手,那么服务器就会打开两个连接。如果有第三次握手,客户端会忽略服务器之后发送的对滞留连接请求的连接确认,不进行第三次握手,因此就不会再次打开连接。
四次挥手
A 为客户端,B 为服务端。
以下描述不讨论序号 seq
和确认号 ack
,因为序号和确认号的规则比较简单。并且不讨论 ACK 位,因为 ACK 位在连接建立之后都为 1。
- A 发送连接释放报文,FIN=1。
- B 收到之后发出确认,此时 TCP 属于半关闭状态,B 能向 A 发送数据但是 A 不能向 B 发送数据。
- 当 B 不再需要连接时,发送连接释放报文,FIN=1。
- A 收到后发出确认,进入 TIME-WAIT 状态,等待 2 MSL(最大报文存活时间)后释放连接。
为什么需要 4 次挥手?
客户端发送了 FIN 连接释放报文之后,服务器收到了这个报文,就进入了 CLOSE-WAIT 状态。这个状态是为了让服务器端发送还未传送完毕的数据,传送完毕之后,服务器会发送 FIN 连接释放报文。
客户端为什么需要 2ms 的 TIME-WAIT?
- 确保最后一个确认报文能够到达 B。如果 B 没收到 A 发送来的确认报文,那么就会重新发送连接释放请求报文,A 等待一段时间就是为了处理这种情况的发生。
- 等待一段时间是为了让本连接持续时间内所产生的所有报文都从网络中消失,使得下一个新的连接不会出现旧的连接请求报文。
滑动窗口
窗口是缓存的一部分,用来暂时存放字节流。发送方和接收方各有一个窗口,接收方通过 TCP 报文段中的窗口字段告诉发送方自己的窗口大小,发送方根据这个值和其它信息设置自己的窗口大小。
发送窗口内的字节都允许被发送,接收窗口内的字节都允许被接收。
- 如果发送窗口左部的字节已经发送并且收到了确认,那么就将发送窗口向右滑动一定距离,直到左部第一个字节不是已发送并且已确认的状态;
- 接收窗口的滑动类似,接收窗口左部字节已经发送确认并交付主机,就向右滑动接收窗口。
如下图所示。
超时重传
TCP 使用超时重传来实现可靠传输:如果一个已经发送的报文段在超时时间内没有收到确认,那么就重传这个报文段。
一个报文段从发送再到接收到确认所经过的时间称为往返时间 \(RTT\) 。
TCP 保留了 \(RTT\) 的一个加权平均往返时间 \(RTT_s\)(这又称为平滑的往返时间)。第一次测量到 \(RTT\) 样本时,\(RTT_s\) 值就取为所测量到的 \(RTT\) 样本值。以后每测量到一个新的 \(RTT\) 样本,就按下式重新计算一次 \(RTT_s\) :
式中,\(0 \le \alpha < 1\)。若 \(\alpha\) 很接近于零,表示 \(RTT\) 值更新较慢。若选择 \(\alpha\) 接近于 1,则表示 \(RTT\) 值更新较快。RFC 2988 推荐的 \(\alpha\) 值为 0.125。
超时时间 \(RTO\) 应该略大于 \(RTT_s\),TCP 使用的超时时间计算如下:
\(RTT_d\) 是 \(RTT\) 的偏差的加权平均值。
流量控制
流量控制是为了控制发送方发送速率,保证接收方来得及接收。
接收方发送的确认报文中的窗口字段可以用来控制发送方窗口大小,从而影响发送方的发送速率。将窗口字段设置为 0,则发送方不能发送数据。
TCP 拥塞控制
TCP 拥塞控制是面试常考的重要知识点,内容也比较多,因此单独拿出来作为一节。
如果网络出现拥塞,分组将会丢失,此时发送方会继续重传,从而导致网络拥塞程度更高。因此当出现拥塞时,应当控制发送方的速率。这一点和流量控制很像,但是出发点不同。流量控制是为了让接收方能来得及接收,而拥塞控制是为了降低整个网络的拥塞程度。
TCP 主要通过四个算法来进行拥塞控制:慢开始、拥塞避免、快重传、快恢复。
发送方需要维护一个叫做拥塞窗口(cwnd)的状态变量,注意拥塞窗口与发送方窗口的区别:拥塞窗口只是一个状态变量,实际决定发送方能发送多少数据的是发送方窗口。
为了便于讨论,做如下假设:
- 接收方有足够大的接收缓存,因此不会发生流量控制;
- 虽然 TCP 的窗口基于字节,但是这里设窗口的大小单位为报文段。
TCP 拥塞控制的主要过程如下图所示。
可以简记为 2 个阶段以及 2 个处理方法:
- 2 个阶段:慢开始,
cwnd
指数增长;拥塞避免阶段,线性增长。 - 2 个处理:
- 如果出现超时,表明网络出现拥塞,那么
ssthresh = cwnd / 2, cwnd = 1
. - 如果出现 3-ACK,表明出现丢包,那么
ssthresh = cwnd / 2, cwnd = ssthresh
.
- 如果出现超时,表明网络出现拥塞,那么
慢开始和拥塞避免
慢开始:发送的最初执行慢开始,令 cwnd = 1
,发送方只能发送 1 个报文段;当收到确认后,将 cwnd
加倍,因此之后发送方能够发送的报文段数量为:2、4、8 ...
注意到慢开始每个轮次都将 cwnd
加倍,这样会让 cwnd
增长速度非常快,从而使得发送方发送的速度增长速度过快,网络拥塞的可能性也就更高。因此,TCP 设置一个慢开始阈值 ssthresh
,当 cwnd >= ssthresh
时,进入拥塞避免,每个轮次只将 cwnd
加 1。
如果出现了超时,则令 ssthresh = cwnd / 2
,然后重新执行慢开始。
上述过程对应图中的 1-3 三个关键拐点。
快重传和快恢复
在接收方,要求每次接收到报文段都应该对最后一个已收到的有序报文段进行确认。例如已经接收到 \(M_1\) 和 \(M_2\),此时收到 \(M_4\),应当发送对 \(M_2\) 的确认。
在发送方,如果收到三个重复确认,那么可以知道下一个报文段丢失,此时执行快重传,立即重传下一个报文段。例如收到三个 \(M_2\),则 \(M_3\) 丢失,立即重传 \(M_3\) 。对应上述图中第 4 个拐点。
在这种情况下,只是丢失个别报文段,而不是网络拥塞。因此执行快恢复,令 ssthresh = cwnd / 2, cwnd = ssthresh
,注意到此时直接进入拥塞避免。对应上述图中第 5 个拐点。
⚠️ 注意:慢开始和快恢复的快慢指的是 cwnd
的设定值,而不是 cwnd
的增长速率。慢开始 cwnd
设定为 1,而快恢复 cwnd
设定为 ssthresh
。
上述讲述了 TCP 拥塞控制的几个主要过程,但没有具体说明在慢开始阶段,出现超时(即表明网络拥塞)和 3-ACK 时,发送方应当采取什么措施。下图更加全面地描述了 TCP 拥塞控制的流程。