TCP

作者: 一个追寻者的故事 | 来源:发表于2020-04-12 21:25 被阅读0次

TCP那些事儿
计算机网络
TCP协议三次握手和四次挥手
15分钟TCP
TCP 与 UDP
四 . TCP 编程
TCP HTTPS专题
浅谈 TCP
传输层
TCP/IP

TCP作为一种面向有连接的协议，只有在确认通信对端存在时才会发送数据，从而可以控制通信流浪的浪费（由于UDP没有连接控制，所以即使端对端一开始就不存在或中途退出网络，数据包还是能够发送出去）。根据TCP的机制，在IP这种无连接的网络上也能够实现高可靠性的通信。

1、TCP的特点及其目的

为了通过IP数据包实现可靠传输，需要考虑很多事情，例如数据的破坏、丢包、重复以及分片顺序混乱等问题。如不能解决这些问题，也就无从谈起可靠传输。

TCP通过 检验和、序列号、确认应答、重发控制、连接管理 以及 窗口控制 等机制实现可靠性传输。

2、通过序列号与确认应答提高可靠性

在TCP中，当发送端的数据到达接收主机时，接收端主机会返回一个已收到消息通知，这个消息叫确认应答（ACK）

通常，两个人对话时，在谈话的停顿处可以点头或询问以确认谈话内容。如果对方迟迟没有任何反馈，说话的一方还可以再重复一遍以保证对方确实听到。因此，对方是否理解了此次对话，对方是否完全听到了对话的内容，都要靠对方的反应来判断。网路中的 “确认应答” 就是类似这样一个概念。对方听懂对话内容时会说：“嗯”，这就相当于返回一个确认应答（ACK：Positive Acknowledgement）。而当对方没有理解对话内容或没有听清时会问一句：“咦？”，这就好比一个否定确认应答（NACK：Negative Acknowledgement）

正常的数据传输

TCP通过肯定的确认应答实现可靠的数据传输。当发送端将数据发出去之后会等待确认应答。如果有确认应答，说明数据已经成功到达对端。反之，则数据丢失的可能性很大。

在一定时间内没有等到确认应答，发送端可以认为数据已丢失，并进行重发。由此，即使产生丢包，仍能保证数据能够达到对端，实现可靠传输。

数据丢包的情况

未收到确认应答并不意味着数据一定丢失。也有可能是数据对方已收到，只是返回的确认应答在途中丢失。这种情况也会导致发送端因没有收到确认应答，而认为数据没有到达目的地，从而进行重发。

应答丢失的情况

此外，也有可能是因为一些其他原因导致确认应答延迟到达，在源主机重发数据以后才到达的情况也屡见不鲜。此时，源主机只要按照机制重数据即可。但对于目标主机来说，这简直是一种“灾难”。它会反复收到相同的数据。而为了对上层应用提供可靠的传输，必须得放弃重复的数据包，为此，就必须引入一种机制，它能够识别是否已经接收数据，又能够判断是否需要接收。

上述这些确认应答、重发控制以及重复控制等功能都可以通过 序列号 实现。序列号是按顺序给发送数据的每一个字节（8位字节）都标上号码的编号（序列号的初始值并非为0，而是在建立连接以后由随机数生成。而后面的计算则是对每一字节加1）。接收端查询接收数据TCP首部的序列号和数据的长度，将自己下一步应该接收的序号作为确认应答返回去。就这样，通过序列号和确认应答，TCP可以实现可靠传输。

3、重发超时如何确定

重发超时是指在重发数据之前，等待确认应答到来的那个特定时间间隔。如果超过了这个时间仍未收到确认应答，发送端将进行数据重发。那么这个重发超时的具体时间长度又是如何确定的呢？

最理想的是，找到一个最小时间，它能保证 “确认应答一定能在这个时间内返回”。然后这个时间长短随着数据包途径的网络环境的不同而有所变化。例如在高速的LAN中时间相对较短，而长距离的通信当中应该比LAN要长一些。即使在同一个网络中，根据不同时段的网络拥堵程度时间的长短也会发生变化。

TCP要求不论处在何种网络环境下都要提供高性能通信，而且无论网络发生何种变化，都必须保持这一特性。为此，它在每次发包时都会计算往返时间及其偏差。 将这个往返时间和偏差时间相加，重发超时时间就是比这个总和要稍大一点的值。

在BSD的 Unix 以及Windows 系统中，超时都以0.5秒为单位进行控制，因此重发超时都是 0.5秒的整数倍。不过，由于最初的数据包还不知道往返时间，所以其重发超时时间一般设置为6秒左右。

数据被重发之后若是还是收不到确认应答，则进行再次发送。此时，等待确认应答的时间将会以2倍、4倍的指数函数延长。

此外，数据也不会被无限、反复重发。达到一定重发次数后，如果仍没有收到确认应答，就认为网络或者对端主机发生了异常，强制关闭连接。并且通知应用通信异常强行终止。

4、连接管理

TCP提供面向有链接的通信传输，面向有链接是指在数据通信开始之前先做好通信两端之间的准备工作。

TCP会在数据通信之前，通过TCP首部发送一个 SYN 包作为建立连接的请求 等待确认应答。如果对端发来确认应答，则认为可以进行数据通信。如果对端的确认应答未能到达，就不会进行数据通信，此外，在通信结束时会进行断开连接的处理（FIN包）。

可以使用TCP首部用于控制的字段来管理TCP连接。（也叫控制域）。一个连接的建立与断开，正常过程至少需要来回发送7个包才能完成。

TCP连接的建立与断开

5、TCP以段为单位发送数据

在建立连接的同时，也可以确定发送数据包的单位，我们可以称其为 “最大消息长度” （MMS: Maximum Segment Size）。最理想的情况是，最大消息长度正好是 IP 中不会被分片处理的最大数据长度。

TCP发送大量数据时，是以MMS的大小将数据进行分割发送。进行重发时也以MMS为单位。

MMS是三次握手时，在两端主机之间被计算得出。两端的主机在发送建立请求时，会在TCP首部中写入MMS 选项，告诉对方自己的接口能够适应的 MMS 大小，然后会在两者之间选择一个较小的值投入使用。

接入以太网主机与接入FDDI 主机之间进行通信的情况

6、利用窗口控制提高速度

TCP 以1个段为单位，每发一个段进行一次确认应答的处理，如下图。这样传输的方式有一个缺点。那就是，包的往返时间越长通信性能就越低。

按数据包进行确认应答

为解决这个问题，TCP引入窗口这个概念。 如下图所示，确认应答不再是以每个分段，而是以更大的单位进行确认时，转发时间被大幅度缩短（之前是串行，现在是并行）。也就是说，发送端主机，在发送了一段以后不必要一直等待确认应答，而是继续发送。

用滑动窗口方式并行处理

窗口大小就是指无需等待确认应答而可以继续发送数据的最大值。 上图中，窗口大小为4个段。

下图中，发送数据中高亮圈起的部分正是前面提到的窗口。在这个窗口内的数据即便没有收到确认应答也可以发送出去。此外，在该窗口中的数据因其某种数据已在传输中丢失，这中情况也需要进行重发。为此，发送端主机在收到确认应答之前，必须在缓冲区中保留这部分数据。

在收到确认应答的情况下，将窗口滑动到确认应答中序列号的位置。这样就可以顺序地将多段同时发送提高通信性能。这种机制也被称为 滑动窗口控制。

滑动窗口方式

7、窗口控制与重发控制

首先，我们先来考虑确认应答未能返回的情况。在这种情况下，数据已到达对端，是不需要进行重发的。然而，在没有使用窗口控制的时候，没有收到确认应答的数据都会被重发。而使用了窗口控制，就如下图所示，某些确认应答即便丢失也无需重发。

没有确认应答也不受影响

其次，我们再来考虑一下某个报文段丢失的情况，如下图所示，接收主机如果收到一个自己应该收到的序号外的数据时，会针对当前为止收到数据返回确认应答（很重要）。
如下图所示，当某一段报文丢失后，发送端会一直收到序列号为1001的确认应答，这个确认应答好像是在提醒 “我想接收的是从1001开始的数据”。因此，在窗口比较大，又出现报文段丢失的情况。同一序号的确认应答会被重复不断的返回。而发送主机如果连续3次收到同一个确认应答，就会将其所对应的数据进行重发。这种机制比之前提到的超时管理更加高效，因此也被称为高速重发控制。

高速重发控制

8、流控制

发送端根据自己的实际情况发送数据，但是接收端的情况可能会很复杂，甚至在高负荷的情况下，无法接收任何数据。如此一来，如果接收端本应该接收的数据的数据丢弃的话，就又会触发重发机制，从而导致网络流量的无端浪费。

为了防止这种现象的发生，TCP提供一种机制可以让发送端根据接收端的实际接收能力控制发送的数据量。这就是所谓的流控制。 它的具体操作是：接收端主机向发送端主机通知自己可以接收数据的大小，于是发送端会发送不超过这个限度的数据。该大小限度就称作窗口大小。 （由接收端主机决定）

TCP首部中，专门有一个字段用来通知窗口大小，接收主机将自己可以接收的缓冲区大小放进这个字段中通知发送端。这个字段的值越大，说明网络吞吐量越高。

不过，接收端的这个缓冲区一旦面临数据溢出时，窗口的大小值也会随之被设置为一个更小的值通知给发送端，从而控制数据发送量。也就是说，发送端主机会根据接收端主机的指示，对发送数据的量进行控制。这就形成了一个完整的TCP流控制（流量控制）。

根据窗口大小控制流量的过程

9、拥塞控制

有了TCP的窗口控制，收发主机之间即使不再以一个数据段为单位发送确认应答，也能够连续发送大量数据包。然后，在通信刚开始时就发送大量数据，也可能会引发其它问题。

一般来说，计算机网路都处于一个共享的环境。因此也有可能会因为其他主机之间的通信使得网络拥堵。在网络出现拥堵时，如果出现突然发送一个较大量的数据，极有可能会导致整个网络瘫痪。

TCP为了防止该问题的出现，在通信一开始时就会通过一个叫做慢启动的算法得出的数值，对发送量进行控制。

慢启动

首先，为了在发送端调节所要发送的数据的量，定义一个叫做 “拥塞窗口” 的概念。于是在慢启动的时候，将这个拥塞窗口的大小设置为1个数据段（1MMS）发送数据，之后每收到一次确认应答（ACK），拥塞窗口的值就加1。在发送数据包时，将拥塞窗口与接收端主机通知的窗口大小做比较，然后按照它们当中较小的值，发送比其还要小的数据量。

有了上述机制，就可以有效地减少通信开始时连续发包导致的网路拥堵，还可以避免网络拥塞情况的发生。不过，随着每次往返，拥塞窗口也会以 1、2、4等指数函数的增长，拥堵状况激增甚至导致网络拥塞的发生。为了防止这些，引入 慢启动阀值 的概念。只要拥塞窗口的值超出这个阀值，在每收到一次确认应答时，只允许以下面这种比例放大拥塞窗口：