因特网有两个核心协议:IP和TCP。IP,即Internet Protocol(因特网协议),负责联网主机之间的路由选择和寻址;TCP,即Transmission Control Protoccol (传输控制协议),负责在不可靠的传输信道之上提供可靠的抽象层。TCP/IP也常被称为”因特网协议套件“。
TCP负责在不可靠的传输信道之上提供可靠的抽象层,向应用层隐藏了大多数网络通信的复杂细节,比如丢包重发、按序发送、拥塞控制即避免、数据完整,等等。采用TCP数据流可以确保发送的所有字节能够完整地被接收到,而且到达客户端的顺序也一样。也就是说,TCP专门为精确传送做了优化,但并未过多顾及时间,这一点也给优化浏览器Web带来了挑战。
HTTP标准并未规定TCP就是唯一的传输协议。如果你愿意,还可以通过UDP(用户数据报协议)或者其他可用协议来发送HTTP消息。但在现实当中,由于TCP提供了很多有用的功能,几乎所有HTTP流量都是通过TCP传送的。
因此,理解TCP的某些核心机制就成为了优化Web体验的必修课。虽然我们一般不会直接使用TCP套接口,但应用层的一些决定可能会对TCP以及底层网络的性能产生极大影响。
2.1 三次握手
所有TCP连接一开始都要经过三次握手。客户端与服务器在交换应用数据之前,必须就起始分组序列号,以及其他一些连接相关的细节达成一致。出于安全考虑,序列号有两端随机生成。
. SYN
客户端选择一个随机序列号x,并发送一个SYN分组,其中可能还包括其他TCP标识和选项。
. SYN ACK
服务器给X加1,并选择自己的一个随机序列号Y,嘴角自己的标志和选项,然后返回响应。
. ACK
客户端给X和Y加1并发送握手期间的最后一个ACK分组。
三次握手之后,客户端与服务器之间就可以通信了。客户端可以再发送ACK分组之后立即发送数据,而服务器必须等接收到ACK分组之后才能发送数据。这个启动通信的过程适用于所有TCP连接,因此对所有使用TCP的应用具有非常大的性能影响,因为每次传输应用数据之前,都必须经历一次完整的往返。
三次握手带来的延迟使得每创建一个新TCP连接都要付出很大代价。而这也决定了提高TCP应用性能的关键,在于想办法重用连接。
2.2 拥塞预防及控制
2.2.1 流量控制
流量控制是一种发送端过多向接收端发送数据的机制。否则,接收端可能因为忙碌、负载重活缓冲区既定而无法处理。为实现流量控制,TCP连接的每一方都要通告自己的接受窗口,其中包括能够保存数据的缓冲区空间大小信息。
2.2.2 慢启动
尽管TCP有了流量控制机制,但网络拥塞崩溃仍然在1980年代中后期浮出睡眠。流量控制确实可以防止发送端向接收端过多的发送数据,但却没有机制预防任何一端向潜在网络过多发送数据。
2.2.3 拥塞预防
慢启动以保守的窗口初始化连接,随后的每次往返都会成倍提高传输的数据量,直到超过接收端的流量控制窗口,即系统配置的拥塞阀值窗口,或者有分组丢失为止,此时拥塞预防算法介入。
拥塞预防算法把丢包作为网络拥塞的标志,即路径中某个连接或路由器已经拥堵了,以至于必须采用删包措施。因此,必须调整窗口大小,以避免照成更多的包丢失,从而保证网络畅通。
重置拥塞窗口后,拥塞预防机制按照自己的算法来增大窗口以尽量避免丢包。某个时刻,可能又会有包丢失,于是这个过程再从头开始。如果你看到过TCP连接的吞吐量跟踪曲线,发现该曲线呈锯齿状,那现在就该明白为什么了。这是拥塞控制和预防算法在调整拥塞窗口,进而消除网络中的丢包问题。
2.3 带宽延迟积
TCP内置的拥塞控制和预防机制对性能还有另一个重要影响:发送端和接收端理想的窗口大小,一定会因往返时间及目标传输速率而变化。
为什么?我们知道,发送端和接收端之间在途未确定的最大数据量,取决于拥塞窗口(cwnd)和接受窗口(rwnd)的最小值。接收窗口会随每次ACK一起发送,而拥塞窗口则由发送端根据拥塞控制和预防算法动态调整。
无论发送端发送的数据还是接收端接受的数据超过了为确定的最大数据量,都必须停下来等待另一方ACK确认某些分组才能继续。要等待多长时间呢?取决于往返时间!
. BDP 带宽延迟积
数据链路的容量与其端到端延迟的乘积。这个结果就是任意时刻处于在途未确认状态的最大数据量。
发送端或接收端无论谁被迫频繁地停止等待之前分组的ACK,都会造成数据缺口,从而必然限制连接的最大吞吐量。为解决这个问题,应该让窗口足够大,以保证任何一段都能在ACK返回前持续发送数据。只有传输不中断,才能保证最大吞吐量。而最优窗口大小取决于往返时间!无论实际或通告的带宽是多大,窗口过小都会限制连接的吞吐量。
2.4 队首堵塞
每个TCP分组都会带着一个唯一的序列号被发出,而所有分组必须按顺序传送到接受端。如果中途有一个分组没能到达接收端,那么后续分组必须保存在接收端的TCP缓冲区,等待丢失的分组重发并到达接收端,那么后续分组必须保存在接收端的TCP缓冲区,等待丢失的分组重发并到达接收端;这一切都发生在TCP层,应用程序对TCP重发和缓冲区中排队的分组一无所知,必须等待分组全部到达才能访问数据。在此之前,应用程序只能在通过套接字读数据时感觉到延迟交付。这种效应称为TCP的队首阻塞。
2.5 针对TCP的优化建议
TCP是一个自适应的、对所有网络节点一视同仁的、最大限制利用底层网络的协议。因此,优化TCP的最佳途径就是调整它感知当前网络状态的方式,根据它之上而某些应用程序可能需要自定义服务品质的含义,从而交付最佳的体验。
TCP核心原理
. TCP三次握手增加了整整一次往返时间
. TCP慢启动将被应用到每个新连接
. TCP流量及拥塞控制会影响所有连接的吞吐量
. TCP的吞吐量由当前拥塞窗口大小控制
2.5.1 服务器配置调优
TCP的最佳实践以及影响其性能的底层算法一直在与时俱进,而且太多数变化都只在最新的内核中才有实现。一句话,让你的服务器跟上时代是优化发送端和接收端TCP栈的首要措施。
. 增大TCP的初始拥塞窗口
加大其使拥塞窗口可以让TCP在第一次往返就传输较多数据,而随后的速度提升也会很明显。对于突发性的短暂连接,这也是特别关键的一个优化。
. 慢启动重启
在连接空闲时禁用慢启动可以改善瞬时发送数据的长TCP连接的性能。
. 窗口缩放
启用窗口缩放可以增大最大接受窗口大小,可以让高延迟的连接达到更好吞吐量。
.TCP快速打开
在某些条件下,允许在第一个SYN分组中发送应用程序数据。TFO(TCP Fast Open ,TCP快速打开)是一种新的优化选项,需要客户端和服务器共同支持。为此,首先要搞清楚你的应用程序是否可以利用这个特性。
以上几个设置在加上最新的内核,可以确保最佳性能:每个TCP连接都会具有较低的延迟和较高的吞吐量。
网友评论