要实现用户态协议栈,必须要搞懂TCP,TCP 11个状态、滑动窗口、拥塞控制等等。
要使用用户态协议栈,内核提供的epoll就不起作用了,我们需要自己实现用户态的epoll。epoll内部涉及到一个回调的时机,回调的作用是将红黑树中的节点添加进就绪队列,具体在epoll原理里面会具体讲解。搞清楚TCP的11个状态,我们就明白应该在什么时机进行回调了。
TCP
- 一对一,server端对于每一个client的连接,都回分配一个tcb。
- 状态机
TCP状态转换图
image.png
TCP数据格式
image.png image.png
image.png
TCP的优点:
- 数据可靠,必达;确认机制,对于发送的数据,都有确认ack
- 传输效率不低;一发一确认的话,效率就比较低,所以可以多个包的确认合并到一起。
- 保证顺序。延时确认机制,保证顺序。
TCP状态保存在哪里?保存在TCB中,即TCP PCB,协议控制块。里面包含了socket信息,以及sendbuffer,recvbuffer。TCB保存了从listen到time_wait的所有状态。
三次握手的过程
image.png
三次握手,只有client发起第一次握手,是需要应用程序调用connect函数发起的,其他的事情都是内核协议栈完成的,直到client和server都到ESTABLISHED状态。
server端不需要accept?是的,不需要。
那么accept的作用是什么呢?
client_fd = accept(listen_fd, &client_addr)
- 从accept队列中取出一个节点;
-
为节点分配一个fd,与节点一一对应。节点就是tcp控制块,它的生命周期是一直伴随这连接。
为什么fd与节点也就是连接能一一对应?也就是fd是怎么确定的?
五元组可以确定一个fd,(sip, sport, dip, dport, proto)
什么是syn队列和accpt队列,看下图
image.png
三次握手的时候,告诉对端window size是没有意义的。
由syn队列和accept队列,就可以解释listen函数的第二个参数backlog了
int listen(int sockfd, int backlog);
对于unix和mac系统,backlog=syn队列的长度;
对于linux系统,backlog=syn队列+accept队列的长度。
backlog设置多少合适?1s的接入量除以20。
什么是syn泛洪,也叫DDOS攻击?就是利用TCP三次握手中的缺陷,client端不断给server发送第一次握手的syn消息,之后不发送第三次握手的ack,使得TCP连接无法建立,把syn队列占满,那些有效的连接就无法建立,使得server无法提供服务。
TCP通信过程中最重要的问题:
- 如何保证顺序?
- 如何保证高效?
通过确认机制。
image.png
tcp如何保证顺序,延迟ack(延迟确认,比如收到9号包后,协议栈会启动一个200ms定时器,看5、6、7、8是否收到,如果200ms内5、6、7收到,8没有收到,则发送ack值为8,8、9会重传)
滑动窗口,左边的值,是根据ack num变化的;右边的变化,是ack num + cwnd
TCP的拥塞控制,是通过cwnd实现的,网络带宽占用的多,则cwnd变小。cwnd大小是通过rtt来决定的。
rtt 一次往返时间,round trip time。rtt增加还是变小,决定cwnd滑动窗口变大还是变小。
TCP拥塞控制
image.png
扩展:既然有TCP可靠传输,为什么要用UDP做可靠传输?
UDP效率和实时性,都要比TCP好。TCP是一个折中的方案,平衡了效率和实时性,效率不差,实时性也不高,最大的优点就是可靠。
四次挥手
image.png
四次挥手中常见的问题:
- FIN_WAIT_2, 如果对端一直没有调用close,收不到对端的fin消息,如何终止FIN_WAIT_2状态?在这种状态下,还是可以收到对端发过来的数据的。
只有一种方法,就是kill掉进程。 - TIME_WAIT有什么用?
防止最后一次ack丢失。假设A是TIME_WAIT一端,B发送完fin后,会启动一个定时器,如果在一定时间内没有收到A的ack,就会再次发送fin,如果A没有TIME_WAIT, 而是直接CLOSED,那么这个fin就不知道发给谁了,成为僵尸包。
TIME_WAIT是2mls,默认是120s,是可以修改的。 - 服务器为什么会出现大量CLOSE_WAIT状态?
因为没有调用close(),或者调用close的时机不对。recv()的返回值是0时,就应该调用close。 -
双方同时close
TCP/IP详解中关于同时close的解释
image.png - 被动关闭一方,ack和fin一起发送,4次挥手变成3次
四次挥手过程,被动方发送的ack和fin,可以有3种情况:
- ack先发送,之后发送fin,是正常情况,主动放先进入FIN_WAIT_2, 后进入TIME_WAIT;
- fin先发送,后发送ack,双方都进入CLOSING,之后变为TIME_WAIT;
- fin和ack一起发送,主动方进入TIME_WAIT状态。
网友评论