IO复用模型

作者: StevenHD | 来源:发表于2020-12-28 13:06 被阅读0次

一、多进程和多线程的本质

多个执行单位竞争CPU时间片

执行单位大部分时间都在阻塞等待客户端的数据到来(阻塞在read()或者accept())
活跃的就那么几个
就绪态，调度，分配时间片，运行态，恢复CPU现场
PCB保存了寄存器等信息
执行单位之间的切换太多，消耗了大量的时间

每个执行单位中都有一个socket
上面的这个呢，被我们称为阻塞的模型——

缺点是CPU切换太频繁

二、非阻塞轮询模型

只启动一个进程，然后这个进程中来轮询每个套接字，把每个套接字都设置成非阻塞的，每个套接字都read()一遍，不断地轮询遍历

缺点是CPU可能会不断空转，即使没有数据CPU的使用率也会很高，即使加入一个sleep()，但是会导致实时性变差
优点是没有了阻塞模型中执行单位之间的切换

三、IO复用模型

IO复用 = 反应堆
套接字就是IO

四、select

只能支持1024个文件描述符(1024位对应的是128个字节)
反应堆fd_set

每一个文件描述符是否在这个fd_set集合中，在的话就置1

select()函数是用来监听文件描述符集合fd_set
select也是阻塞的，除非有一个文件描述符被触发了

select有3个反应堆

处理返回的fd_sets就叫解复用

select是轮询的方式来监听反应堆的，我们可以看第一个参数是maxfds + 1来得知其本质

最后一个参数timeout是一个结构体

NULL：一直阻塞，直到监听的反应堆里面有数据

timeout = 10：到了超时时间，就会返回，返回值可能为0也可能比0大

timeout = 0：直接返回，不会阻塞等待，相当于非阻塞

listenfd监听的数据是TCP层的数据（比如SYN报文，FIN报文），不是应用层的数据
反应堆fd_sets在select()中是一个传入传出参数，传入是告知监听哪些文件描述符，传出是告知有多少个文件描述符可读
时间复杂度是O(n)

五、poll

poll——举手
poll反应堆（传入和传出区分开了）——结构体数组

所以poll是不需要重新初始化反应堆的，但是select需要
ulimit -a
/etc/limit.conf文件修改打开文件的数量

时间复杂度是O(n)（处理n个连接）
poll的timeout——一个整型数

-1表示阻塞，0表示立即返回非阻塞，>0表示定时

select反应堆（传入传出参数整合在了一起）——文件描述符集合

需要重新初始化反应堆

select的timeout——结构体

六、epoll

维护一棵树（内核空间中）

LT

隔一段时间就会检查是否从0变为了1，不能够及时地反馈

ET

可以捕捉的到0变为1的时刻，所以快（错过了这个边缘，就永远都检测不出来事件触发了，但是LT则是后面只要是1，就会检测出来）

EPOLLONESHOT

用完一次后（只监听一次），监听完后会从树上摘下来

epollfd是一棵树的文件描述符
epoll_event是一个队列（用户空间），当有事件触发的时候，内核epoll_wait()会自动把对应节点的内容填充到就绪队列中
timeout跟poll中是一样的
返回值：有多少个fd被触发了

就绪队列是以一个数组来实现的

节点的具体内容(val)是epoll_event
close套接字文件描述符的时候，还要记着从反应堆中去除
O(log2N)是想象在整个树上只有一个节点被触发，找到这个节点的最大复杂度是O(log2N)
高效的情景：1000个连接10个活跃

1000个连接1000个活跃的话，epoll还不如poll，因为epoll比poll多维护一棵树

epoll还不如poll，因为epoll比poll多维护一棵树

key-value, key是fd，value是epoll_event

网友评论

本文标题：IO复用模型

本文链接：https://www.haomeiwen.com/subject/gieinktx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

IO复用模型

一、多进程和多线程的本质

二、非阻塞轮询模型

三、IO复用模型

四、select

五、poll

六、epoll

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

IO复用模型

一、多进程和多线程的本质

二、非阻塞轮询模型

三、IO复用 模型

四、select

五、poll

六、epoll

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

三、IO复用模型