Linux I/O复用中select poll epoll模型的介绍及其优缺点的比较
image.png举个例子:假设进程有10万个TCP连接,且只有几百个连接是有事件需要处理的。那么在每一个时刻进程只需要处理这几百个有事件需要处理的连接即可。
事件:即TCP连接上有数据需要交互。
select和poll这样处理的:在某一时刻,进程收集所有的连接。并把所有连接的套接字传给操作系统(这个过程其实是用户态内存到内核态内存的复制),而由操作系统内核寻找这那几百个有事件需要处理的连接并处理,然后返回数据给用户。
Note:这个过程需要操作系统把全部的连接处理一遍,极大浪费系统资源。
而epoll是这样做的:
1、调用epoll_creat函数建立一个epoll对象(一颗红黑树,一个准备就绪list链表)。
2、调用epoll_ctl函数把socket放到红黑树上,给内核中断处理程序注册一个回调函数,告诉内核,如果这个句柄的中断到了,就把这个socket放到准备就绪list链表里。
3、调用epoll_wait到准备就绪list链表中处理socket,并把数据返回给用户。
Note:不需要把全部的连接处理一遍,只需要去list链表里处理socket。
select
查询 fd_set 中,是否有就绪的 fd,可以设定一个超时时间,当有 fd (File descripter) 就绪或超时返回。
fd_set 是一个位集合,大小是在编译内核时的常量,默认大小为 1024。
特点:连接数限制,fd_set 可表示的 fd 数量太小了;线性扫描:判断 fd 是否就绪,需要遍历一边 fd_set;数据复制:用户空间和内核空间,复制连接就绪状态信息。
poll
解决了连接数限制:poll 中将 select 中的 fd_set 替换成了一个 pollfd 数组,解决 fd 数量过小的问题。
数据复制:用户空间和内核空间,复制连接就绪状态信息。
epoll event 事件驱动
事件机制:避免线性扫描,为每个 fd,注册一个监听事件,fd 变更为就绪时,将 fd 添加到就绪链表。
fd 数量:无限制(OS 级别的限制,单个进程能打开多个 fd)。
select/poll/epoll
I/O 多路复用的机制。
I/O 多路复用就通过一种机制,可以监视多个描述符,一旦某个描述符就绪(一般是读就绪或者写就绪),能够通知程序进行相应的读写操作;监视多个文件描述符。
但 select,poll,epoll 本质上都是同步 I/O:用户进程负责读写(从内核空间拷贝到用户空间),读写过程中,用户进程是阻塞的;异步 IO,无需用户进程负责读写,异步 IO,会负责从内核空间拷贝到用户空间。
网友评论