一. epoll
1. epoll 实现原理
- epoll_create:创建一个epoll对象,一般 epollfd = epoll_create()
- epoll_ctl:epoll_add/epoll_del的合体,往epoll对象中增加/删除某一个流的某一个事件
epoll_ctl(epollfd, EPOLL_CTL_ADD, socket, EPOLLIN); // 注册缓冲区非空事件,即有
// 数据流入
epoll_ctl(epollfd, EPOLL_CTL_DEL, socket, EPOLLOUT); // 注册缓冲区非满事件,即流
// 可以被写入
- epoll_wait(epollfd,...):等待直到注册的事件发生
-
实现原理
首先,需要调用epoll_create来创建一个epoll的文件描述符,内核会同时创建一个eventpoll的数据结构。这个数据结构里面会包含两个东西,一个是红黑树,专门用于存储epoll_ctl注册进来的fd文件描述符;另外一个是就绪链表,用来存储epoll_wait调用相关的已经就绪的fd文件描述符
eventpoll结构体:
struct eventpoll{
struct rb_root rbr; // 红黑树的根节点,存储所有添加到epoll中需要监控的事件
struct list_head rdlist; // 双链表存放将要通过epoll_wait返回给用户的满足条件的事件
};
其次,执行epoll_ctl时,如果增加socket句柄,则检查在红黑树中是否存在,存在立即返回,不存在则添加到树干上,然后向内核注册回调函数,用于当中断事件来临时向准备就绪链表中插入数据,因为epoll中的所有事件,都与网卡驱动程序建立回调关系,当相应的事件发生的时候,会通过这个事件的回调函数,将发生的事件添加到就绪链表当中,在epoll中,对于每一个事件,都会建立一个epitem结构体,如下所示:
struct epitem{
struct rb_node rbn; //红黑树节点
struct list_head rdllink; //双向链表节点
struct epoll_filefd ffd; //事件句柄信息
struct eventpoll* ep; //指向其所属的eventpoll对象
struct epoll_event event; //期待发生的事件类型
}
最后,当调用epoll_wait检查是否有事件发生时,只需要检查eventpoll对象中的rdlist双链表中是否有需要处理的事件。如果rdlist不为空,则把发生的事件复制到用户态,同时将事件数量返回给用户
2. epoll 技术优势
- 支持一个进程打开大数目的socket描述符(FD)
- IO效率不随FD数目增加而线性下降
- 使用mmap加速内核与用户空间的消息传递,通过内核与用户空间mmap同一块内存
3. epoll 的 select 与 poll 的区别
- select 与 poll 使用轮询方式扫描文件描述符,单个进程监控的数量有限;epoll 通过调用文件描述符的回调函数,使得单个进程能够监控大量的事件
- select 与 poll 返回的是整个数组的文件描述符,应用程序需要遍历整个数组才知道谁触发了事件;epoll 只返回触发了事件的文件描述符
4. Epoll 的 LT 模式与 ET 模式的区别
- LT 模式:高速工作模式,只支持no_block(非阻塞模式)。在此模式下,当描述符从未就绪变为就绪时,内核通过epoll告知。然后它会假设用户知道文件描述符已经就绪,并且不会再为那个文件描述符发送更多的就绪通知,直到某些操作导致那个文件描述符不再为就绪状态了。(触发模式只在数据就绪时通知一次,若数据没有读完,下一次不会通知,直到有新的就绪数据)
- ET 模式:缺省工作方式,支持blocksocket和no_blocksocket。在LT模式下内核会告知一个文件描述符是否就绪了,然后可以对这个就绪的fd进行IO操作。如果不作任何操作,内核还是会继续通知!若数据没有读完,内核也会继续通知,直至设备数据为空为止
网友评论