Select poll epoll 区别

作者: IT菜鸟学习 | 来源:发表于2018-12-24 21:09 被阅读0次

是从知乎上看的觉得解释很到位就贴过来了
下面举一个例子，模拟一个tcp服务器处理30个客户socket。假设你是一个老师，让30个学生解答一道题目，然后检查学生做的是否正确，你有下面几个选择：

第一种选择：按顺序逐个检查，先检查A，然后是B，之后是C、D。。。这中间如果有一个学生卡主，全班都会被耽误。这种模式就好比，你用循环挨个处理socket，根本不具有并发能力。
第二种选择：你创建30个分身，每个分身检查一个学生的答案是否正确。这种类似于为每一个用户创建一个进程或者线程处理连接。
第三种选择，你站在讲台上等，谁解答完谁举手。这时C、D举手，表示他们解答问题完毕，你下去依次检查C、D的答案，然后继续回到讲台上等。此时E、A又举手，然后去处理E和A。。。这种就是IO复用模型，Linux下的select、poll和epoll就是干这个的。将用户socket对应的fd注册进epoll，然后epoll帮你监听哪些socket上有消息到达，这样就避免了大量的无用操作。此时的socket应该采用非阻塞模式。这样，整个过程只在调用select、poll、epoll这些调用的时候才会阻塞，收发客户消息是不会阻塞的，整个进程或者线程就被充分利用起来，这就是事件驱动，所谓的reactor模式。
作者：知乎用户
链接：https://www.zhihu.com/question/28594409/answer/52835876
来源：知乎
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

select poll每次循环调用时，都需要将描述符和文件拷贝到内核空间；epoll 只需要拷贝一次；
对于这种情况对于描述符数量不大还可以，但是当描述符的数量达到十几万甚至上百万的时候，效率就会急速降低，因为每一次轮询的时候都需要将这些所有的socket文件从用户态拷贝到内核态，会造成大量的浪费和资源开销；
select每次返回后，都需要遍历所有的描述文件才能找到就绪的，时间复杂度为O(n)，而epoll则需要O(1)；
select poll内核是通过内核方式来完成的，时间复杂度O(n)；epoll在每个描述文件上设置回调函数，时间复杂度为O(1)；

select相比poll没有太大的改进，唯一的区别就是使用链表来保存fd，使的能监听的数量远远大于1024，但对于将用户数据拷贝到内存空间，线性遍历fd这两个没有太大的改变。

epoll的底层实现
利用sys_epoll_creat()创建内核时间表，在sys_epoll_creat()里面创建了struct eventpoll结构体，其中包括两个成员：
就绪队列 struct list_head relist，用来存放有就绪事件的描述符；
红黑树 struct rb_root rbr，作为内核时间表用来收集描述符；
每一个epoll对象都有一个独立的eventpoll结构体，用于存放epoll_ctl 向epoll对象中添加事件，这些事件都会通过ep_insert挂载到红黑树上，这样重复添加的事件就可以通过红黑树而高效的识别出来；

而所有的添加到epoll中都会与驱动程序建立回调关系，当相应的事件发生后，会通过ep_poll_callback这个回调方法，它会将发生的事件添加到rdlist；

每一次epoll遍历仅仅是这个fd的就绪队列，这个队列的fd全部都是就绪的，甚至这么说，epoll根本没有遍历，只需要判断一下fd就绪队列是否为空，不为空就返回，效率惊人。
总结一下，就是epoll单独搞了一个fd的就绪队列的模式，减少了遍历。

两种工作模式的区别：

ET模式：如果一个描述符上有数据到达，然后读取这个描述符上的数据，如果没有将数据读取完，当下次epoll_wait返回的时候这个描述符中的数据就再也读取不到了；

LT模式：如果对一个描述符的数据没有读取完成，那么下次当epoll_wait返回的时候会继续触发，也就可以继续获取到这个描述符，从而能够接着读；

网友评论

本文标题：Select poll epoll 区别

本文链接：https://www.haomeiwen.com/subject/dsktlqtx.html

Select poll epoll 区别