1、多路复用的概念解释:
是从知乎上看的觉得解释很到位就贴过来了
下面举一个例子,模拟一个tcp服务器处理30个客户socket。假设你是一个老师,让30个学生解答一道题目,然后检查学生做的是否正确,你有下面几个选择:
- 第一种选择:按顺序逐个检查,先检查A,然后是B,之后是C、D。。。这中间如果有一个学生卡主,全班都会被耽误。这种模式就好比,你用循环挨个处理socket,根本不具有并发能力。
- 第二种选择:你创建30个分身,每个分身检查一个学生的答案是否正确。 这种类似于为每一个用户创建一个进程或者线程处理连接。
- 第三种选择,你站在讲台上等,谁解答完谁举手。这时C、D举手,表示他们解答问题完毕,你下去依次检查C、D的答案,然后继续回到讲台上等。此时E、A又举手,然后去处理E和A。。。 这种就是IO复用模型,Linux下的select、poll和epoll就是干这个的。将用户socket对应的fd注册进epoll,然后epoll帮你监听哪些socket上有消息到达,这样就避免了大量的无用操作。此时的socket应该采用非阻塞模式。这样,整个过程只在调用select、poll、epoll这些调用的时候才会阻塞,收发客户消息是不会阻塞的,整个进程或者线程就被充分利用起来,这就是事件驱动,所谓的reactor模式。
作者:知乎用户
链接:https://www.zhihu.com/question/28594409/answer/52835876
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
2、Select poll epoll 区别
- select poll每次循环调用时,都需要将描述符和文件拷贝到内核空间;epoll 只需要拷贝一次;
对于这种情况对于描述符数量不大还可以,但是当描述符的数量达到十几万甚至上百万的时候,效率就会急速降低,因为每一次轮询
的时候都需要将这些所有的socket文件从用户态拷贝到内核态
,会造成大量的浪费和资源开销; - select每次返回后,都需要遍历所有的描述文件才能找到就绪的,时间复杂度为O(n),而epoll则需要O(1);
- select poll内核是通过内核方式来完成的,时间复杂度O(n);epoll在每个描述文件上设置回调函数,时间复杂度为O(1);
select相比poll没有太大的改进,唯一的区别就是使用链表
来保存fd,使的能监听的数量远远大于1024,但对于将用户数据拷贝到内存空间,线性遍历fd这两个没有太大的改变。
- epoll的底层实现
利用sys_epoll_creat()创建内核时间表,在sys_epoll_creat()里面创建了struct eventpoll结构体,其中包括两个成员:
就绪队列
struct list_head relist, 用来存放有就绪事件的描述符;
红黑树
struct rb_root rbr,作为内核时间表用来收集描述符;
每一个epoll对象都有一个独立的eventpoll结构体,用于存放epoll_ctl 向epoll对象中添加事件,这些事件都会通过ep_insert挂载到红黑树上,这样重复添加的事件就可以通过红黑树而高效的识别出来;
而所有的添加到epoll中都会与驱动程序建立回调关系,当相应的事件发生后, 会通过ep_poll_callback这个回调方法,它会将发生的事件添加到rdlist;
每一次epoll遍历仅仅是这个fd的就绪队列,这个队列的fd全部都是就绪的,甚至这么说,epoll根本没有遍历,只需要判断一下fd就绪队列是否为空,不为空就返回,效率惊人。
总结一下,就是epoll单独搞了一个fd的就绪队列的模式,减少了遍历。
- epoll的工作模式ET和LT
ET模式是高速模式,叫做边缘触发模式,LT模式是默认模式,叫做水平触发模式;
两种工作模式的区别:
ET模式:如果一个描述符上有数据到达,然后读取这个描述符上的数据,如果没有将数据读取完,当下次epoll_wait返回的时候这个描述符中的数据就再也读取不到了;
LT模式:如果对一个描述符的数据没有读取完成,那么下次当epoll_wait返回的时候会继续触发,也就可以继续获取到这个描述符,从而能够接着读;
转自:https://blog.csdn.net/m0_37962600/article/details/81407442
https://blog.csdn.net/qq_27529917/article/details/82945450
网友评论