基本 IO 模型
传统的 CS 网络模型
虚线标识网络连接的建立,实线表示链接建立后的请求/响应。
多线程网络模型
多线程网络模型.jpg缺点:
- 每个链接都需要一个独立线程处理,链接的建立拆除伴随线线程的创建、销毁;
- 网络 IO 延迟导致线程可能多数时间处于阻塞状态;
- 大量建立链接请求到达服务端可能导致服务端创建线程过多;
线程池网络模型
线程池网络模型.jpg多线程网络模型导致的 缺点1,缺点3 可以解决,但本质上是引入池技术解决线上的,并没有从 IO 技术层面解决阻塞问题。
IO 多路复用
对于网络 IO,一个基本操作需要分为两步:
- 等待网络数据分组到达,然后将其复制到内核缓冲区
- 把数据从内核缓冲区复制到应用空间缓冲区
主要的阻塞发生在第一步,而上线的模型中每个链接都需要单独的线程去处理。
如 Redis 这样的单进程应用,如果使用上面的网络模型,当某个网络操作将导致整个 IO 阻塞,其他的网络操作都得不到响应。
事实上 Redis 这类应用使用的是 IO 多路复用网络模型(这里复用指的是复用一个线程去处理多个链接):
构造一个感兴趣的文件描述符集合,然后调用文件函数,直到这些描述符中的一个已准备好进行 IO 时函数返回。poll, pselect 和 select 这三个函数可以帮助我们实现。
select & pselct
select 函数原型:
#include <sys/select.h>
int select(int maxfdp1, fd_set *restrict readfds, fd_set *restrict writefds,
fd_set *restrict exceptfds, struct timeval * restrict tvptr);
传递给 select 函数参数告诉内核:
- 关心的描述符
- 对每个描述符关心的的条件
- 原意等待的的时长
从 select 返回时内核返回:
- 已准备好的描述符总数量
- 对于读、写或异常这3个条件的每一个,哪些描述符已准备好
select 函数的参数含义:
- tvptr:原意等待的事件长度
- readfds, writefds, exceptfds:可读、可写、处于异常条件的描述符集合
- maxfdpl:最大描述符编号加1,用于缩小查找范围
这里需要说明下 fd_set 数据类型,它是一个字节数组,每个文件描述符由一位表示。
pselect 函数最主要的改变是在 select 函数基础上增加了一个 sigmask 参数,用于指向信号屏蔽字
select & pselect 的问题:
- 单个进程所打开的描述符有限制,由FD_SETSIZE设置
- 内核会修改参数,每次调用需要重置
- 每次调用都需要遍历文件描述符
- 用户&内核空间数据拷贝
poll
select 的缺点很大程度是 fd_set 数据结构引入的,因此 poll 与 select 的差异也重点体现在了数据结构的不同。
poll 函数原型:
#include <poll.h>
int poll(struct pollfd fdarray[], nfds_t nfds, int timeout);
与 select 不同,poll 不为每个条件构造字符集,而是构造一个 pollfd 结构的数组:
struct pollfd {
int fd;
short events;
short revents;
}
poll 本质上与 select 相同,但解决了 select 的问题1,2。但对于问题3 并没有解决
epoll
TODO
网友评论