之前看《UNIX网络编程》时,对于Linux IO 模式的理解总觉得不够彻底。最近借着看spp源码的机会,对这部分知识进行了相关梳理。以下讨论内容的背景是Linux环境下的网络IO。
网络IO:网络IO涉及网络上数据的传输,其显著特点是IO的时延比较大。一次网络IO过程(read 操作)通常可分解为俩个操作过程,1、等待数据准备就绪(填充内核缓存) 2、将数据从内核拷贝到用户进程空间
阻塞和非阻塞:正在执行的进程,由于期待某些事情的发送,而无法继续工作的时候,自动执行系统阻塞原语,使自己处于阻塞状态。进程进入阻塞状态是不占用CPU资源。阻塞和非阻塞是针对当数据没有准备好的时候【步骤1】,进程采取的策略。
同步和异步:同步是指进程进行IO 操作的时候会阻塞(这里的阻塞特指当数据准备好的情况下,进程一定会等数据拷贝完成后再进行后续执行流。这里的IO操作特指将数据从内核拷贝到用户进程);异步是指当进程发起IO操作后,就直接返回了,直到kernel发送信号告诉进程IO完成了,这种模式,进程在整个过程中完全没有被阻塞。同步和异步是针对当数据从内核拷贝的用户空间这段时间内【步骤2】,进程采取的策略。
正因为网络IO操作需要经历两个阶段,linux系统区分了下面五种网络模型。
阻塞IO
阻塞IO的操作流程如下图:
阻塞模式的特点是:直到数据准备好,阻塞步骤1; 直到数据拷贝完成,阻塞步骤2;
非阻塞IO
非阻塞IO的操作流程如下图:
非阻塞模式的特点是:如果数据没有准备好则返回,不阻塞步骤1; 直到数据拷贝完成,阻塞步骤2;(由于不阻塞步骤1,因此需要用户进程不断主动询问kernel数据是否准备好了)
IO多路复用
IO多路复用的操作流程如下图:
IO多路复用的特点是:直到数据准备好(多路中,只要有一路准备好就算是有数据),阻塞步骤1;直到数据拷贝完成,阻塞步骤2;和阻塞IO不同地地方在于:1、IO多路复用步骤1在代理系统调用处阻塞(select,epoll等)而不是read系统调用处阻塞 2、IO多路复用同时监控多路,只要有一路数据准备完毕,其代理系统调用就返回。
信号驱动IO
信号驱动IO的操作流程如下:
信号驱动IO的主要特点是: 预先告知内核当某个socket有数据的时候通知进程,不阻塞步骤1;用户进程读取数据,阻塞步骤2.
异步IO
异步IO的操作流程如下:
异步操作的特点是: 调用后马上返回,不阻塞步骤1,不阻塞步骤2; 内核完成步骤1和步骤2后给用户进程发送signal,告诉用户进程read操作完成了。
所以,阻塞、非阻塞、IO多路复用模式、信号驱动IO都是同步模式; 只有异步IO模式是异步。判断阻塞、非阻塞看步骤1是否会被阻塞;判断同步和异步,看步骤2是否会被阻塞。
网友评论