美文网首页计算机基础
Linux的五种IO模型

Linux的五种IO模型

作者: lndyzwdxhs | 来源:发表于2019-01-12 16:09 被阅读14次

    0x01 什么是IO?

    IO模型中,先讨论下什么是IO

    IO在计算机中指的就是Input/Output(输入/输出)。Input/Output(输入/输出)的内容当然就是data(数据)了。

    那么数据被Input到哪,Output到哪呢?

    • Input(输入)数据到内存中,Output(输出)数据到IO设备(磁盘、网络等需要与内存进行数据交互的设备)中;
    • IO设备与内存直接的数据传输通过IO接口,操作系统封装了IO接口,我们编程时可以直接使用

    0x02 阻塞/非阻塞与同步/异步

    阻塞/非阻塞

    针对的对象是调用者自己本身的情况

    ☞ 阻塞

    指调用者在调用某一个函数后,一直在等待该函数的返回值,线程处于挂起状态。

    ☞ 非阻塞

    指调用者在调用某一个函数后,不等待该函数的返回值,线程继续运行其他程序(执行其他操作或者一直遍历该函数是否返回了值)

    同步/异步

    针对的对象是被调用者的情况

    ☞ 同步

    指的是被调用者在被调用后,操作完函数所包含的所有动作后,再返回返回值

    ☞ 异步

    指的是被调用者在被调用后,先返回返回值,然后再进行函数所包含的其他动作。

    0x03 五种IO模型

    recvfrom/recv都是操作系统的内核函数,用于从(已连接)socket上接收数据,并捕获数据发送源的地址。

    recv函数原型:ssize_t recv(int sockfd, void *buff, size_t nbytes, int flags)

    • sockfd:接收端套接字描述符
    • buff:用来存放recv函数接收到的数据的缓冲区
    • nbytes:指明buff的长度
    • flags:一般置为0

    阻塞IO(BIO)

    BIO程序流

    recv函数默认是阻塞的,直到对方socket发送过来的数据被填充到用户提供的接收缓冲区(buff参数)之后,才解除阻塞。

    对方socket发送过来的数据最先到达内核空间的缓冲区,然后从内核空间拷贝到用户空间提供的接收缓冲区(buff),以供用户态程序使用。

    从等待对方发送数据到接收数据,并把数据从内核空间复制到用户空间的这段时间,recv函数都是阻塞的

    非阻塞IO

    非阻塞IO程序流

    可用fcntl函数设置recv为非阻塞方式。

    设置为非阻塞模式后,即使没有数据到来,recv函数也不会阻塞,而是立即返回-1,错误代码为EWOULDBLOCK。为了得到对方发送的数据,只能不停的判断recv返回值是否为-1,以及返回码是否为EWOULDBLOCK,直到数据到来,然后把数据从内核空间复制到用户态空间,复制完成后recv函数返回。

    非阻塞IO模型的应用范围较窄,因为当数据没有到来时需要不断的循环测试recv的返回值和返回码,这会消耗CPU资源,于是把这种循环测试称作忙等待。换句话说就是这种模型没啥用。

    IO多路复用

    IO多路复用程序流

    这种模型其实和BIO是一模一样的,都是阻塞的,只不过在socket上加了一层代理selectselect可以通过监控多个socekt是否有数据,通过这种方式来提高性能。

    一旦检测到一个或多个文件描述有数据到来,select函数就返回,这时再调用recv函数就不会阻塞了,数据从内核空间拷贝到用户空间,recv函数返回。

    信号驱动IO

    信号驱动IO程序流

    在用户态程序安装SIGIO信号处理函数(用sigaction函数或者signal函数来安装自定义的信号处理函数),即recv函数。然后用户态程序可以执行其他操作不会被阻塞。

    一旦有数据到来,操作系统以信号的方式来通知用户态程序,用户态程序跳转到自定义的信号处理函数。

    在信号处理函数中调用recv函数,接收数据。数据从内核空间拷贝到用户态空间后,recv函数返回。recv函数不会因为等待数据到来而阻塞。

    这种方式使异步处理成为可能,信号是异步处理的基础

    异步IO

    异步IO程序流

    异步IO的效率是最高的

    异步IO通过aio_read函数实现,aio_read提交请求,并递交一个用户态空间下的缓冲区。即使内核中没有数据到来,aio_read函数也立刻返回,应用程序就可以处理其他的事情。

    当数据到来后,操作系统自动把数据从内核空间拷贝到aio_read函数递交的用户态缓冲区。拷贝完成以信号的方式通知用户态程序,用户态程序拿到数据后就可以执行后续操作。

    异步IO和信号驱动IO的不同?

    在于信号通知用户态程序时数据所处的位置。异步IO已经把数据从内核空间拷贝到用户空间了;而信号驱动IO的数据还在内核空间,等着recv函数把数据拷贝到用户态空间。

    异步IO主动把数据拷贝到用户态空间,主动推送数据到用户态空间,不需要调用recv方法把数据从内核空间拉取到用户态空间。异步IO是一种推数据的机制,相比于信号处理IO拉数据的机制效率更高。

    推数据是直接完成的,而拉数据是需要调用recv函数,调用函数会产生额外的开销,故效率低。


    欢迎关注微信公众号(coder0x00)或扫描下方二维码关注,我们将持续搜寻程序员必备基础技能包提供给大家。


    相关文章

      网友评论

        本文标题:Linux的五种IO模型

        本文链接:https://www.haomeiwen.com/subject/hkkcdqtx.html