美文网首页计算机基础
Linux的五种IO模型

Linux的五种IO模型

作者: lndyzwdxhs | 来源:发表于2019-01-12 16:09 被阅读14次

0x01 什么是IO?

IO模型中,先讨论下什么是IO

IO在计算机中指的就是Input/Output(输入/输出)。Input/Output(输入/输出)的内容当然就是data(数据)了。

那么数据被Input到哪,Output到哪呢?

  • Input(输入)数据到内存中,Output(输出)数据到IO设备(磁盘、网络等需要与内存进行数据交互的设备)中;
  • IO设备与内存直接的数据传输通过IO接口,操作系统封装了IO接口,我们编程时可以直接使用

0x02 阻塞/非阻塞与同步/异步

阻塞/非阻塞

针对的对象是调用者自己本身的情况

☞ 阻塞

指调用者在调用某一个函数后,一直在等待该函数的返回值,线程处于挂起状态。

☞ 非阻塞

指调用者在调用某一个函数后,不等待该函数的返回值,线程继续运行其他程序(执行其他操作或者一直遍历该函数是否返回了值)

同步/异步

针对的对象是被调用者的情况

☞ 同步

指的是被调用者在被调用后,操作完函数所包含的所有动作后,再返回返回值

☞ 异步

指的是被调用者在被调用后,先返回返回值,然后再进行函数所包含的其他动作。

0x03 五种IO模型

recvfrom/recv都是操作系统的内核函数,用于从(已连接)socket上接收数据,并捕获数据发送源的地址。

recv函数原型:ssize_t recv(int sockfd, void *buff, size_t nbytes, int flags)

  • sockfd:接收端套接字描述符
  • buff:用来存放recv函数接收到的数据的缓冲区
  • nbytes:指明buff的长度
  • flags:一般置为0

阻塞IO(BIO)

BIO程序流

recv函数默认是阻塞的,直到对方socket发送过来的数据被填充到用户提供的接收缓冲区(buff参数)之后,才解除阻塞。

对方socket发送过来的数据最先到达内核空间的缓冲区,然后从内核空间拷贝到用户空间提供的接收缓冲区(buff),以供用户态程序使用。

从等待对方发送数据到接收数据,并把数据从内核空间复制到用户空间的这段时间,recv函数都是阻塞的

非阻塞IO

非阻塞IO程序流

可用fcntl函数设置recv为非阻塞方式。

设置为非阻塞模式后,即使没有数据到来,recv函数也不会阻塞,而是立即返回-1,错误代码为EWOULDBLOCK。为了得到对方发送的数据,只能不停的判断recv返回值是否为-1,以及返回码是否为EWOULDBLOCK,直到数据到来,然后把数据从内核空间复制到用户态空间,复制完成后recv函数返回。

非阻塞IO模型的应用范围较窄,因为当数据没有到来时需要不断的循环测试recv的返回值和返回码,这会消耗CPU资源,于是把这种循环测试称作忙等待。换句话说就是这种模型没啥用。

IO多路复用

IO多路复用程序流

这种模型其实和BIO是一模一样的,都是阻塞的,只不过在socket上加了一层代理selectselect可以通过监控多个socekt是否有数据,通过这种方式来提高性能。

一旦检测到一个或多个文件描述有数据到来,select函数就返回,这时再调用recv函数就不会阻塞了,数据从内核空间拷贝到用户空间,recv函数返回。

信号驱动IO

信号驱动IO程序流

在用户态程序安装SIGIO信号处理函数(用sigaction函数或者signal函数来安装自定义的信号处理函数),即recv函数。然后用户态程序可以执行其他操作不会被阻塞。

一旦有数据到来,操作系统以信号的方式来通知用户态程序,用户态程序跳转到自定义的信号处理函数。

在信号处理函数中调用recv函数,接收数据。数据从内核空间拷贝到用户态空间后,recv函数返回。recv函数不会因为等待数据到来而阻塞。

这种方式使异步处理成为可能,信号是异步处理的基础

异步IO

异步IO程序流

异步IO的效率是最高的

异步IO通过aio_read函数实现,aio_read提交请求,并递交一个用户态空间下的缓冲区。即使内核中没有数据到来,aio_read函数也立刻返回,应用程序就可以处理其他的事情。

当数据到来后,操作系统自动把数据从内核空间拷贝到aio_read函数递交的用户态缓冲区。拷贝完成以信号的方式通知用户态程序,用户态程序拿到数据后就可以执行后续操作。

异步IO和信号驱动IO的不同?

在于信号通知用户态程序时数据所处的位置。异步IO已经把数据从内核空间拷贝到用户空间了;而信号驱动IO的数据还在内核空间,等着recv函数把数据拷贝到用户态空间。

异步IO主动把数据拷贝到用户态空间,主动推送数据到用户态空间,不需要调用recv方法把数据从内核空间拉取到用户态空间。异步IO是一种推数据的机制,相比于信号处理IO拉数据的机制效率更高。

推数据是直接完成的,而拉数据是需要调用recv函数,调用函数会产生额外的开销,故效率低。


欢迎关注微信公众号(coder0x00)或扫描下方二维码关注,我们将持续搜寻程序员必备基础技能包提供给大家。


相关文章

  • 1.Nette入门第一章——IO演进

    1. IO 基础 1.1. linux网络IO模型 阻塞IO模型 非阻塞IO模型 IO多路复用模型(NIO) 信...

  • 2、Linux IO模型

    下图是Linux处理IO调用的流程图: Linux IO模型分为5种: 阻塞IO 非阻塞IO IO复用 事件驱动I...

  • 2018-07-03

    Netty实践与NIO原理 一、阻塞IO与非阻塞IO Linux网络IO模型(5种) (1)阻塞IO模型 所有文件...

  • 高并发服务器IO模型

    高并发服务器 IO 模型一、 什么是 IO?二、 IO 的 5 种模型三、Linux 并发网络编程模型四、sele...

  • Linux IO模型

    Linux IO模型 网络IO的本质就是socket的读取,socket在linux系统被抽象为流,IO可以理解为...

  • 【Netty开发指南】搭稳Netty开发的地基

    Linux网络编程5种IO模型 根据UNIX网络编程对于IO模型的分类,UNIX提供了5种IO模型,分别是 阻塞I...

  • linux select/epoll

    一、Unix/Linux网络IO模型在经典的Unix网络编程中,总结出了5种不同的网络IO模型,分别是阻塞式IO,...

  • Linux IO模型

    po门 一、基础概念 1.内存分类 内存分为两部分,一部分分给内核使用,另一部分分给用户使用。为什么要这么划分,因...

  • Linux IO模型

    1、概念说明 1.1、用户空间与内核空间 现在操作系统都是采用虚拟存储器,那么对32位操作系统而言,它的寻址空间(...

  • Linux IO模型

    Linux下一切皆文件,连外部设备都当作文件;对文件的读写操作会调用内核系统命令,返回文件描述符,简称fd;而对s...

网友评论

    本文标题:Linux的五种IO模型

    本文链接:https://www.haomeiwen.com/subject/hkkcdqtx.html