概述

I/O，即输入/输出(Input/Output)。用户程序进行IO操作并不是直接操作硬件设备进行读写，而是通过调用操作系统提供的函数，真正的IO操作是由操作系统内核来完成的。在进行IO操作时CPU会从用户态切换为内核态，而操作结束后又需要从内核态切换为用户态，频繁的状态切换会使 CPU将大量时间耗费在寄存器、内核栈以及虚拟内存等资源的保存和恢复上，从而影响程序运行效率。此外，除了系统调用产生的CPU上下文切换，线程上下文切换也面临着该问题。

内核空间与用户空间

为了保护操作系统安全，操作系统按照特权等级将将虚拟空间划分为两个部分，内核空间与用户空间。内核空间（Ring 0）是操作系统内核访问的区域，具有最高权限，可以直接访问所有资源。用户空间（Ring 3）是普通应用程序可访问的内存区域，只能访问受限资源，不能直接访问内存等硬件设备，必须通过系统调用陷入到内核中，才能访问这些特权资源。只能访问用户空间也就是运行在Ring 3上的程序我们称为用户程序，而运行在Ring 0上的程序我们称为内核程序。

内核态与用户态

用户程序不能访问内核空间，如果想要调用内核程序进行IO操作，必须从用户态切换为内核态，等到内核处理完之后再切换为用户态。

内核态：处理器处于特权级最高的（Ring 0）内核代码中执行。当进程处于内核态时，执行的内核代码会使用当前进程的内核栈。每个进程都有自己的内核栈。
用户态：此时处理器在特权级最低的（Ring 3）用户代码中运行。当正在执行用户程序而突然被中断程序中断时，此时用户程序也可以象征性地称为处于进程的内核态。因为中断处理程序将使用当前进程的内核栈。

用户程序进行IO操作时需要进行两次状态切换：用户态->内核态->用户态，具体流程如下：

用户态程序将一些数据值放在寄存器中，或者使用参数创建一个堆栈(stack frame)，以此表明需要操作系统提供的服务
用户态程序执行陷阱指令
CPU切换到内核态，并跳到位于内存指定位置的指令，这些指令是操作系统的一部分, 他们具有内存保护，不可被用户态程序访问
这些指令称之为陷阱(trap)或者系统调用处理器(system call handler)，他们会读取程序放入内存的数据参数，并执行程序请求的服务
系统调用完成后，操作系统会重置CPU为用户态并返回系统调用的结果

内核缓冲区与用户缓冲区

用户程序每进行一次系统调用都会进行两次状态切换，频繁的状态切换会影响程序运行效率，缓冲区的作用就是为了减少系统调用。缓冲区分为两种：内核缓冲区与用户缓冲区：

内核缓冲区：用户进程要从磁盘读取数据时，内核一般不直接读磁盘，而是将内核缓冲区中的数据拷贝到进程缓冲区中，如果内核缓冲区中没有数据时，则先将数据从磁盘拷贝到内核缓冲区，然后再将内核缓冲区的数据拷贝到进程缓冲区
用户缓冲区：为了减少系统调用次数，从而降低操作系统在用户态与核心态切换所耗费的时间，用户程序从磁盘拷贝数据的时候可以先申请一块内存空间，每次进行系统调用读取数据时将数据写入该内存空间，之后程序从该内存空间读取数据进行处理，等到该空间数据处理完再发起系统调用

IO读写流程

用户程序进行IO读写操作会发起系统调用，操作系统内核将磁盘数据读取到内核缓冲区，然后从内核缓冲区拷贝到用户缓冲区，流程如下：

零拷贝

是指计算机执行操作时，CPU不需要先将数据从某处内存复制到另一个特定区域。这种技术通常用于通过网络传输文件时节省CPU周期和内存带宽。若采用零拷贝技术，则能极大地增强了特定应用程序的性能，并更有效地利用系统资源。通过使CPU得以完成其他而非将机器中的数据复制到另一处的任务，性能也得到了增强。另外，零拷贝操作减少了在用户空间与内核空间之间切换模式的次数。

举例来说，如果要读取一个文件并通过网络发送它，传统方式下每个读/写周期都需要复制两次数据和切换两次上下文，而数据的复制都需要依靠CPU。通过零复制技术完成相同的操作，上下文切换减少到两次，并且不需要CPU复制数据。

不使用零拷贝

不适用零拷贝需要经历四次数据拷贝+三次状态切换

mmap + write

mmap + write方式减少了一次CPU拷贝

sendfile

sendfile方式不涉及CPU拷贝

IO模型

在讲解IO模型前，先了解下几个概念：阻塞与非阻塞、同步与异步：

阻塞与非阻塞：用户进程发起系统调用，此时如果内核缓冲区中没有数据，则需要将数据从磁盘拷贝到内核缓冲区，这个过程称之为数据准备，阻塞与非阻塞的区别就是：用户进程是否等待数据数据准备完成。阻塞：用户进程在这个过程中一直阻塞，直至数据准备完成，并且数据从内核缓冲区拷贝到用户缓冲区成功；非阻塞：用户进程发起系统调用，不等数据准备完成，内核立即返回一个标志信息。
同步与异步：同步与异步的区别是：用户进程发起系统调用，需不需要等待成功结果。同步：需要等待结果；异步：不需要等待结果，由内核处理完成后通知结果。

阻塞IO

用户进程发起系统调用，如果数据还未准备完成，用户进程一直等待，直到数据准备完成，从内核缓冲区拷贝到用户缓冲区才返回成功提示，此次IO操作，称之为阻塞IO。缺点：如果数据没有准备好，则用户进程一直处于阻塞状态，如果想要同时处理很多请求，则需要为每个请求分配线程进行处理，系统开销较大。