Java 5种IO模型

作者: 三丶斤 | 来源:发表于2019-07-09 14:46 被阅读0次

Java中的IO模型
Java BIO与NIO
详解IO复用模型select，poll，epoll机制
Java知识梳理三
Java IO 模型
01-IO模型-BIO、NIO、AIO
1.Netty基本-io模式，线程模型，Reactor模式都啥呀
反应器模型Reactor的实现
Java的BIO,NIO和AIO的区别于演进
Netty 权威指南笔记（一）：网络 I/O 模型和 Java

看了很多的博客，让我感觉精神一振的还是这篇：
https://blog.csdn.net/historyasamirror/article/details/5778378

我们先来说一下我们在使用BIO socket编程时候调用socket.read()方法时整体的执行流程：

1.程序调用socket.read()，这个方法会调用一个native read()方法，所以最终是由 OS执行read
2.OS得到read指令，命令网卡读取数据。
3.网卡读取数据完成后，将数据传递给内核。
4.内核把读取的数据拷贝的用户空间。
5.程序解除阻塞，完成read函数。

其实阻塞就是程序获得了CPU的资源，但是它就在那里干等着什么也不干。说白了就是占着茅坑不拉屎。

1. IO Model

Stevens在文章中一共比较了五种IO Model：

Blocking IO
Non-Blocking IO
IO multiplexing
Signal driven IO
Asynchronous IO
其中Signal driven IO实际使用不多，我也没有仔细了解。

1.1 Blocking IO

Blocking IO是我们一开始学习Java都使用过的BIO编程方式，在jdk1.4之前， NIO没有出，Java IO编程只有这一个方式。它的调用过程：

image

我们开头举得例子就是这个图，socket.read()会调用native read(),而Java中的native方法会调用底层的dll，而dll是C/C++编写的，图中的recvfrom其实是C语言socket编程中的一个方法。所以其实我们在Java中调用socket.read()最后也会调用到图中的recvfrom方法。

解释一下图含义：
应用程序(也就是我们的代码)想要读取数据就会调用recvfrom,而recvfrom会通知OS来执行，OS就会判断数据报是否准备好(比如判断是否收到了一个完整的UDP报文，如果收到UDP报文不完整，那么就继续等待)。当数据包准备好了之后，OS就会将数据从内核空间拷贝到用户空间(因为我们的用户程序只能获取用户空间的内存，无法直接获取内核空间的内存)。拷贝完成之后socket,read()就会解除阻塞，并得到read的结果。

在BIO中我们称作的阻塞，也就是阻塞在2个地方：

OS等待数据报准备好。
将数据从内核空间拷贝到用户空间。

在这2个时候，我们的BIO程序就是占着茅坑不拉屎，啥事情都不干。

1.2 Non-Blocking IO

直接上图：

image

NIO就是采用这种方式，当我们new了一个socket后我们可以设置它是非阻塞的。比如：

// 初始化一个 serverSocketChannel
serverSocketChannel = ServerSocketChannel.open();
serverSocketChannel.bind(new InetSocketAddress(8000));
// 设置serverSocketChannel为非阻塞模式
// 即 accept()会立即得到返回
serverSocketChannel.configureBlocking(false);

上面的代码是设置ServerSocketChannel为非阻塞，SocketChannel也是可以设置。NIO中提供了集中Channel(没有举例完，可能还有其他的Channel)：

ServerSocketChannel
SocketChannel
FileChannel
DatagramChannel
只有FileChannel无法设置成非阻塞模式，其他Channel都可以设置为非阻塞模式。

从图中我们可以看到，当我设置非阻塞后，我们的socket.read()方法就会立即得到一个返回结果(成功 or 失败)，我们可以根据返回结果执行不同的逻辑，比如在失败时，我们可以做一些其他的事情。但事实上这种方式也是低效的，因为我们不得不使用轮询方法区一直问OS：“我的数据好了没啊”。

BIO 不会在recvfrom也就是socket.read()时候阻塞，但是还是会在将数据从内核空间拷贝到用户空间阻塞。一定要注意这个地方，Non-Blocking还是会阻塞的。

1.3 IO Multiplex

image

IO Multiplex即IO多路复用，我通信工程专业，看到这个我就想到了信道复用技术：时分复用，频分复用，码分复用。我是这样理解IO多路复用：传统情况下client与server通信需要一个3个socket(client的socket，server监听client连接的socket，即serversocket，还有一个server中用来和client通信的socket)，而在IO多路复用中，client与server通信需要的不是socket，而是3个channel，通过channel可以完成与socket同样的操作，channel的底层还是使用的socket进行通信，但是多个channel只对应一个socket(可能不只是一个，但是socket的数量一定少于channel数量)，这样仅仅通过少量的socket就可以完成更多的连接，提高了client容量。

不同的操作系统有不同的实现：

Windows：selector
Linux：epoll
Mac：kqueue
其中epoll，kqueue比selector更为高效，这是因为他们监听方式的不同。selector的监听是通过轮询FD_SETSIZE来问每一个socket：“你改变了吗？”，假若监听到时间，那么selector就会调用相应的时间处理器进行处理。但是epoll与kqueue不同，他们把socket与事件绑定在一起，当监听到socket变化时，立即可以调用相应的处理。

selector，epoll，kqueue都属于Reactor IO设计。关于 Reactor与Proactor，可以看：
IO 模式 Reactor与Proactor

1.4 Signal driven IO

image

1.5 Asynchronous IO

Asynchronous IO异步IO。

image

Asynchronous IO调用中是真正的无阻塞，其他IO model中多少会有点阻塞。程序发起read操作之后，立刻就可以开始去做其它的事。而在内核角度，当它受到一个asynchronous read之后，首先它会立刻返回，所以不会对用户进程产生任何block。然后，kernel会等待数据准备完成，然后将数据拷贝到用户内存，当这一切都完成之后，kernel会给用户进程发送一个signal，告诉它read操作完成了。

我们思考一下问题

Blocking IO 与Non-Blocking IO 区别？

阻塞或非阻塞只涉及程序和OS，Blocking IO 会一直block程序知道OS返回，而Non-Block IO在OS内核在准备数据包的情况下会立即得到返回。

Asynchronous IO 与 Synchronous IO？

根据POSIX定义同步与非同步：

A synchronous I/O operation causes the requesting process to be blocked until that I/O operation completes;
An asynchronous I/O operation does not cause the requesting process to be blocked;
我们可以理解为只要有block就是同步IO，完全没有block则是异步IO。所以我们之前所说的

Blocking IO
Non-Blocking IO
IO Multiplex

均为Synchronous IO，只有Asynchronous IO为异步IO。

Non-Blocking IO 不是会立即返回没有阻塞吗?

Non-Blocking IO在数据包准备时是非阻塞的，但是在将数据从内核空间拷贝的用户空间还是会阻塞。而Asynchronous IO则不一样，当进程发起IO 操作之后，就直接返回再也不理睬了，由内核完成读写，完成读写操作后kernel发送一个信号，告诉进程说IO完成。在这整个过程中，进程完全没有被block。

2.各种IO对比

2.png

四种IO举例：

有A，B，C，D四个人在钓鱼：
A用的是最老式的鱼竿，所以呢，得一直守着，等到鱼上钩了再拉杆；
B的鱼竿有个功能，能够显示是否有鱼上钩，所以呢，B就和旁边的MM聊天，隔会再看看有没有鱼上钩，有的话就迅速拉杆；
C用的鱼竿和B差不多，但他想了一个好办法，就是同时放好几根鱼竿，然后守在旁边，一旦有显示说鱼上钩了，它就将对应的鱼竿拉起来；
D是个有钱人，干脆雇了一个人帮他钓鱼，一旦那个人把鱼钓上来了，就给D发个短信。

3. 参考博客

IO - 同步，异步，阻塞，非阻塞（亡羊补牢篇）

Java中的IO模型
Java中的IO模型 Java中的IO模型有四种：同步阻塞IO 同步非阻塞IO IO多路复用异步IO 其中IO...
Java BIO与NIO
网络IO模型为了弄清JavaBIO（传统的 java.io 包）和NIO（Java 1.4 引入的 java.n...
详解IO复用模型select，poll，epoll机制
在Java中，主要有三种IO模型，分别是阻塞IO（BIO）、非阻塞IO（NIO）和异步IO（AIO）。Java中...
Java知识梳理三
一、Java中的IO 1.IO的概述 Java IO方式有很多种，基于不同的IO抽象模型和交互方式，可以进行...
Java IO 模型
五大IO模型 Blocking IO Non-Blocking IO I/O multiplexing (sele...
01-IO模型-BIO、NIO、AIO
IO模型在学习netty之前，需要对JAVA的io模型进行一个了解，因为netty就是基于NIO进行封装的，io...
1.Netty基本-io模式，线程模型，Reactor模式都啥呀
关于IO模式，线程模型？ Java的io模型分为三种，（BIO,NIO,AIO），Netty现在主要推荐的（NIO...
反应器模型Reactor的实现
Reactor模型有关Reactor模型结构，可以参考Doug Lea在 Scalable IO in Java...
Java的BIO,NIO和AIO的区别于演进
前言 Java里面的IO模型种类较多，主要包括BIO，NIO和AIO，每个IO模型都有不一样的地方，那么这些IO模...
Netty 权威指南笔记（一）：网络 I/O 模型和 Java
Netty 权威指南笔记（一）：网络 I/O 模型和 Java IO 入门 Java I/O 模型的实现离不开底层...