Java io的接口经过了多次迭代,现在主要分为三部分,即java IO (since JDK1.0),java NIO(since JDK1.4),java NIO2(since JDK1.7)。
那么java为什么要将IO的接口分成这三部分呢,这三部分的接口又有什么不同呢?
它们背后的底层原理是什么,要怎么样理解才比较好呢?常常听到的阻塞,非阻塞,同步,异步的概念,到底它们是什么,之间有什么区别?
本文将试着根据相关的文档,用自己的语言来解释这些问题,希望对你有所启发。
一 涉及的对象
1) 用户进程和操作系统内核
Java 中的IO可以理解为是在Java程序和操作系统内核两个对象之间进行的。
后面所说的阻塞和非阻塞,同步和异步都是这两个对象相互作用的结果。在本文中,用户进程指的就是Java程序。
2) 程序空间和内核空间
Waiting for the data to be ready(等待数据到达内核缓冲区)
Copying the data from the kernel to the process(从内核缓冲区拷贝数据到程序缓冲区)
在Linux中,对于一次读取IO的操作,数据并不会直接拷贝到程序的程序缓冲区。
它首先会被拷贝到操作系统内核的缓冲区中,然后才会从操作系统内核的缓冲区拷贝到应用程序的缓冲区。
程序空间:分配给用户程序的内存空间。
内核空间:内核拥有的内存空间。
3) 阻塞和非阻塞
阻塞:用户进程进行系统调用后,用户进程一直处于锁定的状态,不能进行其他操作
非阻塞:用户进程进行系统调用后,用户进程没有被锁定,可以进行其他操作
阻塞和非阻塞说的是用户进程的状态,即用户进程是否被锁定
4) 同步和异步
A synchronous I/O operation causes the requesting process to be blocked until that I/O operation completes.
An asynchronous I/O operation does not cause the requesting process to be blocked.
一个同步的io操作会导致发起请求的进程阻塞直到这个io操作完成。一个异步的io操作不会导致请求的线程被阻塞。
同步:用户线程和io线程做同一件事(用户线程被阻塞,等待内核返回处理结果)
异步:用户线程和io线程做不同的事情(用户线程不被阻塞,做其他的事情,内核处理完成发送结果给用户线程)
5) 文件描述符
在Linux下面一切皆文件。文件描述符(file descriptor)是内核为文件所创建的索引,所有I/O操作都通过调用文件描述符(索引)来执行,包括下面我们要提到的socket。Linux刚启动的时候会自动设置0是标准输入,1是标准输出,2是标准错误。
二 uninx五种IO模型
1) blocking IO(阻塞IO)
blocking-IO.png调用过程:
-
用户进程调用一个recvfrom请求,内核收到这个请求之后没有立即返回,而是首先等待数据到达。
-
等数据到达之后,再进行数据拷贝,将数据从内核缓存区拷贝到用户进程缓存区,拷贝完成后返回给进程ok的消息。
上面整个过程都是阻塞的。
2) nonblocking IO(非阻塞IO)
noblocking-IO.png调用过程:
-
用户进程调用一个recvfrom请求,内核收到这个请求之后立即返回数据没有到达的消息。
-
用户进程收到消息后继续发送recvfrom请求,如果数据仍没有到达,内核继续返回没有到达的消息。
-
如此循环,直到数据到达内核。然后内核将收到的数据从内核缓存区拷贝到用户进程缓存区,拷贝完成后返回给进程ok的消息。
上面整个过程都是阻塞的。
3) IO multiplexing(IO复用) (select/poll/epoll)
IO-multiplexing.png调用过程:
-
用户进程通过调用select或poll或epoll去查询多个文件描述符的状态。
-
如果有一个文件描述符准备好了,内核就返回该文件描述符可读的消息。
-
用户进程调用一个recvfrom请求,内核收到请求后开始拷贝数据,将数据从内核缓存区拷贝到用户进程缓存区,拷贝完成后返回给进程ok的消息。
上面整个过程都是阻塞的。
- signal driven IO(信号驱动IO)
调用过程:
-
设置socket为一个信号驱动IO,并且通过sigaction system call安装一个signal handler。
-
数据准备好以后,一个SIGIO信号传送给用户进程通知数据已经准备好。
-
然后用户进程调用一个recvfrom请求,内核收到请求后开始拷贝数据,将数据从内核缓存区拷贝到用户进程缓存区,拷贝完成后返回给进程ok的消息。
步骤1因为是瞬时完成的,可以认为是非阻塞的。步骤2,3是阻塞的。
- asynchronous IO(异步IO)
调用过程:
-
用户进程发送一个aio_read的系统调用,内核立即返回响应。
-
用户进程收到响应,可以继续做自己的事(非阻塞)。
-
内核等待数据到达,完成数据拷贝后,发送消息给用户进程。
上面整个过程都是非阻塞的。
三 windowsIO模型
windwos IO模型感觉和linuxIO模型相似,感兴趣的同学可以看看这个
ps: 本文的图和英文引用部分来自参考文档3.中文引用部分来自文档1(参考文档写的比我好,建议大家多看看 :))
参考文档:
网友评论