RandomAccessFile 与内存映射文件

作者: Herman7z | 来源:发表于2018-03-22 14:28 被阅读0次

RandomAccessFile 与内存映射文件
25用户态内存映射
mmap 一定比普通读写快吗？
页交换文件与内存映射文件
Eclipse下以Jetty运行时锁定文件解决办法
【Java难点攻克】「NIO和内存映射性能提升系列」彻底透析NI
mmap 一定比普通读写快吗？[v2]
java nio学习笔记（2）之内存映射文件
APP优化 —— MMAP内存映射
mmap原理

RandomAccessFile是用来访问那些保存数据记录的文件的
RandomAccessFile是用来访问那些保存数据记录的文件的，你就可以用seek( )方法来访问记录，并进行读写了。这些记录的大小不必相同；但是其大小和位置必须是可知的。但是该类仅限于操作文件。
RandomAccessFile不属于InputStream和OutputStream类系的。实际上，除了实现DataInput和DataOutput接口之外(DataInputStream和DataOutputStream也实现了这两个接口)，它和这两个类系毫不相干，甚至不使用InputStream和OutputStream类中已经存在的任何功能；它是一个完全独立的类，所有方法(绝大多数都只属于它自己)都是从零开始写的。这可能是因为RandomAccessFile能在文件里面前后移动，所以它的行为与其它的I/O类有些根本性的不同。总而言之，它是一个直接继承Object的，独立的类。
基本上，RandomAccessFile的工作方式是，把DataInputStream和DataOutputStream结合起来，再加上它自己的一些方法，比如定位用的getFilePointer( )，在文件里移动用的seek( )，以及判断文件大小的length( )、skipBytes()跳过多少字节数。此外，它的构造函数还要一个表示以只读方式(“r”)，还是以读写方式(“rw”)打开文件的参数 (和C的fopen( )一模一样)。它不支持只写文件。
只有RandomAccessFile才有seek搜寻方法，而这个方法也只适用于文件。BufferedInputStream有一个mark( )方法，你可以用它来设定标记(把结果保存在一个内部变量里)，然后再调用reset( )返回这个位置，但是它的功能太弱了，而且也不怎么实用。
在使用RandomAccessFile的时候，你必须清楚文件的排版，才能正确的操作它
RandomAccessFile的绝大多数功能，但不是全部，已经被JDK 1.4的nio的”内存映射文件(memory-mapped files)”给取代了，你该考虑一下是不是用”内存映射文件”来代替RandomAccessFile了。
Java中使用内存映射文件（Memory Mapped File）或者MappedByteBuffer
尽管从JDK 1.4版本开始，Java内存映射文件（Memory Mapped Files）就已经在java.nio包中，但它对很多程序开发者来说仍然是一个相当新的概念。引入NIO后，Java IO已经相当快，而且内存映射文件提供了Java有可能达到的最快IO操作，这也是为什么那些高性能Java应用应该使用内存映射文件来持久化数据。这在一些交易非常频繁的场合已经应用得很多，这些场合要求电子交易系统必须非常快速，单向时延要小于毫秒级。IO一直是那些高性能系统的一个主要关注点，内存映射文件允许你使用direct或者non-direct 字节缓存（Byte buffer）来直接读写内存。内存映射文件的一个关键优势是操作系统负责真正的读写，即使你的程序在刚刚写入内存后就挂了，操作系统仍然会将内存中的数据写入文件系统。另外一个更突出的优势是共享内存，内存映射文件可以被多个进程同时访问，起到一种低时延共享内存的作用。

什么是Java内存映射文件/IO

内存映射文件是一种允许Java程序直接从内存访问的特殊文件。通过将整个文件或者文件的一部分映射到内存中、操作系统负责获取页面请求和写入文件，应用程序就只需要处理内存数据，这样可以实现非常快速的IO操作。用于内存映射文件的内存在Java的堆空间以外。Java中的java.nio包支持内存映射文件，可以使用MappedByteBuffer来读写内存。

内存映射文件的优缺点

可能内存映射IO的主要优势是性能，内存映射文件比通过普通的IO来访问文件要快，这对于繁忙的电子交易系统来说非常重要。内存映射IO另外一个优势是能够加载普通方式无法访问的大文件，实验表明内存映射IO在大文件处理中表现得更好；但缺点是有增加页面错误（page fault）的可能，因为操作系统仅仅加载一部分文件到内存中，如果被请求的页面不在内存中那就会导致一个页面错误。大多数主流操作系统如Windows, Unix, Solaris和其他类Unix的操作系统都支持内存映射IO，在64位架构下，你几乎可以将任何文件映射到内存中并直接使用Java访问。另外一个优势是这些文件能够共享，在进程间提供共享内存，而且比普通的基于loopback接口的Socket要快10倍。

Java中MappedByteBuffer读写样例

下面的例子演示了如何使用内存映射文件来读写。我们使用RandomAccessFile打开文件并使用FileChannel的map()方法将它映射到内存，map()方法有三个输入参数：mode, position, size。返回值MappedByteBuffer是用来处理内存映射文件的字节缓存。

import java.io.RandomAccessFile;
import java.nio.MappedByteBuffer;
import java.nio.channels.FileChannel;
public class MemoryMappedFileInJava {
private static int count = 10485760; // 10 MB
public static void main(String[] args) throws Exception {
    RandomAccessFile memoryMappedFile = new RandomAccessFile("largeFile.txt", "rw");
    // Mapping a file into memory
    MappedByteBuffer out = memoryMappedFile.getChannel().map(FileChannel.MapMode.READ_WRITE, 0, count);
    // Writing into Memory Mapped File
    for (int i = 0; i < count; i++) {
        out.put((byte) 'A');
    }
    System.out.println("Writing to Memory Mapped File is completed");
    // reading from memory file in Java
    for (int i = 0; i < 10; i++) {
        System.out.print((char) out.get(i));
    }
    System.out.println("Reading from Memory Mapped File is completed");
    memoryMappedFile.close();
}

}
总结
下面快速总结一下Java内存映射文件和IO
1）. Java语言通过java.nio包支持内存映射文件和IO。
2）. 内存映射文件用于对性能要求高的系统中，如繁忙的电子交易系统
3）. 使用内存映射IO你可以将文件的一部分加载到内存中
4）. 如果被请求的页面不在内存中，内存映射文件会导致页面错误
5）. 将一个文件区间映射到内存中的能力取决于内存的可寻址范围。在32位机器中，不能超过4GB，即2^32比特。
6）. Java中的内存映射文件比流IO要快(译注：对于大文件而言是对的，小文件则未必）
7）. 用于加载文件的内存在Java的堆内存之外，存在于共享内存中，允许两个不同进程访问文件。顺便说一下，这依赖于你用的是direct还是non-direct字节缓存。
8）. 读写内存映射文件是操作系统来负责的，因此，即使你的Java程序在写入内存后就挂掉了，只要操作系统工作正常，数据就会写入磁盘。
9）. Direct字节缓存比non-direct字节缓存性能要好
10）. 不要经常调用MappedByteBuffer.force()方法，这个方法强制操作系统将内存中的内容写入硬盘，所以如果你在每次写内存映射文件后都调用force()方法，你就不能真正从内存映射文件中获益，而是跟disk IO差不多。
11）. 如果电源故障或者主机瘫痪，有可能内存映射文件还没有写入磁盘，意味着可能会丢失一些关键数据。
12）. MappedByteBuffer和文件映射在缓存被GC之前都是有效的。sun.misc.Cleaner可能是清除内存映射文件的唯一选择。

RandomAccessFile 与内存映射文件
RandomAccessFile是用来访问那些保存数据记录的文件的RandomAccessFile是用来访问那些保...
25用户态内存映射
mmap 将虚拟地址空间映射到物理内存匿名映射，即虚拟内存和物理内存直接映射文件映射，将文件映射到虚拟内存ima...
mmap 一定比普通读写快吗？
原理：文件磁盘地址映射到内存中，是文件地址映射。不是文件内容映射。通过缺页中断将文件内容加载到内存中。缺页中...
页交换文件与内存映射文件
页交换文件与内存映射文件内存的几种状态和类型私有类型：使用VitualAlloc申请分配/调拨内存后，申请的...
Eclipse下以Jetty运行时锁定文件解决办法
原因是Jetty会使用内存映射文件来缓存静态文件，其中包括js、css文件。在Windows下面，使用内存映射文件...
【Java难点攻克】「NIO和内存映射性能提升系列」彻底透析NI
NIO与内存映射文件 Java类库中的NIO包相对于IO包来说有一个新功能就是【内存映射文件】，在业务层面的日常...
mmap 一定比普通读写快吗？[v2]
mmap : 内存文件映射先通过文件与虚存建立地址映射关系，然后通过缺页中断对文件进行按需加载，并且以page ...
java nio学习笔记（2）之内存映射文件
概念内存映射文件是将文件（部分）内容映射到内存中，读写操作都在内存中完成，最后再写回文件示例该程序是将文件整...
APP优化 —— MMAP内存映射
mmap 一种内存映射文件的方法 mmap将一个文件或者其它对象映射进内存。文件被映射到多个页上，如果文件的大小不...
mmap原理
即memory map（内存映射）。内存映射减少了文件从内核空间copy到用户空间，但是增加了文件映射到用户空间的...