Java文件IO常用归纳

作者: androidjp | 来源:发表于2017-01-15 16:24 被阅读226次

我们常说的标准IO操作,包含了本篇所述的文件IO。我们知道,IO无非是输入输出,数据在动的时候以流形式存在(Byte or Bit 为单位),而在静的时候则以文件形式存在(因为我们知道文件就是若干Byte等单位的数据或数据集合)。

前言:关于文件的编码


  1. 在windows 下,eclipse等IDE的默认项目编码是GBKGBK编码:中文占用2byte,英文占用1byte。
  2. utf-8编码中:中文占用3byte,英文占用1byte。
  3. 如何把单个字节转换为int以16进制的方式显示:
String ch = "A";
byte[] bytes = ch.getBytes();
System.out.println(Integer.toHexString(bytes[0] & 0xff));///为了将变成int类型后(8bit->32bit)的值,除去前30位的值,只留下最低2位。
  1. Java是双字节编码(utf-16be),utf-16be编码:中文和英文都占用2byte。
  2. Java中字符串与字节序列之间的转换示例:
String str = "你好1234";
byte[] bytes = str.getBytes("utf-16be");
String str2 = new String(bytes, "utf-16be");
  1. 文本文件(.txt)就是字节序列(可以是任意编码的字节序列)
  2. 中文机器上(比如我们的PC)直接创建文本文件,那么该文件只认识ansi编码
  3. 创建的Java项目设定是utf-8编码,那么, 它创建的文本文件编码格式就是utf-8编码。将此文本文件拷贝到其他不是utf-8编码的项目目录下,就会乱码。但是将此文本文件拷贝到我们PC的任何其他目录下,都不会有乱码。(注意是拷贝,不是新建,这是由于:文本文件本身就是识别任意编码格式的字节序列)

Java IO示例与注意点


(一)File类

  1. 创建/获取文件对象,使用File.separator分隔符:
File file = new File("E:\\test");///一般windows下用(双斜杠)
//File file0 = new File("e:\\", "diary.txt");
File file2 = new File("E:/test");///一般linux和macos下用(反斜杠)
File file3 = new File("E:" + File.separator +"test");///系统间通用
  1. 创建的文件对象是一个多级目录时,需要File.mkdirs()而不是File.mkdir()
if(!file.exists())
    file.mkdirs();
  1. 打印File.toString(),默认打印文件的目录:
System.out.println(file);/// output: e://test

(二)文件读写IO

  1. 关于RandomAccessFile:RandomAccessFile类支持随机访问文件并可以访问文件的任意位置:read()write()就是这个类的其他方法的基础原理。
RandomAccessFile raf = new RandomAccessFile(file, "rw");//两个模式:rw表示读写,r表示只读。
raf.write(int);//只写一个字节(后8位),同时指针后移一个位置,准备再次写入。
int b = raf.read();//读一个字节
int max = 0x7ffffff;
raf.write(max>>>24);//最高8位
raf.write(max>>>16);//8位
raf.write(max>>>8);//8位
raf.write(max);///最低8位
  1. IO流基础
  • 分为:字节流、字符流
  • EOF = End:-1表示读到结尾
  • 字节流:InputStream、OutputStream(抽象类)【具体方法可以查看它的API文档】
    • 输入流最重要方法:
      int b = in.read();///读取一个字节无符号填充到int低8位。-1表示EOF
      in.read(byte[] buf);///读取内容到buf字节数组中
      in.read(byte[] buf , int start, int size);//读取内容的一小段,到buf
      
    • 输出流最重要方法:
      out.write(int b);///写出一个字节到流,b的低8位。
      out.write(byte[] buf);//将buf字节数组写入到流
      out.write(byte[] buf, int start, int size);///将将buf[start]开始的size长度内容写入。
      
    • 各种字节流实现类:
      • 【基本文件操作】FileInputStream/FileOutputStream:具体实现了在文件上存取byte数据的方法。
      • 【更多封装方法】DataInputStream/DataOutputStream:对“流”进行了扩展,可以更方面地读取int、long、字符等类型数据【相当于比FileInputStream等多了些封装方法(装饰模式)】
      DataOutputStream dos = new DataOutputStream(new FileOutputStream(file));
      dos.writeUTF("中国");//采用utf-8编码写出
      dos.writeChars("中国");//采用utf-16be编码写出
      
      • 【更高效率】BufferedInputStream/BufferedOutputStream:为流IO提供了带缓冲区的操作,一般打开文件进行IO操作时,都会用到,这种流模式提高IO性能。
  • 字符流
    • 注意编码问题
    • 文本与文本文件的区别:
      • Java的文本(char)是16位无符号整数(unsigned 16bit int),是字符的unicode编码(双字节编码)。
      • 文本文件是文本(char)序列按照某种方案(如:utf-8、utf-16be、gbk等)序列化为byte的存储结果。
    • 【基本实现】InputStreamReader/OutputStreamWriter:完成byte-->char的按编码解析/char-->byte的按编码处理
    InputStreamReader isr = new InputStreamReader(new FileInputStream(file));///默认使用项目的编码格式(非utf-16be)
    char[] chs = new char[1024];
    int len;
    while((len=isr.read(chs,0,chs.length))!=-1){
      String s = new String(chs,0,len);
      System.out.println(s);
    }
    
    • FileReader/FileWriter:可直接对文本文件进行字符流读写。在copy文件时,可覆盖或追加文件内容。不用byte转char,但是编码问题不能解决。
    • BufferedReader/BufferedWriter:带缓冲,(String line = br.readLine())!=null方法可以一次读一行,高效率,但不能识别换行。
    BufferedReader br = new BufferedReader(new InputStreamReader(
                                      newFileInputStream(file)));//读
    BufferedWriter bw = new BufferedWriter(new OutputStreamWriter(
                                      newFileOutputStream(newFilePath)));//写
    String line;
    while((line = br.readLine())!=null){
      ///输出并写入新文件
      bw.write(line);
      bw.newLine();///单独写出换行操作!!!
      bw.flush;
    }
    br.close();
    bw.close();
    
    • PrintWriter:简单化构造一个写入流,换行操作很方面:println(str);

(三)对象读写 与 序列化

  1. 序列化:Object转byte序列的过程。
  2. 序列化流:ObjectOutputStream/ObjectInputStream,对于方法:writeObject()、readObject()
  3. JVM在对象内部调用的默认序列化方法:
///成员方法writeObject()
public void writeObject(ObjectOutputStream s) throws IOException{
  s.defaultWriteObject();
}
  1. 如果想要自己做某个元素的序列化操作:
public void writeObject(ObjectOutputStream s) throws IOException{
  s.defaultWriteObject();
  s.writeInt(age);///如这个age变量,就被我们自行序列化写入了
}
  1. Serializable接口是一个标准,是序列化的前提。
  2. transient关键字:被标注的成员不会被jvm进行默认序列化。【有时可以提高性能】
  3. ArrayList内部维护着Object[]类型的数组对象,这个对象是被transient修饰的,但是ArrayList并不是不想进行序列化操作,而是想自己去实现序列化的方式而不去给JVM默认进行序列化,这样一来即可提高效率。
  4. 序列化时:一个类实现了Serializable接口,其子类都能够被需序列化。
  5. 反序列化时:对子类对象进行反序列化,如果其父类没有实现Serializable接口,则其父类的构造方法会被调用。

相关文章

  • Java文件IO常用归纳

    我们常说的标准IO操作,包含了本篇所述的文件IO。我们知道,IO无非是输入输出,数据在动的时候以流形式存在(Byt...

  • Java NIO 常用归纳

    前言: 之前的文章《Java文件IO常用归纳》主要写了Java 标准IO要注意的细节和技巧,由于网上各种学习途径,...

  • Java—IO

    Java—IO流 1.IO—File常用API及文件编码 separator:名称分隔符,用来拼接文件路径path...

  • java的IO流

    java中的File的使用 java中File的基础使用 文件的几个常用方法创建文件句柄。File是java.io...

  • Java基础之IO流

    ##Java基础之IO流IO流常用几个类的关系如下: 字节流 字节输入流FileInputStream 读取文件用...

  • Java基础之io.File——9个常用文件操作

    前言 File是java.io下的一个包,IO即Input Output(输入输出),文件操作是平时最常用的IO操...

  • Java IO:流

    Java IO :文件 在Java应用程序中,文件是一种常用的数据源或者存储数据的媒介。所以这一小节将会对Java...

  • Java I/O 输入输出流(二)—— File类常用API介绍

    File类常用于API介绍 Java.io.File类用于表示文件(目录)。 File类只用于表示文件(目录)的信...

  • JAVA IO专题三:java的内存映射和应用场景

    相关java IO专题 JAVA IO专题一:java InputStream和OutputStream读取文件并...

  • Linux 文件IO 和 标准IO

    [TOC] Linux 文件IO 和 标准IO Linux 文件IO Linux中做文件IO最常用到的5个函数是:...

网友评论

    本文标题:Java文件IO常用归纳

    本文链接:https://www.haomeiwen.com/subject/irvybttx.html