我们常说的标准IO操作,包含了本篇所述的文件IO。我们知道,IO无非是输入输出,数据在动的时候以流形式存在(Byte or Bit 为单位),而在静的时候则以文件形式存在(因为我们知道文件就是若干Byte等单位的数据或数据集合)。
前言:关于文件的编码
- 在windows 下,eclipse等IDE的默认项目编码是
GBK
,GBK
编码:中文占用2byte,英文占用1byte。 -
utf-8
编码中:中文占用3byte,英文占用1byte。 - 如何把单个字节转换为int以16进制的方式显示:
String ch = "A";
byte[] bytes = ch.getBytes();
System.out.println(Integer.toHexString(bytes[0] & 0xff));///为了将变成int类型后(8bit->32bit)的值,除去前30位的值,只留下最低2位。
- Java是双字节编码(utf-16be),
utf-16be
编码:中文和英文都占用2byte。 - Java中字符串与字节序列之间的转换示例:
String str = "你好1234";
byte[] bytes = str.getBytes("utf-16be");
String str2 = new String(bytes, "utf-16be");
- 文本文件(
.txt
)就是字节序列(可以是任意编码的字节序列) - 中文机器上(比如我们的PC)直接创建文本文件,那么该文件只认识
ansi
编码 - 创建的Java项目设定是
utf-8
编码,那么, 它创建的文本文件编码格式就是utf-8
编码。将此文本文件拷贝到其他不是utf-8
编码的项目目录下,就会乱码。但是将此文本文件拷贝到我们PC的任何其他目录下,都不会有乱码。(注意是拷贝,不是新建,这是由于:文本文件本身就是识别任意编码格式的字节序列)
Java IO示例与注意点
(一)File类
- 创建/获取文件对象,使用
File.separator
分隔符:
File file = new File("E:\\test");///一般windows下用(双斜杠)
//File file0 = new File("e:\\", "diary.txt");
File file2 = new File("E:/test");///一般linux和macos下用(反斜杠)
File file3 = new File("E:" + File.separator +"test");///系统间通用
- 创建的文件对象是一个多级目录时,需要
File.mkdirs()
而不是File.mkdir()
:
if(!file.exists())
file.mkdirs();
- 打印File.toString(),默认打印文件的目录:
System.out.println(file);/// output: e://test
(二)文件读写IO
-
关于RandomAccessFile:RandomAccessFile类支持随机访问文件并可以访问文件的任意位置:
read()
和write()
就是这个类的其他方法的基础原理。
RandomAccessFile raf = new RandomAccessFile(file, "rw");//两个模式:rw表示读写,r表示只读。
raf.write(int);//只写一个字节(后8位),同时指针后移一个位置,准备再次写入。
int b = raf.read();//读一个字节
int max = 0x7ffffff;
raf.write(max>>>24);//最高8位
raf.write(max>>>16);//8位
raf.write(max>>>8);//8位
raf.write(max);///最低8位
- IO流基础
- 分为:字节流、字符流
- EOF = End:-1表示读到结尾
-
字节流:InputStream、OutputStream(抽象类)【具体方法可以查看它的API文档】
- 输入流最重要方法:
int b = in.read();///读取一个字节无符号填充到int低8位。-1表示EOF in.read(byte[] buf);///读取内容到buf字节数组中 in.read(byte[] buf , int start, int size);//读取内容的一小段,到buf
- 输出流最重要方法:
out.write(int b);///写出一个字节到流,b的低8位。 out.write(byte[] buf);//将buf字节数组写入到流 out.write(byte[] buf, int start, int size);///将将buf[start]开始的size长度内容写入。
- 各种字节流实现类:
- 【基本文件操作】
FileInputStream/FileOutputStream
:具体实现了在文件上存取byte数据的方法。 - 【更多封装方法】
DataInputStream/DataOutputStream
:对“流”进行了扩展,可以更方面地读取int、long、字符等类型数据【相当于比FileInputStream等多了些封装方法(装饰模式)】
DataOutputStream dos = new DataOutputStream(new FileOutputStream(file)); dos.writeUTF("中国");//采用utf-8编码写出 dos.writeChars("中国");//采用utf-16be编码写出
- 【更高效率】
BufferedInputStream/BufferedOutputStream
:为流IO提供了带缓冲区的操作,一般打开文件进行IO操作时,都会用到,这种流模式提高IO性能。
- 【基本文件操作】
- 输入流最重要方法:
-
字符流:
- 注意编码问题
- 文本与文本文件的区别:
- Java的文本(char)是16位无符号整数(unsigned 16bit int),是字符的unicode编码(双字节编码)。
- 文本文件是文本(char)序列按照某种方案(如:utf-8、utf-16be、gbk等)序列化为byte的存储结果。
- 【基本实现】
InputStreamReader/OutputStreamWriter
:完成byte-->char的按编码解析/char-->byte的按编码处理
InputStreamReader isr = new InputStreamReader(new FileInputStream(file));///默认使用项目的编码格式(非utf-16be) char[] chs = new char[1024]; int len; while((len=isr.read(chs,0,chs.length))!=-1){ String s = new String(chs,0,len); System.out.println(s); }
-
FileReader/FileWriter
:可直接对文本文件进行字符流读写。在copy文件时,可覆盖或追加文件内容。不用byte转char,但是编码问题不能解决。 -
BufferedReader/BufferedWriter
:带缓冲,(String line = br.readLine())!=null
方法可以一次读一行,高效率,但不能识别换行。
BufferedReader br = new BufferedReader(new InputStreamReader( newFileInputStream(file)));//读 BufferedWriter bw = new BufferedWriter(new OutputStreamWriter( newFileOutputStream(newFilePath)));//写 String line; while((line = br.readLine())!=null){ ///输出并写入新文件 bw.write(line); bw.newLine();///单独写出换行操作!!! bw.flush; } br.close(); bw.close();
-
PrintWriter
:简单化构造一个写入流,换行操作很方面:println(str);
(三)对象读写 与 序列化
- 序列化:Object转byte序列的过程。
- 序列化流:
ObjectOutputStream/ObjectInputStream
,对于方法:writeObject()、readObject()
- JVM在对象内部调用的默认序列化方法:
///成员方法writeObject()
public void writeObject(ObjectOutputStream s) throws IOException{
s.defaultWriteObject();
}
- 如果想要自己做某个元素的序列化操作:
public void writeObject(ObjectOutputStream s) throws IOException{
s.defaultWriteObject();
s.writeInt(age);///如这个age变量,就被我们自行序列化写入了
}
-
Serializable
接口是一个标准,是序列化的前提。 -
transient
关键字:被标注的成员不会被jvm进行默认序列化。【有时可以提高性能】 -
ArrayList
内部维护着Object[]类型的数组对象,这个对象是被transient
修饰的,但是ArrayList
并不是不想进行序列化操作,而是想自己去实现序列化的方式而不去给JVM默认进行序列化,这样一来即可提高效率。 - 序列化时:一个类实现了
Serializable
接口,其子类都能够被需序列化。 - 反序列化时:对子类对象进行反序列化,如果其父类没有实现
Serializable
接口,则其父类的构造方法会被调用。
网友评论