一.流
1.0 概述
输入流
可以从其中读入一个字节序列的对象称作输入流
输出流
可以向其中写入一个字节序列的对象称作输出流
常见的流
文件、网络连接、内存块
1.1读写字节
InputStream和OutputStream是字节流体系的顶层抽象类。
基本方法
abstract int read()是InputStream类的一个抽象方法。这个方法将读入一个字节并返回读入的字节,在遇到输入源结尾时返回-1。
abstract void write(int b)是OutputStream类定义的一个抽象方法,它可以向某个输出位置写出一个字节。
具体的字节输入流,如FileInputStream类、System.in对象等都有自定义的read的方法,用于实现不同的功能。FileInputStream实现从文件中读取的read()方法,System.in的读取位置却是键盘。
同理,具体的字节输出流,也实现了各自的write方法。如FileOutputStream、System.out等。
扩展方法
基于read(),write()方法,顶层的InputStream和OutputStream还实现了int read(byte[] b)、int read(byte[] b,int off,int len)等方法和write(byte[] b)、write(byte[] b,int off,int len)等方法。
阻塞执行
read和write方法在执行时都将阻塞,直到字节确实被读入或写出。这意味着如果流不能被立即访问,那么当前线程将被阻塞。
读入输入流,InputStream.available()返回当前可读入的字节数量,即不需阻塞就能读取的字节数。
关闭流
不管是输入流还是输出流,使用完毕后都要调用close方法来关闭流。关闭流会释放掉十分有限的操作系统资源。关闭输出流的同时还会冲刷该输出流的缓冲区。当然也可以用flush方法来人为冲刷缓冲区。特别地,如果不关闭输出流,最后写出的字节可能会得不到传递。
1.2 完整的流家族
流整体上可分为字节流和字符流两类。
字节流
顶层抽象类是InputStream和OutputStream,定义了基本read\write\close\flust\available等方法。
具体的实现类包括:
- 可以从文件系统访问文件并进行读写文件的FileInputStream和FileOutputStream
- 可以以二进制格式读写所有的基本Java类型的DataInputStream和DataOutputStream
- 可以处理Zip文件的ZipInputStream和ZipOutputStream
字符流
字符流用于处理Unicode文本。
顶层抽象类是Reader和Writer。它俩的基本方法和字节流中的类似为:
abstract int read()
abstract void write(int c)
read方法将返回一个Unicode码元(一个在0-65535之间的整数),或者在碰到文件结尾时返回-1。write方法在被调用时,需要传递一个Unicode码元
流体系实现的接口
- Closeable接口:定义了close()方法,四个顶层类都实现了它。
- Flushable接口:定义了flush()方法,两个输出流OutpuStream和Writer实现了它
- Readable接口:定义了int read(CharBuffer cb)方法,只有字符输入流Reader实现它。CharBuffer类拥有按顺序和随机地访问和读写的方法,它表示一个内存中的缓存区或者一个内存映像的文件??
- Appendable接口:定义了Appendable append(char c)和Appendable append(CharSequence)两个方法,只有Writer实现了。可以方便地将String\StringBuffer\StringBuilder\CharBuffer等输出的流。
针对Appendable接口中提到的的CharSequence接口:String\StringBuffer\StringBuilder\CharBuffer等类都实现这个接口
1.3组合流过滤器
不同的流具有不同的能力,如FileInputStream可以从文件中读取数据,DataInputStream可以从流中读入数值类型。
可以组合不同的流,得到能力增强的流。如:要想从文件中读取二进制格式的数值类型,可以这么做:
DataInputStream din = new DataInputStream(new FileInputStream("data.dat"));
double s = din.readDouble();
再例如,流在默认情况下是不被缓冲区缓存的,也就是说对read的调用都会请求操作系统分发一个字节。相比之下,请求一个数据块并将其置于缓冲区中会显得更高效:
DataInputStream din = new DataInputStream(new BufferedInputStream(new FileInputStream("data.dat")));
PushbackInputStream介绍
可以回推字节。
PushbackInputStream pbin = new PushbackInputStream(new FileInputStream("data.dat"));
int b = pbin.read();
pbin.unread(b);
FileInputStream的构造方法
FileInputStream(String name);
FileInputStream(File file);
FileOutputStream的构造方法
如果append为true,则不会删除源文件,而是在源文件的末尾进行添加。
FileOutputStream(String name);
FileOutputStream(String name,boolean append);
FileOutputStream(File name);
FileOutputStream(File name,boolean append);
BufferedInputStream的构造方法
BufferedInputStream(InputStream in);
二.文本输入与输出
在保持数据时可以选择二进制格式或文本格式。例如整数1234存储为二进制数时,它写为字节00 00 04 D2(16进制法)。而存储成文本格式时,它被存成了字符串“1234”。尽管二进制格式的I/O高速且高效,但是不宜阅读。
先来介绍两个可以将“Unicode字符流”和“字节流”相互转换的类:
OutputStreamWriter类将使用选定的字符编码方式,把Unicode字符流转换为字节流;
InputStreamReader类将包含字节(用某种字符编码方法表示的字符)的输入流转换为可以产生Unicode码元的读入器。
InputStreamReader in = new InputStreamReader(new FileInputStream("data.dat"),"GBK");
文本格式的存储,本质上是将Unicode字符以某种编码方式编码为字节,再存储到文件中。读出时在以相同的编码方法解码后显示。
OutputStreamWriter和InputStreamReader就在其中起了关键的作用。
2.1如何写出到文本
可以使用PrintWriter类,它拥有以文本格式打印字符串和数字的方法。
构造方法
PrintWriter out = new PrintWriter("data.dat");
PrintWriter out = new PrintWriter(new FileWriter("data.dat"));
以上两个方法等价。
这里再多研究一下这两个方法:
查看FileWriter的构造方法:
public FileWriter(String fileName) throws IOException {
super(new FileOutputStream(fileName));
}
首先用FileOutputStream获取文件的字节流,再传给父类。那再看看父类是谁?原来是OutputStreamWriter。这就呼应了前面说的OutputStreamWriter的作用:将使用选定的字符编码方式,把Unicode字符流转换为字节流。
如何输出
out.print()、out.println()、out.printf()等方法
和System.out的输出类似
文本输出总结:
使用PrintWriter类。
如果是输出到文本,可以使用FileWriter获得一个字符输出流。而FileWriter是OutputStreamWriter的子类。本质上还是借用了OutputStreamWriter的字符流转字节流的能力。
另外,还可以指定PrintWriter的编码方式:
public PrintWriter(String fileName, String csn);//csn为字符集
2.2 如何读入文本输入
使用BufferedReader或Scanner。注意Scanner位于java.util包下。
首先借助于InputStreamReader获取字符流,再处理。InputStreamReader可以指定编码方式,从文件或其它字节流中得到字符流,再交给BufferedReader或Scanner进行读取处理。
1.BufferedReader
BufferedReader in = new BufferedReader(new InputStreamReader(new FileInputStream("data.txt"),"UTF-8"));
String line;
while((line = in.readLine()) != null) {
//do something
}
2.Scanner
Scanner sc = new Scanner(new InputStreamReader(
new FileInputStream("D://test_gb2312.txt"),
"gb2312")); //这里可以指定字符集,用指定的这个字符集FileInputStream将字节码转化为Unicode字符
int lineNum = 0;
while (sc.hasNext()) {
System.out.println("line " + (++lineNum) + " :");
System.out.println(sc.nextLine());
}
sc.close();
2.3字符集
java.nio包下的Charset类统一了对字符集的转换。建立了两字节Unicode码元序列与使用本地字符编码方式的字节序列之间的映射。
可以使用静态方法Charset.forName("utf-8")来获取一个字符集
可以使用静态方法Charset.availableCharsets()来获取当前实现中可用的字符集合
三.读写二进制数据
概述
DataOutput接口定义了以下方法来以二进制形式写出字符串和8种java基本类型:
writeChars(String)写字符串 writeByte writeInt writeInt writeShort writeLong writeFloat writeDouble writeChar writeBoolean writeUTF
例如,writeInt总是将一个整数写出为4字节的二进制数量值,而不管它的大小。这样产生的结果不是可读的,但对于给定的类型的每个值其占用的空间都是一致的,而且将其读会也比解析文本要快。
类似地,DataInput接口中定义了读入8种基本类型的方法。
具体实现
DataInputStream和DataOutputStream实现上述两个接口。可以将它们和文件流组合来以二进制格式读写基本类型数据。
网友评论