一.介绍
字符流=字节流+编码集,在实际读取的时候其实字符流还是按照字节来读取,但是会更具编码集进行查找编码集字典解析相应的字节,使得一次读取出一个字符;
转换流就是原本是字节流,但是读取到的数据是字符,所以我们希望使用字符流来进行操作,那么就可以使用转换流进行转换;
转换流=字节流+编码集。
转换流的特点是可以指定编码集。
转换流的作用:
(1)从控制台读取数据输入(键盘输入),将它们写入到文件(我们写的是字符吧);
(2)当对文件进行解析的时候,如果涉及编码,就需要使用转换流进行解码----乱码可不好玩。
二.知识点介绍
1、System.in与Ssytem.out
2、InputStreamReader与OutputStreamWriter
3、OutputStreamWriter类
4、转换流和子类区别
5、编码表
三.上课视频对应说明文档
1、System.in与System.out
我们常见的System.in与System.out就是典型的字节流,可以直接与控制台进行数据传输。
如:OutputStream os = System.out;
方法阻塞:
当调用这个方法时,程序会进行等待,当方法调用结束后,阻塞结束。
Scanner并不是键盘录入,是文本扫描,可以根据绑定IO资源的不同,扫表不同的文本资源,如果给予文件,则扫描文件,如果给予System.in则扫描键盘录入数据
代码示例:
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;
import java.io.InputStreamReader;
import java.io.UnsupportedEncodingException;
/*
* 转换流 是 字符流的子类
*
* 字符流 = 字节流 + 编码表 . 保证了编码表 和 文件的编码 一致 ,能够读取数据成功.
* 编码表和 文件的编码不一致, 乱码.
* InputStreamReader(InputStream in, String charsetName) 创建使用指定字符集的InputStreamReader。
*/
public class Demo {
public static void main(String[] args) throws IOException {
//创建 InputStreamReader 对象
InputStreamReader isr = new InputStreamReader(new FileInputStream("bj.txt"), "utf8") ;
char ch = (char)isr.read();
System.out.println(ch);
}
}
2、InputStreamReader与OutputStreamWriter
操作字节流对于程序来说过于繁琐,程序员更偏爱操作字符。所以,当面对一些字节流的操作时,我们可以将其转换为字符流再进行操作,这样便非常方便了。
(1)Reader:
InputStreamReader可以完成字节输入流转换为字符输入流
(2)Writer:
OutputStreamWriter可以完成字节输出流转换为字符输出流。
由上边可以知道,转换流是字符流的一种,创建对象时传入对应字节流对象即可完成转换动作。
转换流同样使用了包装的思想,其构造方法接收的同样为IO流对象,并非某个文件资源。关闭转换流的同时即关闭了对应的字节流。
2.1、OutputStreamWriter类
查阅OutputStreamWriter的API介绍,OutputStreamWriter 是字符流通向字节流的桥梁:可使用指定的字符编码表,将要写入流中的字符编码成字节。它的作用的就是,将字符串按照指定的编码表转成字节,在使用字节流将这些字节写出去。
代码示例:
public static void writeCN() throws Exception {
//创建与文件关联的字节输出流对象
FileOutputStream fos = new FileOutputStream("c:\\cn8.txt");
//创建可以把字符转成字节的转换流对象,并指定编码
OutputStreamWriter osw = new OutputStreamWriter(fos,"utf-8");
//调用转换流,把文字写出去,其实是写到转换流的高效区中
osw.write("你好");//写入高效区。
osw.close();
}
OutputStreamWriter流对象,它到底如何把字符转成字节输出的呢?
其实在OutputStreamWriter流中维护自己的高效区,当我们调用OutputStreamWriter对象的write方法时,会拿着字符到指定的码表中进行查询,把查到的字符编码值转成字节数存放到OutputStreamWriter高效区中。然后再调用刷新功能,或者关闭流,或者高效区存满后会把高效区中的字节数据使用字节流写到指定的文件中。
2.2、InputStreamReader类
查阅InputStreamReader的API介绍,InputStreamReader 是字节流通向字符流的桥梁:它使用指定的字符编码表读取字节并将其解码为字符。它使用的字符集可以由名称指定或显式给定,或者可以接受平台默认的字符集。
代码示例:
public class InputStreamReaderDemo {
public static void main(String[] args)throws IOException {
//演示字节转字符流的转换流
readCN();
}
public static void readCN() throws IOException{
//创建读取文件的字节流对象
InputStream in = new FileInputStream("c:\\cn8.txt");
//创建转换流对象
//InputStreamReader isr = new InputStreamReader(in);这样创建对象,会用本地默认码表读取,将会发生错误解码的错误
InputStreamReader isr = new InputStreamReader(in,"utf-8");
//使用转换流去读字节流中的字节
int ch = 0;
while((ch = isr.read())!=-1){
System.out.println((char)ch);
}
//关闭流
isr.close();
}
}
注意:在读取指定的编码的文件时,一定要指定编码格式,否则就会发生解码错误,而发生乱码现象。
3、转换流和子类区别
发现有如下继承关系:
Writer 字符输出流
|- OutputStreamWriter 转换流(字符流—>字节流)(属于字符输出流, 可以指定字符编码表,用来写入数据到文件)
|--FileWriter 操作文件中字符输出流,采用默认的字符编码表
Reader 字符输入流
|- InputStreamReader: 转换流(字节流à字符流)(属于字符输入流, 可以指定字符编码表,用来从文件中读数据)
|--FileReader操作文件中字符输入流,采用默认的字符编码表
父类和子类的功能有什么区别呢?
OutputStreamWriter和InputStreamReader是字符和字节的桥梁:也可以称之为字符转换流。字符转换流原理:字节流+编码表。
FileWriter和FileReader:作为子类,仅作为操作字符文件的便捷类存在。当操作的字符文件,使用的是默认编码表时可以不用父类,而直接用子类就完成操作了,简化了代码。
InputStreamReader isr = new InputStreamReader(new FileInputStream("a.txt"));//默认字符集。
InputStreamReader isr = new InputStreamReader(new FileInputStream("a.txt"),"GBK");//指定GBK字符集。
FileReader fr = new FileReader("a.txt");
这三句代码的功能是一样的,其中第三句最为便捷。
注意:一旦要指定其他编码时,绝对不能用子类,必须使用字符转换流。什么时候用子类呢?
条件:
(1)操作的是文件。
(2)使用默认编码。
总结:
字节--->编码表--->字符 : 看不懂的--->看的懂的。 需要读。输入流。 InputStreamReader
字符--->编码表--->字节 : 看的懂的--->看不懂的。 需要写。输出流。 OutputStreamWriter
4、编码表
4.1、编码表概念
在转换流或者字符串的构造方法当中,我们发现有一个参数始终没有使用,即字符串型的编码集名称。
如果没有指定该名称,则默认为”GBK”,GBK就是编码表的一种。
编码表即字符与存储数据的对应关系表,每一个字符都对应一个数字。
所以,有如下公式:
字符 = 字节 + 编码表
4.2、常用编码表
(1)GBK:中文环境默认码表,中文码表(2个字节对应一个汉字)
(2)GB2312:与GBK基本相同
(3)UTF-8:万国码,JavaEE项目中的通用编码表,包含各国文字编码(一般3个字节对应一个汉字)
(4)ISO8859-1:拉丁码表,不包含中文,是西方较通用的码表
(5)BIG-5:繁体字码表
4.3、编码表使用
乱码:当字符与字节转换过程中使用了不同的码表,会造成乱码的情况。
在字符串中:
当我们将字符串转为对应的数字字节时,需要指定码表,则存储了为该字符该码表对应的数字字节,如果使用了其他码表重写翻译回字符串,则拼写的新字符串会乱码。
在IO中:
与字符串编码表使用类似,当以某个码表写出字节数据时,又使用另外码表展示,会出现乱码。
网友评论