File的API
文件编码
字符集:Java字符使用16位的双字节存储,但是在实际文件存储的数据有各种字符集,需要正确操作,否则就有乱码的发生。
字符集: US-ASCII
说明: 即英文的ASCII
字符集: IS0-8859-1
说明: Latin-1 拉丁字符,包含中文、日文等
字符集: UTF-8
说明: 变长unicode字符(1-3个字节),国际通用
字符集: UTF-16BE
说明: 定长unicode字符(2个字节),大端Big-endian表示
0x12 | 0x34 | 0x56 | 0x78 (高字节低地址)
字符集: UTF-16LE
说明: 定长unicode字符(2个字节),小端little-endian表示
0x78 | 0x56 | 0x34 | 0x12 (低字节低地址)
字符集: UTF-16
说明: 文件中开头指定大端还是小端表示方式,即BOM(Byte-Order-Mark):FE FF 表示大端,FF FE 表示小端。
网友评论