编码:字符转为字节
解码:字节转为字符
字符集:JAVA字符使用16位的双字节存储,但是在实际文件存储的数据有各种字符集,需要正确操作,否则就有乱码的发生。
US-ASCII:即英文的ASCII
ISO-8859-1:Latin-1拉丁字符,包含中文、日文等
UTF-8:变长unicode字符(1-3个字节),国际通用
UTF-16:文件中开头指定大端还是小端表示方式,即BOM(Byte-Order-Mark):FE FF表示大端,FE FE表示小端(大端表示高字节在低地址,小端表示低字节在低地址)
UTF-16BE:定长unicode字符(2个字节),大端Big-endian表示。
UTF-16LE:定长unicode字符(2个字节),小端little-endian表示。
简体中文windows系统中ANSI表示GBK字符集
文件编码:
getBytes()
getBytes(Charset charset)
getBytes(String charsetName)
网友评论