了解即可
了解一下常见的字符编码
了解乱码产生原因,计算机中的信息都是二进制数据,那么所有能够描述出的中文文字都是经过处理后的结果。在计算机的世界里,所有的语言文字都会使用编码来进行描述,例如最常见的编码是ASCII码。java使用的是unicode。
最常见的编码如下:
1.GBK,GB2312:中文的国标码,GBK包含简体和繁体两种,GB2312只包含简体
2.ISOO8895-1:是国际编码,可以描述任何的文字信息
3.UNICODE:是十六进制编码,造成传输的无用数据过多
4.UTF编码(UTF-8):融合了ISO8859-1和UNICODE编码的特点。
在以后的所有开发里面,使用的都是UTF-8编码。
所谓的乱码最本质的方式就是编码与解码的字符集不统一。如果要想知道现在系统能够使用的编码,可以列出所有的环境属性。
网友评论