美文网首页
简单理解ISO,UNICODE,UTF等编码的含义和区别

简单理解ISO,UNICODE,UTF等编码的含义和区别

作者: 挡不住的柳Willow | 来源:发表于2019-03-28 11:43 被阅读0次
  • ASCII(美国信息交换标准代码)
    7 bit表示一个字符,共计128种字符,美国够用,很多非英语国家不够用
  • ISO-8859-1
    8 bit表示一个字符,即用 1 byte(字节)表示一个字符,共可以表示256个字符,很多非字母国家不可用
  • gb2312
    两个字节表示一个汉字,生僻字不能表示
  • gbk
    能表示的汉字数量超过gb2312,结果发现又不够用了(中国)
  • gb180303
    是能表示汉字的最全的编码(中国)
  • big5
    繁体编码类型(台湾)
  • unicode
    各个国家都有自己的字符太乱了,就出现了unicode,用两个字节表示一个字符。但是对于字母国家来说,存储量太大,明明一个字节就可以表示非要再填充一个字节
  • UTF(Unicode Translation Format)
    unicode是一种编码方式,而UTF则是一种存储方式;UTF-8和UTF-16等等都是Unicode的实现方式之一
    UTF-16采用两个字节表示一个字符
    UTF-8是变长字节表示,如果是英文字符,用一个字节表示,如果是中文,用三个字节,最多可以用六个字节表示一个字符
    BOM(Byte Order Mark)字节序标记,针对UTF-8存在,在文件的起始位置存在,标识该文件是UTF-8,尤其是Windows系统,因此在windows中处理utf-8必须考虑这个问题,查看踩坑实例

相关文章

网友评论

      本文标题:简单理解ISO,UNICODE,UTF等编码的含义和区别

      本文链接:https://www.haomeiwen.com/subject/azwfbqtx.html