美文网首页
简单理解ISO,UNICODE,UTF等编码的含义和区别

简单理解ISO,UNICODE,UTF等编码的含义和区别

作者: 挡不住的柳Willow | 来源:发表于2019-03-28 11:43 被阅读0次
    • ASCII(美国信息交换标准代码)
      7 bit表示一个字符,共计128种字符,美国够用,很多非英语国家不够用
    • ISO-8859-1
      8 bit表示一个字符,即用 1 byte(字节)表示一个字符,共可以表示256个字符,很多非字母国家不可用
    • gb2312
      两个字节表示一个汉字,生僻字不能表示
    • gbk
      能表示的汉字数量超过gb2312,结果发现又不够用了(中国)
    • gb180303
      是能表示汉字的最全的编码(中国)
    • big5
      繁体编码类型(台湾)
    • unicode
      各个国家都有自己的字符太乱了,就出现了unicode,用两个字节表示一个字符。但是对于字母国家来说,存储量太大,明明一个字节就可以表示非要再填充一个字节
    • UTF(Unicode Translation Format)
      unicode是一种编码方式,而UTF则是一种存储方式;UTF-8和UTF-16等等都是Unicode的实现方式之一
      UTF-16采用两个字节表示一个字符
      UTF-8是变长字节表示,如果是英文字符,用一个字节表示,如果是中文,用三个字节,最多可以用六个字节表示一个字符
      BOM(Byte Order Mark)字节序标记,针对UTF-8存在,在文件的起始位置存在,标识该文件是UTF-8,尤其是Windows系统,因此在windows中处理utf-8必须考虑这个问题,查看踩坑实例

    相关文章

      网友评论

          本文标题:简单理解ISO,UNICODE,UTF等编码的含义和区别

          本文链接:https://www.haomeiwen.com/subject/azwfbqtx.html