美文网首页
About encoding

About encoding

作者: KIDJourney | 来源:发表于2016-11-10 19:13 被阅读0次

About Coding

简述

所有编码都是二进制到真实字符的映射

无论是是ASCII,ISO,GBK,还是unicode

只不过上面这些编码规则中,每一种二进制对应的字符不相同。

UTF-8

UTF-8(Unocde Transformation Format)是一种传输格式,是一种unicode的实现方式。

UTF-8是变长的

UTF-8用前置的1来表示需要的字节数

  • 1 字节 0000 0000 -- 0000 007f (0x80 - 1)
    • 0xxxxxxx
  • 2 字节 0000 0080 -- 0000 07ff
    • 110xxxxxx 10xxxxxx
  • 3 字节 0000 0800 -- 0000 ffff
    • 1110xxxxx 10xxxxxx 10xxxxxx
  • 4 字节 0001 0000 -- 0010 ffff
    • 11110xxxx 10xxxxxx 10xxxxxx 10xxxxxx

Encoding in Python

下面这些内容可能有误

Python2

str类型是二进制根据一定编码规则(GBK,UTF等等),encode之后的结果,个人理解为显示的结果,也就是对应的可见的字符。同一段二进制可以被不同的编码规则encode成不同的字符。

在unicode中对应的二进制为0x6d4b

utf-8的传输格式下,编码为\xe6\xb5\x8b
GBK的传输格式下,编码为\xb2\xe2

在保存一个文件时,可以选择以不同的编码方式进行保存。同一个字,在用'utf-8'进行保存时,文件内容为\xe6\xb5\x8b,用GBK进行保存时,文件内容为\xb2\xe2

相关文章

  • About encoding

    About Coding 简述 所有编码都是二进制到真实字符的映射 无论是是ASCII,ISO,GBK,还是uni...

  • URI Encoding

    What is URL Encoding URL Encoding 也被成为 percent encoding,U...

  • Encoding

    1. 字符发展历史 1.1 字节 计算机内部,所有信息最终都是一个二进制值 每一个二进制位(bit)有0和1两种状...

  • Encoding

    到目前为止,还没有讨论字符串是如何存储的。 字符串由Unicode代码点集合组成。这些代码点的范围从0到11141...

  • Http--Header

    Encoding 请求:Accept-Encoding响应:Content-Encoding 取值:gzip、de...

  • Golang标准库——encoding(1)

    encoding ascii85 asn1 base32 base64 encoding encoding包定义了...

  • gobox中的编解码和执行shell命令

    今天来说下gobox中的encoding和shell两个box。 encoding encoding的主要作用是完...

  • PyCharm 终端输出中文乱码问题

    File -> setting ->搜索 File Encoding IDE Encoding : 设置为GBK ...

  • Swift URL指定字符encoding

    1.指定支付encoding 2.指定字符不被encoding

  • 关于Encoding

    [string1 stringByAddingPercentEncodingWithAllowedCharacte...

网友评论

      本文标题: About encoding

      本文链接:https://www.haomeiwen.com/subject/uiuxpttx.html