python基础 - 字符串的编码

作者: hanl001 | 来源:发表于2017-01-09 11:07 被阅读0次
  • 几种编码
    由于计算机只能识别0和1,为了把各种语言转化为机器能够识别的语言,就需要用到不同的编码。而计算机在设计的时候就定义了8bit为一个byte(字节)
    ASCII码: 由于计算机起源于美国,而英文字母加上数字、标点等一个字节完全够用,著名的ASCII码由此而生:用一个字节,也就是8位二进制数的不同组合来表示英文中说用到的所有字符。
    然而...
    随着计算机的发展,流入各个国家,显然一个字节对于很多语言来说是完全不够用的,也因此各国在保持ASCII原有编码不变的情况下,进行了各自的扩充,例如我国的GB2312。
    各国各自一套标注带来的结果就是,单有不同语言混在一起的时候,不管你选择哪一国的编码都无法对二进制全部进行解码,也就是会出现乱码。为了解决这个问题,我们熟悉的Unicode码得以诞生
    Unicode码: 将各国语言统一编码,形成的一套国际编码
    问题:其他编码为了兼容ASSII码,做法是保持低八位字节不变,其他为补0。这样带来的问题就是无意义的内存损耗。
    UTF-8编码:UTF-8的出现完美的解决这个问题,UTF-8并不是国定的字节长度,当它表示中文的时候占两个字节,当它表示英文时就占一个字节。灵活的内存分配,节省了很多没必要的内存消耗
  • Python的相关函数
    ord()和chr()
    ord():将字符串转换为Unicode码的十进制数字
    chr():将十进制数字形式的Unicode码转换为对应字符串
    注: 在Python3中,字符串以Unicode编码
    encode()和decode()
    encode():将字符串按照不同的编码方式按字节进行显示为字节流
    decode():将逐个字节显示的字节流,按不同编码方式进行重新编码
    注: python中用b''的包裹方式,表示字节流
    len()
    计算字符串的字符个数,或者计算字节流的字节数

相关文章

  • python编码

    python编码 python编码简介 字符串在Python内部的表示是unicode编码,因此,在做编码转换时,...

  • python 高级方法

    Python的字符串类型 字符编码方法 查看Python中的字符串编码名称,查看系统的编码 源文件字符集编码声明:...

  • Python中的字符串编码

    Python中的字符串编码 定义字符串 Python 中存在两种编码方式的字符串:ASCII 和 Unicode。...

  • python的unicode编码问题(以正则表达式为例)

    unicode是python的内部编码。字符串在Python内部的表示是unicode编码,因此,在做编码转换时,...

  • Python编码问题

    默认编码 字符串 python2 文本字符串默认编码是ASCII,中文默认UTF-8python3 文本字符串默认...

  • json与python

    Python 对象编码成 JSON 字符串 json.dumps 用于将 Python 对象编码成 JSON 字符...

  • Python教程列表

    Python 基础教程 Python 基础教程Python 简介Python 环境搭建Python 中文编码Pyt...

  • 2018-11-08

    今天,我们深入学习了字符串。学习了字符串编码: python中的字符采用的是Unicode编码 a.什么是编码 ...

  • Python教程导航

    Python 教程 Python 简介 Python 环境搭建 Python 中文编码 Python 基础语法 ...

  • python基础 - 字符串的编码

    几种编码由于计算机只能识别0和1,为了把各种语言转化为机器能够识别的语言,就需要用到不同的编码。而计算机在设计的时...

网友评论

    本文标题:python基础 - 字符串的编码

    本文链接:https://www.haomeiwen.com/subject/rnrnvttx.html