美文网首页
字符串的编码

字符串的编码

作者: Julianlee107 | 来源:发表于2017-07-07 02:09 被阅读0次

字符串的编码

  1. 计算机只能处理数字,文本转换为数字才能处理。计算机中的8bit就是一个字节,所以一个字节能表示最大的数字就是255.
  2. 计算机是美国人发明的,所以一个字节可以表示所有的字符,所以ASCII(一个字节)编码成为了美国人的标准编码。
  3. 中文里面的字符远大于255,所以ASCII编码处理中文是不够的,所以中国制定了GB2312编码,用两个字节表示一个汉字。同理,其他国家为了解决这个问题,就发展了很多标准,如果出现多种语言混合就会出现乱码。
  4. Unicode将所有语言统一到一套标准编码里面。
  5. 但是,如果内容都是英文,Unicode编码比ASCII编码多一倍的存储空间。
  6. 所以出现了可变长的编码“UTF-8”,把英文变长为一个字节,中文变为3个字节,特别生僻的变为4-6个字节,如果传输大量英文,UTF-8对比Unicode的优势就很明显了

在进行代码处理的时候,固定长度的Unicode编码处理起来比可变长度的UTF-8更加方便简单,UTF-8的优势在于文本的存储和传送。
在Python3.x中,所有字符串已经转换为Unicode编码。
在Python2.x中,需要将字符串decode为Unicode后才能进行encode。

相关文章

  • python 高级方法

    Python的字符串类型 字符编码方法 查看Python中的字符串编码名称,查看系统的编码 源文件字符集编码声明:...

  • golang字符串重新编码

    golang 字符串重新编码 golang 字符串重新编码//byte decode/*** function ...

  • Python中的字符串编码

    Python中的字符串编码 定义字符串 Python 中存在两种编码方式的字符串:ASCII 和 Unicode。...

  • 霍夫曼编码

    问题: 请设计一个算法,给一个字符串进行二进制编码,使得编码后字符串的长度最短 思路:使用霍夫曼编码构造字符串编码...

  • 2018-11-08

    今天,我们深入学习了字符串。学习了字符串编码: python中的字符采用的是Unicode编码 a.什么是编码 ...

  • python3 (1)基础语法

    1、编码 python3 源码文件默认UTF-8编码,字符串Unicode字符串。可以不在py文件制定编码,pyt...

  • python编码

    python编码 python编码简介 字符串在Python内部的表示是unicode编码,因此,在做编码转换时,...

  • Java-字符串编码解码

    字符串编码解码

  • 394. 字符串解码

    394.字符串解码给定一个经过编码的字符串,返回它解码后的字符串。 编码规则为: k[encoded_string...

  • 394. 字符串解码

    394. 字符串解码 给定一个经过编码的字符串,返回它解码后的字符串。 编码规则为: k[encoded_stri...

网友评论

      本文标题:字符串的编码

      本文链接:https://www.haomeiwen.com/subject/kdzkhxtx.html