美文网首页
计算机编码

计算机编码

作者: Lux_Yan | 来源:发表于2018-02-23 14:07 被阅读0次

字符编码格式

  • ASCII(美国信息交换标准代码)127个字符,一个字符就是一个字节
  • GB2312 2字节,16位
  • Unicode,统一编码,2字节
  • UTF-8.可变长编码。一个字符编成1-6个字节。一个英文字符一个字节,汉字三个字节,生僻字符4-6个字节。

计算机内存中的编码格式都是Unicode。我们看到的浏览器前端都是服务器转换Unicode字符为UTF-8格式传递过来的

字符集转化(python)

Unicode编码
其他编码(中国编码集合(GB2312,GBK,GB18030)和其他国家编码)
UTF8
编码转换,Unicode进行encode变成其他编码。其他编码进行decode变成unicode。

gb2312----<decode>----unicode----<encode>---utf8

  • 注意
    python3默认字符串就是unicode编码。
  • 举例

encode()中参数表示unicode要转换成的编码---目的编码
decode()中参数表示要转换成unicode的源编码--源编码

>>> a = '你好'
>>> a
'你好'
>>> b = a.encode('utf8')
>>> b
b'\xe4\xbd\xa0\xe5\xa5\xbd'
>>> c = b.decode('utf8')
>>> c
'你好'
>>> c.encode('gb2312')
b'\xc4\xe3\xba\xc3'
>>>utf8编码格式
>>> a,b,c = bin(0xe4),bin(0xbd),bin(0xa0)
>>> a,b,c
('0b11100100', '0b10111101', '0b10100000')
>>>--------
>>>b = '闫'
>>> b.decode('gb2312')
u'\u95eb'

相关文章

  • Python2与Python3的编码问题

    一. 什么是编码 将明文转换为计算机可以识别的的编码文本称为“编码”, 反之从计算机可识别的编码文本转回明文为“解...

  • 前端 | 入门 | 前端需要知道的计算机编码

    计算机编码介绍 计算机,不能直接存储文字,存储的是编码。 计算机只能处理二进制的数据,其它数据,比如:0-9、a-...

  • 跟我一起学Python(二)

    一、编码 ASCII编码、Unicode编码、可变长编码”的UTF-8编码之间的由来 由于计算机是美国人发明的,因...

  • 编码浅谈

    为什么要熟悉编码的本质?深入理解计算机软硬件知识深入理解计算机背后的语言 一、先来理解编码 广义的理解:编码就是交...

  • 关于python中编码与解码的问题

    部分来源于网络整理 一、计算机的编码与解码 探讨编码与解码问题前,首先要知道什么是编码?什么是解码?计算机最终存储...

  • python中的encode()和decode()函数

    【一】编码历史 计算机的发展中,有ASCII码,GBK,Unicode,utf-8编码。 美国人发明了计算机,用八...

  • 2020-06-30

    计算机常用编码 常用编码介绍 字符集【charset】 编码code 认识ASCLL码表 一 只有0-127,共1...

  • 计算机编码

    字符编码格式 ASCII(美国信息交换标准代码)127个字符,一个字符就是一个字节 GB2312 2字节,16位...

  • 计算机编码

    字符的表示原理 计算机内所有信息都是使用0和1进行表示的。 对于一个短路来说,0代表关,1代表开。那把这些电路组合...

  • 计算机编码

    1byte(字节)=8bit(位/比特) 最大为11111111(二进制)=255(十进制) ASCII:1个字节...

网友评论

      本文标题:计算机编码

      本文链接:https://www.haomeiwen.com/subject/amvtxftx.html