字符编码

作者: 范py | 来源:发表于2018-12-07 23:55 被阅读0次

    -文件处理
    cpu:
    内存:暂时存储
    硬盘:
    在编写python程序时无语法概念,不会报错。别写结果和编写一个普通的文本文件没有区别。只有把python程序交给python解释器并且交给第三个阶段才有了语言意义。
    -python解释器执行python程序
    第一阶段:先启动
    第二阶段:把文件读入内存
    第三阶段:解释执行,识别语法
    -文本编辑器读的原理

    什么是字符编码

    人类字符>翻译机器认识的0,1二进制
    一个英文字母占8个byte位。(ASCII)
    GBK 16
    unicode:两个字节表示一个字符
    保证不乱码的核心,用什么存就用什么取。
    我们能控制存到硬盘上的编码。
    python3解释器默认utf-8编码

    执行python第三个阶段发生的故事

    会识别python语法,定义的字符串有涉及到字符编码的概念

    转换

    unicode---编码code--》GBK
    GBK----解码---》unicode
    x.code("gbk")解码unicode
    python3 字符串类型 str:默认被存成unicode
    python3 bytes类型
    Unicode 》编码Unicode》utf-8
    utf-8 》解码》Unicode
    x= ‘你好’
    res = x.encode(“utf-8”)

    print(res.decode(“unicode”)
    Unicode 不能存到硬盘,所以需要编码到utf-8
    bytes类型二进制数据》可以往硬盘内写。
    bytes用途:
    1,存放在文件中
    2,基于网络传输

    相关文章

      网友评论

        本文标题:字符编码

        本文链接:https://www.haomeiwen.com/subject/eqnxhqtx.html