字符编码和序列化

作者: Apolo_Du | 来源:发表于2018-01-22 12:12 被阅读31次

Bytes 和罐头, unicode 和食物

字符编码和字典

常见的 ASCII, UTF-8, GBK 都是在unicode数据和 Bytes数据的转换过程中所使用的编码.
默认地, 程序会根据当前计算机系统使用的字符编码来确定使用的"字典".
解码:
- 在读取硬盘文件的时候, 软件根据当前环境使用的 "字典" （字符集）来 "翻译文件" (将硬盘上的二进制数据解码为unicode数据).
编码:
- 在存储数据到硬盘上的时候, 软件根据字符集将 unicode 数据编码为二进制数据.
在网络传输数据的时候, 传递的都是二进制数据.
处理数据的双方使用统一的字符编码是必要的
- 使用不一致的字符编码就好比是 "依赖英汉词典来翻译西班牙语" .
- 为此我们会在 shebang 指示解释器使用特定的字符编码.

 -*- coding: utf-8 -*-

了解了序列化和反序列化之后, 我们就可以很容易地理解那些需要转换数据类型的场景:
- server socket 和 client socket 之间的数据交互:
  - socket.send() 只能发送bytes数据
前端使用 Ajax 和服务器交互
向文件写入数据, 读取文件

本文标题：字符编码和序列化

本文链接：https://www.haomeiwen.com/subject/eddlaxtx.html