编码

作者: 研无不尽 | 来源:发表于2018-06-25 19:49 被阅读0次

问题1:编码问题

UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 14: illegal multibyte sequence

解决方法1:

open('hamlete.txt','r').read()  ==>  open('hamlete.txt','r',encoding='utf-8').read() 

知识点1:

文件存储编码是utf-8,打开文件的时候又没有指定编码,f.read()发现文件中有中文,所以按照gbk来  
试图将解码,但是因为文件本身是utf-8的,所以解码失败。

总结:

unicode 是万国码(是标准)  
utf8 utf16 是unicode的实现方式  
gbk gb2312 是汉字编码
encoding   编码
decoding   解码
utf-8 和utf8区别?

一般是没区别的,就是在MySQL中只能用utf8

conn = pymysql.connect(host='127.0.0.1', port=3306, user='root', passwd='123456',db='jobspider', charset="utf8")

相关文章

  • mysql编码

    查看编码 查看数据库编码 查看表编码 查看字段编码 修改编码格式 修改数据库编码格式 修改表编码 修改字段编码

  • 编码

    编码 编码格式(ASCII编码,GB2312编码(简体中文),GBK,ANSI编码,unicode,utf-8编码...

  • 网络安全编码书目录

    网络安全编码 Base64编码 MD5编码 SHA1编码 SHA256编码 HMAC编码

  • 前端开发文档规范

    HTML 编码规范 请查看HTML编码规范 CSS 编码规范 请查看CSS编码规范 JavaScript 编码规范...

  • 音频技术基础

    一、音频编码调制技术 根据编码方式的不同,音频编码技术分为三种:波形编码、参数编码和混合编码。一般来说,波形编码的...

  • 第五节课的第三个作业

    #编码 #编码

  • MPT 中对 key 的编码

    MPT中涉及到了三种编码,分别为keybytes编码、Hex编码和Compact编码。 keybytes 编码 这...

  • NSLocale

    国家编码语言编码货币符号货币编码 =============currentLocale==============...

  • 二维码学习笔记——编码

    数据编码 源数据编码 编码模式(模式指示符) 我们先来说说数据编码。QR码支持如下的编码: 数字编码(Numeri...

  • ruby编码说明【转】

    程序编码一般分几种情况: 源码文件编码 接收外部内容的编码 运行环境编码 操作系统编码 首先源码文件的编码,可以通...

网友评论

      本文标题:编码

      本文链接:https://www.haomeiwen.com/subject/zthuyftx.html