美文网首页
python分类总结——编码那些事

python分类总结——编码那些事

作者: Cinque_Peng | 来源:发表于2018-01-24 16:51 被阅读0次

“UnicodeEncodeError:'ascii' codec can't encode characters in position 0-1: ordinal notin range(128)”

这句提示估计都经常见到,具体原因下面慢慢分析。

不爱废话,精简总结

首先弄清楚decode和encode的作用,这两者肯定跟中间编码unicode有关。

我们把"de"想成后退,"en"想成前进。退一步unicode,进一步其他code,分析得蹩脚,但是好记。

str1.decode('gb2312'),表示将gb2312编码的字符串str1转换成unicode编码。   
str2.encode('gb2312'),表示将unicode编码的字符串str2转换成gb2312编码。

括号里总是其他code

字符串格式:如果是在utf8的文件中,该字符串就是utf8编码,如果是在gb2312的文件中,则其编码为gb2312。
python的默认编码是ascii

isinstance(s,unicode)#用来判断是否为unicode

改变默认编码:

import sys

reload(sys)
sys.setdefaultencoding('utf-8')

能解决大部分问题,包括开头的问题。

s=u"中文"——这样就是unicode编码格式,来一剂治百病良药

#良药!!!!! 
#coding=utf-8  
s="中文"  
  
if isinstance(s, unicode):  
#s=u"中文"  
    print s.encode('gb2312')  
else:  
#s="中文"  
    print s.decode('utf-8').encode('gb2312')

相关文章

  • python分类总结——编码那些事

    “UnicodeEncodeError:'ascii' codec can't encode characters...

  • 2018-06-29

    python实现文本分类 - CSDN博客; 根据这个实现分类吧; 编码问题真的很烦;彻底搞懂Python的字符编...

  • python编码总结

    目前我们项目代码注释少、代码风格差异大,会导致交接时间长、交接后故障多的问题。针对这种情况,我们应该统一代码风格,...

  • Python3

    关于学习Python编码的一点总结 我认为关于编码这个问题廖雪峰官网上的Python教程写的很好,我从中看了几次,...

  • 【字符编码】你真的了解字符编码吗

    腾讯大讲堂——字符编码的前世今生字符串,那些你不知道的事编码字符集标准及分类研究通信用語の基礎知識 —— ISO/...

  • Python编码问题详解

    继上一篇文章字符集和编码详解总结了常见字符编码后,这篇文章会对python中常见的编码问题进行分析和总结。由于py...

  • Python2 中文编码

    使用python3的理由之中文编码,python2的编码实在是有点难受,经常出现奇怪的bug,总结一下方法: 文件...

  • 计算机语言与编码

    python基础1:计算机语言与编码 标签; python基础 计算机语言分类 机器语言 底层语言,运行速度最快,...

  • python编码

    python编码 python编码简介 字符串在Python内部的表示是unicode编码,因此,在做编码转换时,...

  • GB2312/GBK/Big5

    python中爬取网页是总是遇到中文编码问题总结如下; 1.如何判断一段文字(网页)的编码格式2.中文编码的种类和...

网友评论

      本文标题:python分类总结——编码那些事

      本文链接:https://www.haomeiwen.com/subject/zuiuaxtx.html