美文网首页
Python2编码相关

Python2编码相关

作者: SlashBoyMr_wang | 来源:发表于2019-03-04 09:49 被阅读0次

    最近在用Python处理中文字符串时,报出了如下错误:
    UnicodeDecodeError: 'ascii' codec can't decode byte 0xe9 in position 0: ordinal not in range(128)

    报错原因:因为默认情况下,Python2采用的是ascii编码方式,如下所示:
    python -c "import sys; print sys.getdefaultencoding()"
    ===>ascii
      而Python2在进行编码方式之间的转换时,会将 unicode 作为“中间编码”,但 unicode 最大只有 128 那么长,所以这里当尝试将 ascii 编码字符串转换成"中间编码" unicode 时由于超出了其范围,就报出了如上错误。

    解决办法
    第一种局部修改生效:
      这里我们将Python的默认编码方式修改为utf-8,就可以规避上述问题的发生,具体方式,我们在Python文件的前面加上如下代码:

    import sys
    defaultencoding = 'utf-8'
    if sys.getdefaultencoding() != defaultencoding:
        reload(sys)
        sys.setdefaultencoding(defaultencoding)
    

    第二种全局修改生效:
      我们在/usr/lib/python2.7/site-packages/目录下添加一个sitecustomize.py文件,内容如下:

    import sys
    sys.setdefaultencoding('utf-8')
    

    相关文章

      网友评论

          本文标题:Python2编码相关

          本文链接:https://www.haomeiwen.com/subject/czhbuqtx.html