美文网首页
python gb2312编码问题

python gb2312编码问题

作者: frank3 | 来源:发表于2018-06-20 11:04 被阅读0次

    问题描述:

    使用python进行gb2312编码,遇到如下问题

       if isinstance(q, str):
            q = q.decode("utf8")
       t = q.encode("gb2312")
    
    UnicodeEncodeError: 'gb2312' codec can't encode character u'\u5225' in position 0: illegal multibyte sequence
    

    其中编码错误的汉字是: 别克

    经过阅读这篇文章GBK与GB2312的些许不同 使用gbk进行编码,问题就解决。

    import urllib
    a = u"別克"
    c = a.encode("gbk")
    

    再次遇到问题:

    UnicodeEncodeError: 'gbk' codec can't encode character u'\u2006' in position 1: illegal multibyte sequence
    

    这次编码错误的字是:g l 8

    解决方法(参考python下字符编码和解码问题):

    //替换
    a = u'g l 8'
    a = a.replace(u'\u2006', '')
    c = a.encode("gbk")
    
    //加ignore参数
    c = a.encode("gbk", 'ignore')
    

    相关文章

      网友评论

          本文标题:python gb2312编码问题

          本文链接:https://www.haomeiwen.com/subject/jbbtyftx.html