美文网首页
python编码问题

python编码问题

作者: 陈钟南 | 来源:发表于2016-10-06 17:15 被阅读0次

    在把网页源代码爬下来之后,出现了一个问题

    源代码中的中文字符全部变成“???”问号(黑人问号脸.jpg)

    pycharm提示的是decode方面出现了问题,所以我上网百度了一下python的编码解码

    其中http://blog.csdn.net/moodytong/article/details/8136258
    这篇博文较为详细的说明了python的编码解码,所以我就按照上面的方法进行尝试,一开始看的是下面几行代码:

    u = u'中文'#显示指定unicode类型对象ustr = u.encode('gb2312')#以gb2312编码对unicode对像进行编码

    str1 = u.encode('gbk')#以gbk编码对unicode对像进行编码

    str2 = u.encode('utf-8')#以utf-8编码对unicode对像进行编码

    u1 = str.decode('gb2312')#以gb2312编码对字符串str进行解码,以获取unicode

    u2 = str.decode('utf-8')#如果以utf-8的编码对str进行解码得到的结果,将无法还原原来的unicode类型

    看懂后进行尝试,结果没成功,应该是因为python的版本问题所致,所以我继续往下看,又看到了几行代码:

    u = u'中文'#显示指定unicode类型对象u

    str = u.encode('gb2312')#以gb2312编码对unicode对像进行编码

    str1 = u.encode('gbk')#以gbk编码对unicode对像进行编码

    str2 = u.encode('utf-8')#以utf-8编码对unicode对像进行编码

    u1 = str.decode('gb2312')#以gb2312编码对字符串str进行解码,以获取unicode

    u2 = str.decode('utf-8')#如果以utf-8的编码对str进行解码得到的结果,将无法还原原来的unicode类型

    依照这几行代码的提示,我终于成功的解决了python的编码解码问题

    也算是较为顺利地完成了一个任务(继续加油)


    相关文章

      网友评论

          本文标题:python编码问题

          本文链接:https://www.haomeiwen.com/subject/ekweyttx.html