美文网首页
python3.x中以&#开头的unicode编码字符串打印成中

python3.x中以&#开头的unicode编码字符串打印成中

作者: 若雨千寻 | 来源:发表于2018-09-30 15:05 被阅读0次

近日在爬取X事百科的页面时遇到了以&#开头的字符串如下形式:

到领导家送礼,送完头下
楼准备走人,结果车被物
管锁了,我物管阿姨说:
大姐,我就停了分

之前工作中也遇到过这种编码形式的文件,但是都没有太在意,这次为了看清打印的到底是什么汉字,我决定一探究竟,尝试了多种编解码都无法打印出汉字,所以我决定启动百度大法(尽情鄙视我没用Google吧!),一通乱搜之后发现原来为unicode的另一种形式如下图;验证地址:

unicode转中文.png
至于这种到底是什么情况这里说的比较清楚,我就不展开说了!

而平时我们用到的unicode大抵都是\u开头的形式如下:
\u9996\u90fd\u5317\u4eac

既然确定了是unicode,那么如何打印出中文呢?
这里就需要用到python自带的html库:
使用如下:

import html

print(html.unescape('中国'))
#中国

至此终于解决了打印看不出文字内容的问题!

参考地址:
https://my.oschina.net/liuyuantao/blog/1154544
https://bbs.csdn.net/topics/380009478

相关文章

  • python3.x中以&#开头的unicode编码字符串打印成中

    近日在爬取X事百科的页面时遇到了以&#开头的字符串如下形式: 之前工作中也遇到过这种编码形式的文件,但是都没有太在...

  • Java字符串编码

    Java中的字符串都是unicode编码。 "我".getbytes("GBK") 则是将 unicode中的“我...

  • Python中的字符串编码

    Python中的字符串编码 定义字符串 Python 中存在两种编码方式的字符串:ASCII 和 Unicode。...

  • python中,把‘&#’ ‘&#x开头的字符串转换成中文

    (一) 爬虫时经常遇到'/u'开头的unicode编码的字符串,这时通过decode()来解决. 但偶尔也会遇到以...

  • 2018-11-08

    今天,我们深入学习了字符串。学习了字符串编码: python中的字符采用的是Unicode编码 a.什么是编码 ...

  • Day03-字符串

    1.1 认识字符串 1.1什么是字符串 1.2 阻止转义 1.3 python中字符串中的字符是Unicode编码...

  • Python3之基础语法

    编码 默认:源码文件以UTF-8编码,字符串都是unicode字符串 指定: 标识符 第一个字符:字母表中的字符或...

  • C++ _T()/_L()函数

    _T("...")当工程是Unicode编码时,_T将括号内的字符串以Unicode方式保存;当工程是多字节编码时...

  • python2与python3中字符串的一些区别

    python2中字符串默认为编码过的,python3中字符串默认为unicode 例如:python2中: pyt...

  • Python2.7编解码问题总结

    最近颇受编码问题困扰,所以稍作总结,附以代码说明 为什么需要编解码?字符串以unicode的形式存在于内存中 ,但...

网友评论

      本文标题:python3.x中以&#开头的unicode编码字符串打印成中

      本文链接:https://www.haomeiwen.com/subject/bkswoftx.html