Scrapy : UnicodeEncodeError: 'gb

Scrapy : UnicodeEncodeError: 'gb

作者: 朝畫夕拾 | 来源:发表于2022-01-06 15:13 被阅读0次

Scrapy : UnicodeEncodeError: 'gb
python学习-UnicodeEncodeError: 'gb
UnicodeEncodeError:
爬虫错误总结
Python 错误：UnicodeEncodeError
python分类总结——编码那些事
UnicodeEncodeError: 'ascii&#
使用Sublime3运行Python3无法输出台无法打印UTF-
Sublime Text3（mac）一些插件和快捷键和常见错误
Pyspark-报错与解决

在用scrapy爬取网页数据时，Selector解析网页数据时 , 会出现如题的错误。

response.xpath('//*[@id="pagelist"]/div/text()').extract()[0]

这样写打印出来，是不会报错的。

response.xpath('//*[@id="pagelist"]/div/text()')

加上extract()就会报这样子的错。因为extract()返回选中内容的Unicode字符串。网页中如果出现 就会变成\xa0的字符就会出现如题的错误。

如何解决呢？？？ 上代码：

response.xpath('//*[@id="pagelist"]/div/text()').re(r'[^\xa0]'))

没错，就是用正则表达式去除掉\xa0即可。然后这样处理后得到的是一个[]的数组，要想得到字符串类型的数据

"".join(response.xpath('//*[@id="pagelist"]/div/text()').re(r'[^\xa0]')).strip()

OK了！

相关文章

Scrapy : UnicodeEncodeError: 'gb
在用scrapy爬取网页数据时，Selector解析网页数据时 , 会出现如题的错误。 response.xpat...
python学习-UnicodeEncodeError: 'gb
错误 UnicodeEncodeError: 'gbk' codec can't encode character...
UnicodeEncodeError:
python 里面的编码和解码也就是 unicode 和 str 这两种形式的相互转化。编码是 unicode -...
爬虫错误总结
UnicodeEncodeError: 'ascii' codec can't encode characters...
Python 错误：UnicodeEncodeError
UnicodeEncodeError: 'ascii' codec can't encode characters...
python分类总结——编码那些事
“UnicodeEncodeError:'ascii' codec can't encode characters...
UnicodeEncodeError: 'ascii&#
UnicodeEncodeError: 'ascii' codec can't encode characters...
使用Sublime3运行Python3无法输出台无法打印UTF-
报错： UnicodeEncodeError: 'ascii' codec can't encode charac...
Sublime Text3（mac）一些插件和快捷键和常见错误
报错 sublime 报UnicodeEncodeError 打开Preferences -> Browse Pa...
Pyspark-报错与解决
in show UnicodeEncodeError: 'ascii' codec can't encode ch...

网友评论

本文标题：Scrapy : UnicodeEncodeError: 'gb

本文链接：https://www.haomeiwen.com/subject/opqrcrtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|Scrapy : UnicodeEncodeError: 'gb|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！