美文网首页
13_爬虫字符问题

13_爬虫字符问题

作者: 过桥 | 来源:发表于2019-11-27 16:09 被阅读0次

简述

记录抓取古老网页,遇到编码问题

Unicode 编码 转中文

# 方法一
eval('u"%s"' % column_0)

# 方法二
import json
json.loads('"%s"' % column_0)

\xa0 字符无法解析

\xa0表示不间断空白符

# 方法一
column_0.replace(u'\xa0', u'')

Window bat 执行乱码

设置chcp

@echo off
chcp 65001
F:  
cd F:\spider_demo16_xxxx
start "spider_xxxx" python spider_xxxx.py
exit  

相关文章

网友评论

      本文标题:13_爬虫字符问题

      本文链接:https://www.haomeiwen.com/subject/iqipwctx.html