使用lxml.etree做爬虫抓取网页,但如果网页是gbk/gb2312编码,则会出现乱码问题,困扰了好久 -_ ...[作者空间]
1.在这样的页面下有一堆offline的机器,我们现在就把Offline Slave Name下的数据全部爬取到本...[作者空间]
#coding = utf-8importreimporturllibdef getHtml(url):page ...[作者空间]
这个比较简单,就几行代码搞定: import requests import sys reload(sys) sy...[作者空间]