初学python，使用python抓取某网页的信息

作者: SaveTheWorld | 来源:发表于2017-03-01 14:59 被阅读0次

初学python，使用python抓取某网页的信息
Python实用练手小案例
python3运行提示UnicodeEncodeError: &
Python爬取链家网上海市租房信息
Python网页decode解码报错UnicodeDecodeE
【Python】抓取网页信息
python3.8 不能使用requests问题
pm2.5 小型爬虫
python爬虫(四)_urllib2库的基本使用
Python 的简单爬虫

# -*- coding: utf-8 -*-

#引入包

importsys

importchardet

importurllib2

frombs4importBeautifulSoup

#转换编码

reload(sys)

sys.setdefaultencoding('utf-8')

#获取页面代码

req = urllib2.Request("http://gs.amac.org.cn/amac-infodisc/res/pof/manager/138.html")

#r = requests.get('http://gs.amac.org.cn/amac-infodisc/res/pof/manager/138.html');

content = urllib2.urlopen(req).read()

#转码

typeEncode = sys.getfilesystemencoding()

infoencode = chardet.detect(content).get('encoding','utf-8')

html = content.decode(infoencode,'ignore').encode(typeEncode)

#data = content.text

#使用BeautifulSoup解析代码

soup = BeautifulSoup(html,'html.parser')

#创建一个文件

f =file('d:/pythonWorkSpace/Python27PygamePy2exe-master/Python27PygamePy2exe-master/test.html',"w")

#寻找此页面内的td，class为td-content的字符并保存

for i in soup.find_all('td',class_='td-content'):

thisdata = i.text

f.write(thisdata)

#关闭文件

f.close()

网友评论

本文标题：初学python，使用python抓取某网页的信息

本文链接：https://www.haomeiwen.com/subject/cboqgttx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

初学python，使用python抓取某网页的信息

相关文章

初学python，使用python抓取某网页的信息

Python实用练手小案例

python3运行提示UnicodeEncodeError: &

Python爬取链家网上海市租房信息

Python网页decode解码报错UnicodeDecodeE

【Python】抓取网页信息

python3.8 不能使用requests问题

pm2.5 小型爬虫

python爬虫(四)_urllib2库的基本使用

Python 的简单爬虫

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读