简单的python爬虫

作者: 燃烧望北斗 | 来源:发表于2019-05-22 16:40 被阅读0次

import requests #导入requests包

from bs4 import BeautifulSoup

url = '...'

#...这里输入爬虫的网址

#为了不轻易被识别出来,用户代理

headers={

'User-Agent':'...'

}

#...这里输入自己的浏览器的用户代理

resp = requests.get(url,headers=headers) #Get方式获取网页数据

#print(resp.text)#网页内容文本

#print(resp.content.decode('utf-8'))#网页内容二进制

html=resp.text

soup=BeautifulSoup(html,'html.parser')

infos = soup.find('div',{'class':'con1Text'}).get_text()

print(infos)

网友评论

本文标题：简单的python爬虫

本文链接：https://www.haomeiwen.com/subject/btvuzqtx.html

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！