用BeautifulSoup和requests采集小猪短租的一个

作者: 莫莫33 | 来源:发表于2016-11-08 00:25 被阅读0次

用BeautifulSoup和requests采集小猪短租的一个
python爬取小猪短租网信息
爬虫： example three -- 爬取小猪短租的信息
爬取猫途鹰
小猪短租的坑
python分布式爬虫：爬虫基础知识
python: bs4 sample
Python 爬虫实战（二）：使用 requests-html
旅游业促进短租市场发展新风向放
小猪短租竞品分析报告

Python使用版本3.52

废话不说了，最近倍受打击，很多前面的东西看不懂了，继续努力吧，把之前的采集小猪短租的一个单页面信息的代码放上来，随后陆续更吧：

#此代码为抓取单一页面上的显示的其中一个链接的抓取元素

frombs4importBeautifulSoup

importrequests

url='http://sh.xiaozhu.com/fangzi/759632739.html'

html=requests.get(url)#发送请求网络资源

soup=BeautifulSoup(html.text,'lxml')#解析请求回来的网络资源

title=soup.select('div.pho_info > h4')[0].text#把需要爬取得信息用选择器选择出来

cate=soup.select('div.pho_info > p')[0].get('title')

price=soup.select('div.day_l > span')[0].text

pic1=soup.select('#curBigImage')[0].get('src')

pic2=soup.select('div.member_pic > a > img')[0].get('src')

gender=soup.select('div.member_pic > div')[0].get('class')[0]

name=soup.select('div.w_240 > h6 > a')[0].get('title')

score=soup.select('div.top_bar.clearfix > ul > li > em')[0].text

size=soup.select('#introduce > li.border_none > p')[0].text

defprint_gender(xb):#设定标签判断返回性别

ifxb=='member_ico1':

return'女'

else:

return'男'

data={#建立抓取元素显示标准的字典

'1.标题:':title,

'2.地址:':cate,

'3.每晚价格:':price,

'4.房图:':pic1,

'5.房主图:':pic2,

'6.房主昵称:':name,

'7.房主性别:':print_gender(gender),

'8.房子大小:':size,

'9.评分:':score,

}

forkeys,valuesindata.items():#打印单一页面上的单一链接中的抓取元素

print(keys,values)

我知道自己的水平很低，但是我一直在坚持我的信条是“立志行动坚持”，加油吧每一个想努力实现梦想的小伙伴们

网友评论

本文标题：用BeautifulSoup和requests采集小猪短租的一个

本文链接：https://www.haomeiwen.com/subject/jofbuttx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

用BeautifulSoup和requests采集小猪短租的一个

相关文章