作业1_3

作者: xilixjd | 来源:发表于2016-05-21 22:05 被阅读0次

importrequests

frombs4importBeautifulSoup

importtime

url='http://bj.xiaozhu.com/fangzi/597754001.html'

defhouse_info(url,data=None):

wb_data=requests.get(url)

time.sleep(1)

soup=BeautifulSoup(wb_data.text,'lxml')

titles=soup.select('body > div.wrap.clearfix.con_bg > div.con_l > div.pho_info > h4 > em')

addresses=soup.select('body > div.wrap.clearfix.con_bg > div.con_l > div.pho_info > p > span.pr5')

prices=soup.select(' div.day_l > span')

house_images=soup.find_all(id='curBigImage')

#print(house_images[0].get('src'))

owner_images=soup.select(' div.js_box.clearfix > div.member_pic > a > img')

#print(owner_images)

sexs=soup.select('div.js_box.clearfix > div.member_pic > div')

sex1=[]

forsexinsexs:

sex=str(sex)

if('member_ico1'insex):

sex1.append('女')

elif('member_ico'insexand'member_ico1'not insex):

sex1.append('男')

else:

sex1.append('空')

owner_names=soup.select(' div.js_box.clearfix > div.w_240 > h6 > a')

#print(owner_names[0].get_text())

fortitle,address,price,house_image,owner_image,owner_name,sexinzip(titles,addresses,prices,house_images,owner_images,owner_names,sex1):

data={

'title':title.get_text(),

'address':address.get_text().rstrip(),

'price':price.get_text(),

'house_image':house_image.get('src'),

'owner_image':owner_image.get('src'),

'owner_name':owner_name.get_text(),

'sex':sex

}

print(data)

url1=['http://bj.xiaozhu.com/search-duanzufang-p{}-0/'.format(str(i))foriinrange(1,12)]

defmulti_info(url):

wb_data=requests.get(url)

soup=BeautifulSoup(wb_data.text,'lxml')

page_url=soup.select('a.resule_img_a')

#print(page_url[0])

#page_url2=page_url[0].find_all('a',href=re.compile(r"/fangzi/\d\.html"))

#print(page_url2)

forpage_url1inpage_url:

house_info(str(page_url1['href']))

forurl2inurl1:

multi_info(url2)

相关文章

  • 作业1_3

    importrequests frombs4importBeautifulSoup importtime url=...

  • 出逃日1_3

    搬文。原作者:沐颜大大 C1 「帝王座下万骨枯。」 ______ 远处乌云一层一层卷着身子,慵懒的堆在天边儿。 ....

  • 菜园日记1_3

    20170220 菜历3日 天气:阴, 气温5-14度 今天比较郁闷,约好去装导航,以为只要半天。结果诸多不顺。 ...

  • Python实战计划爬虫作业1_3: 爬租房信息

    作业要求 我的代码 总结 本次作业就是BeautifulSoup的练习,模式就是一个套路。重点难点在于,页面上每一...

  • 善读「论语」20.1_3:周有大赉善人富,只因知人且尚贤

    「尧曰篇第二十」1_3 【原文】 (续上)“周有大赉,善人是富。虽有周亲,不如仁人。百姓有过,在予一人。”(待续)...

  • 于无声处1_3

    搬文 作者 百度ID:带刺回礼S 一、 “有花堪折直须折,莫待无花空折枝。”一直以来都是朴灿烈的人生信条。当他摇头...

  • ubuntu 显卡驱动与gcc版本不匹配,升级gcc为9.3.0

    先决条件 root管理权限 准备工作 1_1下载GCC-9.3.0安装包 1_2 解压安装包 1_3进入GCC解压...

  • 1_3抓取租房信息_笔记

    最终效果: 我的代码: 学到的知识: requests是python的一个HTTP客户端库,用于获取网页上的内容。...

  • 1_3是以前写的,以后是今天写的

    1.我的大脑深深的告诉我,我不喜欢销售,我喜欢安静和随意。约束使我不开心,因为我本身就不是一个话多的人,不喜欢过多...

  • 今天先不更

    补作业补作业补作业补作业补作业补作业补作业补作业补作业补作业补作业补作业补作业补作业补作业补作业补作业补作业补作业...

网友评论

      本文标题:作业1_3

      本文链接:https://www.haomeiwen.com/subject/bwdorttx.html