实战计划：爬取网页信息

实战计划：爬取网页信息

作者: Mo1iy | 来源:发表于2016-06-15 06:54 被阅读0次

实战计划：爬取网页信息
Java爬虫实战—利用xpath表达式抓取页面信息
Python实战课程1-3练习：爬取租房信息
Python实战计划学习笔记1-3：爬取租房信息
前程无忧职位信息爬取
爬虫作业2
python实战计划：爬取租房信息
python 爬取BOSS直聘网页信息
爬虫第二弹代码操作
爬虫从零开始--爬取静态网站

我的代码

from bs4 import BeautifulSoup
with open('/Users/Mo1iy/Downloads/Plan-for-combating-master/week1/1_2/1_2answer_of_homework/1_2_homework_required/index.html','r') as wb_date:  
  Soup = BeautifulSoup(wb_date,'lxml')    
  images = Soup.select('body > div > div > div.col-md-9 > div > div > div > img')  
  prices = Soup.select('body > div > div > div.col-md-9 > div > div > div > div.caption > h4.pull-right')   
  titles = Soup.select('body > div > div > div.col-md-9 > div > div > div > div.caption > h4 > a')    
  pinfenliangs = Soup.select('body > div > div > div.col-md-9 > div > div > div > div.ratings > p.pull-right')   
  xingjis = Soup.select('body > div > div > div.col-md-9 > div > div > div > div.ratings > p:nth-of-type(2)')
  # print(images,prices,titles,pinfenliang,xingji,sep= '\n----------------\n')
for image,price,title,pinfenliang,xingji in zip(images,prices,titles,pinfenliangs,xingjis):    

  data = {     
   'image':image.get('src'),
   'price':price.get_text(),     
   'title':title.get_text(),  
   'pinfenliang':pinfenliang.get_text(),    
   'xinji':len(xingji.find_all("span" ,class_='glyphicon glyphicon-star'))    }  
  print(data)

相关文章

实战计划：爬取网页信息
我的代码
Java爬虫实战—利用xpath表达式抓取页面信息
前言之前有写过如何利用Jsoup去爬取页面信息《Java爬虫实战——利用Jsoup爬取网页资源》，那里主要是借助...
Python实战课程1-3练习：爬取租房信息
前面写了自己的本地网页并爬取，然后就真枪实战地爬取真实网站了。这节的练习项目是爬取房源的详细信息（北京短租房）。分...
Python实战计划学习笔记1-3：爬取租房信息
Python实战计划学习第三个实战项目爬取租房信息成果：截取了一小部分，实在是太多了而且最近网络出问题了爬取...
前程无忧职位信息爬取
分析网页通过浏览器查看网页源代码，可以找到相应的职位信息，可知目标网页为静态网页，因此可以直接爬取。爬取思路 ...
爬虫作业2
分析要爬取目标的网页的网页结构与元素标签位置信息任务回顾 1.爬取网页：看准网 http://www.kanzh...
python实战计划：爬取租房信息
Date:2016-9-21update:2016-9-30By:Black Crow 前言：终于进入到网络页面...
python 爬取BOSS直聘网页信息
一、目标定义 1、目标理解（1）通过爬取网页信息，练习并掌握python网页爬虫的基本命令操作。（2）分析爬取...
爬虫第二弹代码操作
代码操作一爬取贴吧战狼2 网页信息运行结果：代码操作二百度图片爬取美女图网页结果展示代...
爬虫从零开始--爬取静态网站
利用BeautifulSoup爬取静态html网站例子：爬取quner网站信息查看网页源码发现，景点名称西湖t...

网友评论

本文标题：实战计划：爬取网页信息

本文链接：https://www.haomeiwen.com/subject/qjnudttx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|实战计划：爬取网页信息|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！