python实战第二个练习：爬取商品信息

python实战第二个练习：爬取商品信息

作者: 豆子她老公狼狼 | 来源:发表于2016-08-30 20:16 被阅读20次

算技@Python爬虫-商品信息（即将过期）
python实战第二个练习：爬取商品信息
Python实战：爬取商品信息
Python爬虫实战之爬取链家广州房价_03存储
第二节练习项目：爬取商品信息
Python实战计划学习笔记示例（2）爬取商品信息
python实战计划第一周，第二个项目
2017-12-31
算技@Python爬虫-租房信息（即将过期）
单元八·实例

有了解析网页的基础，感觉难度不大，主要时间花在了解决评分星级数量上

最终实现结果

屏幕快照 2016-08-30 下午8.10.36.jpg

我的代码

from bs4 import BeautifulSoup

with open('index.html','r') as f:
    soup=BeautifulSoup(f.read(),'lxml')
    titles=soup.select('body > div > div > div.col-md-9 > div > div > div > div.caption > h4 > a')
    prices=soup.select('body > div > div > div.col-md-9 > div > div > div > div.caption > h4.pull-right')
    images=soup.select('body > div > div > div.col-md-9 > div > div > div > img')
    reviews=soup.select('body > div > div > div.col-md-9 > div > div > div > div.ratings > p.pull-right')
    stars=soup.select('div > div.ratings > p:nth-of-type(2)')
    # for star in stars:
    #     print(star)

    for title,price,image,review,star in zip(titles,prices,images,reviews,stars):
        star_level=len(star.find_all("span", class_="glyphicon glyphicon-star"))
        data={
            'title':title.get_text(),
            'price':price.get_text(),
            'image':image.get('src'),
            'review':review.get_text(),
            'stars':star_level
        }
        print(data)

总结

开始在统计星星数量的时候有想到用len()函数，所以问题就变成了找有几个星星标签，第一次想到了循环
立刻觉得实现起来过于麻烦，参考文档中的find_all的资料，可以按照需求找标签得到列表，于是解决

相关文章

算技@Python爬虫-商品信息（即将过期）
Python 实战-第 1 周-练习项目02-爬取商品信息成果展示代码贴代码如下。同时放在 GitHub 库...
python实战第二个练习：爬取商品信息
有了解析网页的基础，感觉难度不大，主要时间花在了解决评分星级数量上最终实现结果我的代码总结开始在统计星星数...
Python实战：爬取商品信息
思路： step 1：打开网页 step 2：用BeautifulSoup的select()方法得到所需要的元素（...
Python爬虫实战之爬取链家广州房价_03存储
问题引入系列目录： Python爬虫实战之爬取链家广州房价_01简单的单页爬虫 Python爬虫实战之爬取链家广...
第二节练习项目：爬取商品信息
Python爬虫实战第一天任务爬取图示网站的商品信息，包括：商品名称，价格，评论，评论数以及图片链接成果源...
Python实战计划学习笔记示例（2）爬取商品信息
学习Python第二节课，爬取商品信息。 1.爬取目标爬取本地网页中图片地址、价格、商品标题、浏览量、评分星级。...
python实战计划第一周，第二个项目
爬取商品信息
2017-12-31
python爬虫实战：爬取全站小说排行榜 ...
算技@Python爬虫-租房信息（即将过期）
Python 实战-第 1 周-练习项目03-爬取租房信息成果展示代码贴代码如下。同时放在 GitHub 库...
单元八·实例
淘宝商品信息爬取

网友评论

本文标题：python实战第二个练习：爬取商品信息

本文链接：https://www.haomeiwen.com/subject/kdcqettx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|python实战第二个练习：爬取商品信息|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！