Python学习笔记(2)：爬取商品信息

作者: 8907a9c3d98f | 来源:发表于2016-08-06 23:12 被阅读0次

Python学习笔记(2)：爬取商品信息
Python实战计划学习笔记示例（2）爬取商品信息
Python实战计划学习笔记示例（3）爬取租房信息
python实战计划第一周，第二个项目
单元八·实例
Spring Boot集成WebMagic爬取商品信息
Python实战计划学习笔记：爬取商品信息
Python实战计划学习笔记：爬取商品信息
Python实战计划学习笔记：爬取商品信息
Python实战计划学习笔记：爬取商品信息

我的代码

from bs4 import BeautifulSoup

path = './index.html'

with open(path, 'r') as f:
    soup = BeautifulSoup(f.read(), 'lxml')
    pics = soup.select('body > div > div > div.col-md-9 > div > div > div > img')  #图片地址
    prices = soup.select('body > div > div > div.col-md-9 > div > div > div > div.caption > h4.pull-right') #价格
    titles = soup.select('body > div > div > div.col-md-9 > div > div > div > div.caption > h4 > a')  #商品标题
    rates = soup.select('body > div > div > div.col-md-9 > div > div > div > div.ratings > p:nth-of-type(2)')  #评分星级
    counts = soup.select('body > div > div > div.col-md-9 > div > div > div > div.ratings > p.pull-right')   #评分量

    infos = []
    for pic, price, title, rate, count in zip(pics, prices, titles, rates, counts):
        info = {
            'pic': pic.get('src'),
            'price': price.get_text(),
            'title': title.get_text(),
            'rate': len(rate.find_all("span", "glyphicon glyphicon-star")),
            'count': count.get_text()
        }
        infos.append(info)
        print(info)

总结

Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库
Copy selector和Copy Xpath都是描述一个元素在网页中位置的方式
find_all("p", "title")

  # [<p class="title"><b>The Dormouse's story</b></p>]

返回的是CSS Class为”title”的"p"标签

网友评论

本文标题：Python学习笔记(2)：爬取商品信息

本文链接：https://www.haomeiwen.com/subject/eztlsttx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

Python学习笔记(2)：爬取商品信息

我的代码

总结

相关文章

Python学习笔记(2)：爬取商品信息

Python实战计划学习笔记示例（2）爬取商品信息

Python实战计划学习笔记示例（3）爬取租房信息

python实战计划第一周，第二个项目

单元八·实例

Spring Boot集成WebMagic爬取商品信息

Python实战计划学习笔记：爬取商品信息

Python实战计划学习笔记：爬取商品信息

Python实战计划学习笔记：爬取商品信息

Python实战计划学习笔记：爬取商品信息

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读