Python实战课程1-2练习：爬取商品信息

作者: mugichya | 来源:发表于2016-11-13 18:45 被阅读58次

学会了制作本地网页，了解网页构成，接着便可以使用强大的第三方库BeautifulSoup爬取网页信息了。
下面有一个网页的商品信息，我们要获得商品名称，价格，图片，星级评价以及浏览量等信息，将信息分类提取出来方便我们查阅。

Paste_Image.png

PyCharm新建python文件
新建一个以main.py文件
从index.html读取内容
打开创建的main.py文件和index.html文件，用浏览器查看html编写的网页，右键“检查”copy需要爬取的信息标签（商品名称，图片地址，价格，评分星级，浏览量等），注意用copy selector的方式赋值保存到main.py文件中注释备用。

Paste_Image.png

注意BeautifulSoup不支持nth-child语法，后续使用时候将其删去。

Paste_Image.png

用for循环和zip()函数遍历每一项信息放入字典容器中。接下来几部很关键，对于各个标签提取属性信息不同，需要注意：

Paste_Image.png

附录（源码）：

Paste_Image.png

网友评论

本文标题：Python实战课程1-2练习：爬取商品信息

本文链接：https://www.haomeiwen.com/subject/jeecpttx.html

Python实战课程1-2练习：爬取商品信息