美文网首页大数据 爬虫Python AI SqlAI时代
世界之大无奇不有,唯有美食不会辜负

世界之大无奇不有,唯有美食不会辜负

作者: AI女神安娜 | 来源:发表于2018-11-20 14:26 被阅读1次

淘宝网中国最大的电商平台,月活数为 4.48 亿。淘宝也是很多人日常必用的软件之一,尤其对于女性来说。在淘宝上可以购买很多商品,比如衣服、鞋子、书本等等。但在民间流传着这样一句话「没有什么是在淘宝上买不到的东西」,简称「万能宝」。

今天我给大家盘点下淘宝上那些有趣的商品。

1印有数独题目的厕所纸

我猜设计者应该是这样想的:“大家平常上厕所都被手机霸占着,天天看着一些无营养的内容。而上厕所又属于高频事件,长期这样下去,非常不利于我们大脑的发育。不如我设计一个数独,让大家上厕所的同时,还能锻炼大脑!”

不知道设计者最初设计的时候,有没有考虑会有人,因没能把数独解出,而蹲了一下午。

2 女性站立应急小便器

很多女生都想过这样的问题「站着上厕所会是什么样的体验?」。女性站立应急小便器就可以帮你实现,并且在很多地方是非常便利。比如在高速公路上堵车,女厕所排队排到天荒地老的时候,心痛肾更痛,如果有这个物品会方便很多。在比如有些公共厕所里的马桶非常的肮脏、去户外玩没有厕所还要蹲在草丛里、怀孕不方便蹲下的女性等等,在这些场合中这个物品也非常实用。

就是不知道如果被你男朋友看到你站着上厕所,他会有何感想。

3 30 天教你学会灵魂出窍

这个就非常的厉害了,30 天学会灵魂出体。1块钱一本电子档秘籍,看商品留言大家都给出不错的评论。真的是万能宝这种绝世秘籍也有卖。如果你也能灵魂出体,你第一时间会去做什么?我相信应该会有人跟我想到一块。

4 胡萝卜耳机

哈哈,我第一次看到这张图片的时候,某名戳中我的笑点。脑洞大开下,是否可以在做成西瓜、苹果、榴莲、芒果、西红柿等等耳机。这些耳机如果做出来一定非常的有趣。

Selenium 爬取淘宝网美食信息

世界之大无奇不有,唯美食不会辜负。在看完这些有趣的淘宝商品,今天就教大家利用 Python 的 selenium 库,来实现一个模拟浏览器抓取淘宝美食商品信息。看看在淘宝上都有哪些好吃的美食。

前期准备

本次的爬虫代码,我使用的是 Python 3.6 版本。爬虫框架使用的是 selenium ,数据的保存使用的是 mongodb。所以需要你们先自行把这些库安装好。这些库的安装网上有很多教程,我就不在这里讲述。编程学习很重要的一点,懂得自己上网查找相应的教程。

程序结构

程序分为两个 python 代码,一是爬虫抓取的 spider.py 文件,二是 mongodb 数据库配置文件。

spider.py 

spider.py 利用 selenium 爬虫框架,来模拟浏览器操作,爬取相应的淘宝内容。在这个文件中我定义了四个函数:search(),next_page(),get_products(),save_to_monogo()。分别用于:搜索淘宝对应关键字信息、自动翻页、获取商品详情信息、以及保存数据到 monogo 数据库中。

相应代码:

config.py 

config.py 这个文件是用来配置 mongodb 数据库,相应的代码也都有详细的注释。

输出结果

运行 spider.py 程序就会自动抓取淘宝相应的美食商品信息。然后在已字典的形式保存到 mongodb 中。

在数据库保存的形式如下:

当然这个程序你把相应的搜索关键字改成别的,就可以抓取淘宝其他商品的信息,这就自行发挥。

原文出自于【痴海】公众号


Python开发学习交流群:705673780,大佬答疑,免费资料,一起学习交流哦

相关文章

网友评论

    本文标题:世界之大无奇不有,唯有美食不会辜负

    本文链接:https://www.haomeiwen.com/subject/pcxxqqtx.html