网上动态图有多污？一看吓一跳！Python爬取上万条动态图！超搞

网上动态图有多污？一看吓一跳！Python爬取上万条动态图！超搞

作者: 力大士 | 来源:发表于2018-03-10 22:57 被阅读59次

网上动态图有多污？一看吓一跳！Python爬取上万条动态图！超搞
迅捷GIF制作工具怎么样？
Scrapy框架-图片下载功能
java spring+mybatis整合实现爬虫之《今日头条》
2018-10-29
GIF的制作方法：GIF动态图原来是这样制作的！
Python爬虫笔记（3）：利用requests和lxml库爬取
Android PowerImageView实现，可以播放动画的
Writing Task 1 动态图
利用python制作迷宫动态图

一.思路分析

按照爬虫的基本规律：

1.找到目标

2.抓取目标

3.处理目标内容，获取有用的信息

这个网站呢，是一个论坛式网站，里面分了几大类，反正试试各种动图。

我们的目标呢，就是找到这（收）些（藏）动（到）图（自）的（己）地（电）址（脑）.

3.每一张动图的所在页面的规律

其实这个没啥规律，但是只要我们找到单个图片的地址，就没啥难处理的了.

二开工动手

1.获取入口页面内容

即根据传入的URL,获取整个页面的源码

3-6 第三步到第六步一起来说

其实就是根据页码数，来进行遍历，获取到每一页的内容

然后得到每一页中的所有图片地址

在进行获取每一页的内容的时候，需要重新组装页面地址。

有了新的地址，就可以获取当前页面的内容，并进行数据处理，得到每一张图片的地址列表

在获取到图片列表后，再次解析，获取每一张图片的URL

在这里，把数据整合一下，为将数据写入数据库做准备

7.将图片存到本地，以及将数据写入数据库

三数据库的筛选

在完成了将数据放入到数据库的之后，我想着可以直接通过调用数据库，将图片保存

（为什么有这个想法呢，因为我发现如果直接在主程序中存贮图片，它跑的太慢了，不如将数据都放到数据库中，之后专门调用数据库来贮存图片）

但是这里发现一个问题，数据中的内容挺多的，然后发现了好多内容是重复的，因此我们需要对数据库进行去重

关于数据去重的内容，其实我之前的文章已经写过了（写那篇文章的时候，这个爬虫已经完成了呢～）

主要思路是针对某一个元素的数量进行操作，pymongo里面有一个方法是可以统计指定元素的数量的，如果当前元素只有一个，就不管，不是一个元素，就删除

核心代码如下：

完整代码

01_get_gif_url.py

02_delete_repeat_url_in_mongodb.py

谢谢阅读！！！

相关文章

网上动态图有多污？一看吓一跳！Python爬取上万条动态图！超搞
一.思路分析按照爬虫的基本规律： 1.找到目标 2.抓取目标 3.处理目标内容，获取有用的信息这个网站呢，是一...
迅捷GIF制作工具怎么样？
大家在网上经常可以看到很多动态图片，这些动态图片大部分都是GIF格式的，动态图片其实自己都可以做，用迅捷GIF制作...
Scrapy框架-图片下载功能
其实文件下载也差不多前言在日常爬取的过程中，图片下载还是挺多的，有时候可能纯粹是爬取图片，比如妹子图、动态图、...
java spring+mybatis整合实现爬虫之《今日头条》
java spring+mybatis整合实现爬虫之《今日头条》搞笑动态图片爬取（详细）原文地址原博客地址先上...
2018-10-29
原来动态图表这么简单 3分钟学会VLOOKUP动态图表，定义名称制作动态图表，你相信吗？就是这么简单...
GIF的制作方法：GIF动态图原来是这样制作的！
我们在网上浏览别人的文章时，经常可以看到以gif动态图显示的操作步骤，那么如何录制gif动态图片并在文章中插入动态...
Python爬虫笔记（3）：利用requests和lxml库爬取
爬取完文字，今天就来爬起图片练练手吧，这是练手的网站居然搞笑网咦，还有意外惊喜，发现里面的动态图片不但搞笑，还很...
Android PowerImageView实现，可以播放动画的
很多搞笑的动态图片，经常看一看就会感觉欢乐很多，可以释放掉不少平时的压力。确实，比起一张单调的图片，动态图片明显更...
Writing Task 1 动态图
Writing Task 1. 动态图 Introduction paragraph ·首段结构+变量 ·动态图首...
利用python制作迷宫动态图
背景：利用python制作迷宫动态图 import sys sys.path.append('/data/cour...

网友评论

本文标题：网上动态图有多污？一看吓一跳！Python爬取上万条动态图！超搞

本文链接：https://www.haomeiwen.com/subject/eoxifftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

Python爬虫作业

python热爱者

热点阅读

Python爬虫作业

python热爱者

我爱编程

关于我们|服务条款|联系我们|网上动态图有多污？一看吓一跳！Python爬取上万条动态图！超搞|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！