python爬取回车桌面图片

python爬取回车桌面图片

作者: 9ba4bd5525b9 | 来源:发表于2019-05-26 15:00 被阅读50次

python爬取回车桌面图片
爬取Python教程博客并转成PDF
Python学习
0.Python 爬虫之Scrapy入门实践指南（Scrapy基
python爬取手机app
各类链接
【二】PYTHON爬取全国新房房价与浅析
Python爬虫-豆瓣电影Top250-各项信息爬取及xls保存
JSFinder工具使用方法
用python网络爬虫爬取英雄联盟英雄图片

今天我们就来爬爬这个网站 https://tu.enterdesk.com/ 这个网站能爬的资源还是很多的，但我就写一个例子，其他的可以根据思路去写。

首先还是先来分析下这个网站的图片获取过程

我选择的是图库，先随便选择一个标签，我这选宠物吧

哟，我们再看看有没有翻页开启F12(开发者工具)

用不习惯火狐，还是开谷歌来看吧

那么就访问看看？随便选取一个访问看看是不是能出图片

https://tu.enterdesk.com/chongwu/6.html

结果肯定是可以的啦

问题来了，现在怎么查看最后一页的页码是什么？一种是无限循环下去直到没有图片标签的时候报错，还有一种就是从源码中找出页码那就得看有没有页码按钮刚才滚轮比较快现在慢一点看有没有页码这些东西

这网站还是有页码的，那说明在html源码中能找到页码数

两种方法：

F12工具选择元素

Ctrl+U走一波源代码直接搜索

现在找到所有页码，接下来就是分析图片源地址了

选择目标图片看看是不是源地址原图打开一看其实不是

https://up.enterdesk.com/edpic_360_360/4c/3e/c2/4c3ec2be7061121ad5994a9b51241fa3.jpg

现在再点击进去图片里面发现是原图了这时再选择图片查看标签的图片链接

复制上图里面的链接打开一看就是原图啦看下图的链接怎么那么熟悉？

对比下两个链接

https://up.enterdesk.com/edpic_360_360/4c/3e/c2/4c3ec2be7061121ad5994a9b51241fa3.jpg

https://up.enterdesk.com/edpic_source/4c/3e/c2/4c3ec2be7061121ad5994a9b51241fa3.jpg

略缩图 edpic_360_360

原图 edpic_source

这下整体思路就有啦，我们可以获取略缩图的链接将url进行重构，形成原图链接，然后再批量下载就好啦！

开始撸代码了！！！

第一个是 class Spider(): 我们声明了一个类,然后我们使用 def __init__去声明一个构造函数

分析怎么提取末页链接如下图：

这里我们采用多线程的方式爬取，引入下面几个模块

新增加一个全局的变量，而且是多线程操作，我们需要引入线程锁，避免资源同时写入出错。

all_img_urls = []#所有图片链接

g_lock = threading.Lock()#初始化一个锁

声明一个Producer的类，负责提取图片链接，然后添加到 all_img_urls 这个全局变量中

线程锁，在上面的代码中，当我们操作all_urls.pop(0)的时候，我们是不希望其他线程对他进行同时操作的，否则会出现意外，所以我们使用g_lock.acquire()锁定资源，然后使用完成之后，记住一定要立马释放g_lock.release(),否则这个资源就一直被占用着，程序无法进行下去了。

下面再定义一个DownPic类用于下载图片

可以看到利用了down_time = str(round(t * 1000)) 来生成毫秒级时间戳来命名图片其实也可以获取图片的名称来命名那就靠自己去写一个了

再从if __name__ == "__main__": 添加下面代码用于开启多线程下载

整体流程就这么写完啦！run下代码

Tips：跑这个代码需要在D盘创建test文件夹或者自己修改代码实现其他功能

附出完整代码：

相关文章

python爬取回车桌面图片
今天我们就来爬爬这个网站https://tu.enterdesk.com/这个网站能爬的资源还是很多的，但我就写一...
爬取Python教程博客并转成PDF
爬取Python教程博客并转成PDF 今天我们爬取一下python教程博客并把爬取内容转换成PDF储存到本地。用到...
Python学习
python爬虫(五) python爬虫爬取豆瓣电影Top250数据利用python爬取豆瓣电影TOP250页面...
0.Python 爬虫之Scrapy入门实践指南（Scrapy基
[TOC] 0.0、Scrapy基础 Python2：适合爬取非中文 Python3：适合爬取中文 Scrapy是...
python爬取手机app
python爬取手机app
各类链接
爬虫使用python-aiohttp爬取今日头条【Python】爬虫爬取各大网站新闻 Scrapy 模拟登录新...
【二】PYTHON爬取全国新房房价与浅析
【一】学PYTHON及爬虫的一些总结【二】PYTHON爬取全国新房房价与浅析 PART ONE:【数据采集】爬取...
Python爬虫-豆瓣电影Top250-各项信息爬取及xls保存
Python爬虫-豆瓣电影Top250-各项信息爬取及xls保存目的采用python爬虫爬取豆瓣电影Top25...
JSFinder工具使用方法
简单爬取 python JSFinder.py -u http://www.mi.com 这个命令会爬取http:...
用python网络爬虫爬取英雄联盟英雄图片
用python爬虫爬取lol皮肤。这也用python网络爬虫爬取lol英雄皮肤，忘了是看哪个大神的博客（由于当时...

网友评论

本文标题：python爬取回车桌面图片

本文链接：https://www.haomeiwen.com/subject/ewaxtctx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

python社区

Python

关于我们|服务条款|联系我们|python爬取回车桌面图片|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！