python学习二 04 爬一个图片网站-解析文件，获得所有图

作者: 古典小说 | 来源:发表于2018-01-04 10:57 被阅读0次

python学习二 04 爬一个图片网站-解析文件，获得所有图
python学习二 05 爬一个图片网站-下载图片链接
python学习三 01 再爬一个网站，几行代码，搞定分类类别
python学习二 06 爬一个图片网站-多线程方式下载
Python 爬虫下篇
python 数据挖掘篇四小说数据挖掘实例
python 数据挖掘篇二词云统计
python 数据挖掘篇一结巴分词
python 数据挖掘篇三 gensim 使用
python学习三 02 再爬一个网站，获得所有分页

前面文章

Python安装

python自我学习一 python语法，及变量类型

python自我学习二爬一个图片网站上

python学习二 02 爬一个图片网站，获得主链接网址，并保存

python学习二 03 爬一个图片网站-获得所有分页网址

本节目的：解析下载到本地的文件，获得图片链接

所有相关的网址，都下载到本地了，下面我们依次解析，获得图片链接，然后将图片链接保存起来。

由上图，可看到

是一组，保存着背景图片，那我们解析的时候，将这一组图片，单独的放在一个文件夹background中

是另一组，解析的时候，单独的放在一个文件夹中

第一步，我们遍历目录，获得所有的文件路径

为此，我写了个函数

调用：

获得目录下的所有txt文件路径，保存在txtFileList中。

第二步解析文件，获得IMG路径

1、首先，针对不同分组，创建相应的子目录

是一组，保存着背景图片，那我们解析的时候，将这一组图片，单独的放在一个文件夹background中

我们将右侧的数字去掉，剩下的字符串作为这一组的类别

分析网页源码

图像链接保存在class=subcontents的div下，

为此我写了个函数

调用

获得文件中，所有图片的链接列表

这一过程的详细代码如下：

网友评论

本文标题：python学习二 04 爬一个图片网站-解析文件，获得所有图

本文链接：https://www.haomeiwen.com/subject/cetrnxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

python学习二 04 爬一个图片网站-解析文件，获得所有图

相关文章