美文网首页
python学习 二 04 爬一个图片网站-解析文件,获得所有图

python学习 二 04 爬一个图片网站-解析文件,获得所有图

作者: 古典小说 | 来源:发表于2018-01-04 10:57 被阅读0次

    前面文章

    Python安装

    python自我学习 一 python语法,及变量类型

    python自我学习 二 爬一个图片网站上

    python学习 二 02 爬一个图片网站,获得主链接网址,并保存

    python学习 二 03 爬一个图片网站-获得所有分页网址

    本节目的:解析下载到本地的文件,获得图片链接

    所有相关的网址,都下载到本地了,下面我们依次解析,获得图片链接,然后将图片链接保存起来。

    由上图,可看到

    是一组,保存着背景图片,那我们解析的时候,将这一组图片,单独的放在一个文件夹background中

    是另一组,解析的时候,单独的放在一个文件夹中

    第一步,我们遍历目录,获得所有的文件路径

    为此,我写了个函数

    调用:

    获得目录下的所有txt文件路径,保存在txtFileList中。

    第二步 解析文件,获得IMG路径

    1、首先,针对不同分组,创建相应的子目录

    是一组,保存着背景图片,那我们解析的时候,将这一组图片,单独的放在一个文件夹background中

    我们将右侧的数字去掉,剩下的字符串作为这一组的类别

    分析网页源码

    图像链接保存在class=subcontents的div下,

    为此我写了个函数

    调用

    获得文件中,所有图片的链接列表

    这一过程的详细代码如下:

    相关文章

      网友评论

          本文标题:python学习 二 04 爬一个图片网站-解析文件,获得所有图

          本文链接:https://www.haomeiwen.com/subject/cetrnxtx.html