通过Python3 爬虫抓取漫画图片

通过Python3 爬虫抓取漫画图片

作者: 住在北京的河北人 | 来源:发表于2018-12-27 15:50 被阅读5次

通过Python3 爬虫抓取漫画图片
通过Python爬虫抓取漫画图片
Python3爬虫环境配置——请求库安装（附Firefox和Ch
对于Python3爬虫抓取网页中文出现输出乱码
第13章实战：原生爬虫
Python3爬虫抓取东方财富网股票数据并实现MySQL数据库存
数据埋点方案简述
Python 爬虫
Python3爬虫环境配置——解析库安装（附tesserocr安
Python3操作Excel-以豆瓣图书Top250为例

引言：

最近闲来无事所以想着学习下python3，看了好长时间的文档，于是用python3写了一个漫画抓取的程序，好了废话不多说上码！

第一步：

准备环境和类库，我用的是python3.5 禁用 python2.x ！禁用 python2.x ！禁用 python2.x ！

用到的类库：requests lxml bs4 fake_useragent pymysql

这里你 pip 安装也好或者用pycharm

pycharm 引包位置

第二步：找漫画网站

先说好本教程仅供学习交流禁止用于商务用途和其他用途
我选了一家相对还不错的漫画网站，各位小伙伴没事可以去看看
传送门： https://www.mkzhan.com

第三步：开始编程了准备好小伙伴

好了先导包

然后那编辑几个需要用到的方法

先做一个请求网页的方法

在这里headers 需要配置一个user-agent,否则很容易就会被对方服务器发现你是爬虫那

然后创建一个图片检测方法，毕竟图片损坏了你下载下来也没用

先抓详情来分析下页面结构

嗯这是我找出一些有用的信息，不过今天我们只用到标题封面和章节，然后哪章节列表举栗子，先上码

分析下li 特性 class 里都有一个参数 j-chapter-item 那好 find_all 把符合规则的拿出来
然后根据标题创建文件夹，同时根据封面的页面规则抓到封面的img 放到之前写好的 get_img 方法里检测下，然后open 下载下来

刚刚抓好的章节列表遍历下，毕竟我们要把每章节的每张有用图片下载下来

新建一个章节的抓取方法

这里要把章节里的图片抓取出来
按照上面分析下html结构，根据规则做相应的抓取并将图片下载到相应的位置

结果：

好了大功告成，代码虽然很比较low 但毕竟一个初级学员大神勿喷
相对于想开始尝试做一下python抓取的同学很合适哦

不多说上源码 github：传送门

相关文章

通过Python3 爬虫抓取漫画图片
引言：最近闲来无事所以想着学习下python3，看了好长时间的文档，于是用python3写了一个漫...
通过Python爬虫抓取漫画图片
无聊浏览某漫画网站（你懂的。-_-），每次翻页时都需要重新请求整个页面，页面杂七杂八的内容过多，导致页面加载过程耗...
Python3爬虫环境配置——请求库安装（附Firefox和Ch
Python3爬虫环境配置——请求库安装一、常用库爬虫主要分为三步：抓取页面、分析页面以及存储数据。抓取页面是...
对于Python3爬虫抓取网页中文出现输出乱码
对于Python3爬虫抓取网页中文出现输出乱码 import urllib.request response = ...
第13章实战：原生爬虫
第13章所讲重点为：原生爬虫 13-1分析抓取目的确定抓取页面打印效果如下：在做爬虫的时候Python3中很有...
Python3爬虫抓取东方财富网股票数据并实现MySQL数据库存
1. 环境： windows10 python3 mysql 5.7 2.Python爬虫抓取网页数据并保存到本地...
数据埋点方案简述
数据是机器学习的前提，前面使用Python爬虫抓取数据篇介绍了通过爬虫抓取网页的方式采集数据。对于新产品，最重...
Python 爬虫
一、背景某个比赛要从网上抓取图像，于是做了简单爬虫入门。二、基础 1、首先是python3的urllib，获取...
Python3爬虫环境配置——解析库安装（附tesserocr安
Python3爬虫环境配置——解析库安装（附tesserocr安装方法）抓取网页代码后，第二步就是提取信息，为了...
Python3操作Excel-以豆瓣图书Top250为例
本文利用Python3爬虫抓取豆瓣图书Top250，并利用xlwt模块将其存储至excel文件，图片下载到相应目录...

网友评论

程序员

本文标题：通过Python3 爬虫抓取漫画图片

本文链接：https://www.haomeiwen.com/subject/dbyrlqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

程序员

关于我们|服务条款|联系我们|通过Python3 爬虫抓取漫画图片|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！