第一次写了个Python爬虫

第一次写了个Python爬虫

作者: CHJ_b064 | 来源:发表于2018-07-26 03:45 被阅读0次

Python爬虫学习之小结（一）
第一次写了个Python爬虫
Python 并发网络库 eventlet 性能测试
十年真ㆍPython大佬用爬虫赚钱的自述！看完学到了！
我用Python爬虫挣钱的那点事儿！
个人利用Python爬虫技术怎么挣钱
3分钟带你了解世界第一语言Python 入门上手也这么简单！
与优秀同行--读简书签约作者
golang爬虫初体验
爬取百度贴吧帖子

emm，学Python的时候看见别人写爬虫去爬表情包了，就自己也想写一个来玩。找的十个比较简单的网站。

起名字就有点皮，真的就只是皮一下

首先肯定用到的是requests包了 import requests

中间用了正则匹配，正则的包也要一下 import re

看了一下，斗图啦的图有1700多页，构造一下url列表：

有了url，就用requests里面的get去获取页面

获取到了页面之后用正则匹配一下我要的图的相关信息

自己试了一下发现直接爬被forbidden了，模拟一下浏览器，加一个User-Agent，为了装得像一点，加了一些别的字段，本来还加了别的，文件类型加上gzip之后要弄解压有点烦就不弄了，别的加多了反而更容易被封，就后来删掉了

然后可以获取到页面了，东西都存在imgList里面了，处理一下，把图的信息存到txt里面

顺便写一个东西看一下爬的进度，中间有东西出问题也会把问题存起来，问题不大

最后把范围定一下，运行

稳得一批

中间也遇到过一些问题，爬着爬着被禁了，爬的速度太快有被封，自己也查了一些办法，像做ip代理什么的，自己也用了随机生成User-Agent来骗它

这东西试了一下，用的西刺的代理，然后发现很不稳定。。就放弃了

最后试了半天，用sleep弄可以了。。很奇妙的是下午还不行的，晚上就行了，但是结果是有点慢，效率歇逼

还有一些更傻的东西。。

这东西本来是测试用的，忘记改过来了，把这一页爬了1000多次，怕不是个傻子。。emm引以为鉴

然后说起效率，本来想弄个多线程的，但是ip代理弄不好，还是会被封，很奇妙，读写加锁的问题也没想好，晚点看能不能把多线程的版本弄出来

相关文章

Python爬虫学习之小结（一）
到目前为止，Python爬虫学习已经写了八篇文章，分别是： Python爬虫学习（一）概述Python爬虫学习（二...
第一次写了个Python爬虫
emm，学Python的时候看见别人写爬虫去爬表情包了，就自己也想写一个来玩。找的十个比较简单的网站。首先肯定用...
Python 并发网络库 eventlet 性能测试
为什么写这篇测试之前写了一个Python的轻量级爬虫框架pycrawler，因为爬虫属于IO密集型程序，因此想到...
十年真ㆍPython大佬用爬虫赚钱的自述！看完学到了！
大佬写了10年Python，期间写了各种奇葩爬虫，挣各种奇葩的钱，于是他总结下几种爬虫挣钱的方式。 1.最典型的就...
我用Python爬虫挣钱的那点事儿！
在下写了10年Python，期间写了各种奇葩爬虫，挣各种奇葩的钱，写这篇文章总结下几种爬虫挣钱的方式。 1.最典型...
个人利用Python爬虫技术怎么挣钱
在下写了5,。6年Python，期间写了各种奇葩爬虫，挣各种奇葩的钱，写这篇文章总结下几种爬虫挣钱的方式。 1.最...
3分钟带你了解世界第一语言Python 入门上手也这么简单！
一、Python入门 1. Python爬虫入门一之综述 Python爬虫入门二之爬虫基础了解 Python爬虫入...
与优秀同行--读简书签约作者
两个月前写了一篇文章，《Python爬虫学习：简书签约作者知多少？》，用Python爬虫把简书签约作者从万千作者中...
golang爬虫初体验
最近在学习golang,看网上很多人都喜欢爬豆瓣，今天我就写了一个golang版的爬虫。对于python爬虫，我很...
爬取百度贴吧帖子
依然是参考教程 Python爬虫实战一之爬取百度贴吧帖子。作者崔庆才写了很多关于Python爬虫的文章，大家有兴趣...

网友评论

大数据爬虫Python AI Sql

本文标题：第一次写了个Python爬虫

本文链接：https://www.haomeiwen.com/subject/xmlvmftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

大数据爬虫Python AI Sql

热点阅读

大数据爬虫Python AI Sql

关于我们|服务条款|联系我们|第一次写了个Python爬虫|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！