Python爬虫从入门到出轨

作者: c37d344afd22 | 来源:发表于2017-01-12 16:39 被阅读1569次

Python爬虫从入门到出轨
3分钟带你了解世界第一语言Python 入门上手也这么简单！
Django 创建第一个项目
使用UiAutomator操作Android(第十章)
2018-12-24 网页爬虫第一天
爬虫大神集锦
学渣讲爬虫之Python爬虫从入门到出门（第一讲）
Python爬虫：什么是爬虫？怎么样玩爬虫？
改变世界到语言—python，看完才知道从事python凭什么高
Python网络爬虫（八） - 利用有道词典实现一个简单翻译程序

好久都没写文章了，搞Android搞得脑袋大，换换心情。俗话说的好，每年学一种新的编程语言，学习它的语法也有利于你主力语言的学习（这谁说的？）

其实我觉得学习一门新的语言无非就是想做些什么事情，也就是兴趣所在

提到爬虫，肯定第一个想到的语言就是Python，当然了我也不例外。果断买了两本书（这个毛病从哪来的(╯‵□′)╯︵┻━┻），由于有其他语言的基础，学起来也不是很费力（当然生成器什么鬼的还是没有理解），了解了一些常用的库和语法之后就开始了爬虫之旅

闲话不多扯，说说我爬的数据吧

糗百（新手必经之路）
豆瓣电影TOP250（必经之路）
黑丝吧（🙈）
你的名字（壁纸）
本人公司后台统计的所有用户（不会被起诉吧 23333）

用到的库：

requests

BeautifulSoup

糗百的代码不知道放在哪找不到了，就看看豆瓣的吧

三十多行代码就可以把豆瓣电影TOP250给爬下来，当然这里用到了各种库，不然写起来也比较麻烦。

分析一下豆瓣电影TOP250的网站，发现规律后就可以写代码了。直接递归getMovie()方法就可以获取所有的数据了。

公司用户的信息

弄公司用户信息的话就要模拟登陆，登陆成功之后可以去获取信息，并且用的都是POST，这个时候就需要抓包了。由于本人是Mac用户，所以抓包工具用的是Charles，每次免费30分钟，感觉还是很友好的。

模拟登陆就要用到cookie之类的东西了，本人对这方面研究还不是很深。而恰巧requests有这个功能s = requests.Session()，后面就用s来进行GET/POST请求就好了，Cookie之类的就都不用操心啦

你们都想看的来了

啊，写这个的时候只是出于无聊，想着给群友们发福利。然后就写了一个这个爬黑丝吧。但是有一个缺陷就是没有只看楼主，所以别人顶楼发的图片也都下载下来了。这里我设置了只爬回帖数在200-100000之间的帖子，只爬取第一页的。如果各位有兴/性趣的话可以下载一下代码看看咯

最后送上代码地址

另外有搞前端的小伙伴们推荐一下我朋友的公众号，分享的都是干货，二维码在这里

公众号.jpg

最后

爱生活，爱小丽

Python爬虫从入门到出轨
好久都没写文章了，搞Android搞得脑袋大，换换心情。俗话说的好，每年学一种新的编程语言，学习它的语法也有利于...
3分钟带你了解世界第一语言Python 入门上手也这么简单！
一、Python入门 1. Python爬虫入门一之综述 Python爬虫入门二之爬虫基础了解 Python爬虫入...
Django 创建第一个项目
python3之Django基础篇 python爬虫从入门到放弃（八）之 Selenium库的使用
使用UiAutomator操作Android(第十章)
本内容是 python爬虫开发从入门到实战谢乾坤著(对新手很友好的入门爬虫书籍), 1.安装JPE 访问htt...
2018-12-24 网页爬虫第一天
Python爬虫从入门到出门第一天 1.1 目录 1.1 目录 1.2 爬虫的常用形式 1.3 爬虫的基本原理 ...
爬虫大神集锦
python爬虫从入门到放弃系列：http://www.cnblogs.com/zhaof/tag/%E7%88%...
学渣讲爬虫之Python爬虫从入门到出门（第一讲）
目录学渣讲爬虫之Python爬虫从入门到出门第一讲目录爬虫的常用形式爬虫的基本原理前期准备简单爬虫爬...
Python爬虫：什么是爬虫？怎么样玩爬虫？
本次专辑我打算出【Python爬虫】，从0到1带大家入门爬虫到精通爬虫，接下来会有更加精彩的内容。关注我，跟着我一...
改变世界到语言—python，看完才知道从事python凭什么高
在这严酷的夏季，赠送你2019最新、最完整的python资料，以下资料三选一从python入门到爬虫、从py...
Python网络爬虫（八） - 利用有道词典实现一个简单翻译程序
目录： Python网络爬虫（一）- 入门基础Python网络爬虫（二）- urllib爬虫案例Python网络爬...

网友评论

橘子周二:难道python除了用来做爬虫就没别的更有意思的吗
另外，政府正在和各大互联网巨头协定中国xx数据安全协议法。
不久爬虫非法了~

xacker:多写点关于python的就好拉，git啦

鬼晓晓:标题gay里gay气的先举报了再说 (-.-)

c37d344afd22:@鬼才晓得

1d675d39473b:进步啦

c37d344afd22: @璐璐弟弟哈哈，谢谢我老婆的支持！

呵呵呵呵呵呵哒:一年学一门新的编程语言，真棒！

救兵请来的猴子:我也感兴趣，去爬黑丝吧

c37d344afd22:@Skate_Liu 2333333

__Objc:渣渣用mac竟然不用oc爬？

c37d344afd22:@救兵请来的猴子哈哈哈可以啊

一个很帅的蓝孩子:厉害了 Python好学吗

c37d344afd22:@一个很帅的蓝孩子 Python现在是语言排行榜第三名，用的还是蛮多的。

一个很帅的蓝孩子:@爱小丽没有接触，谈不上兴趣了！以后都是要学一点各种语言啦，学Python工作好找吗

c37d344afd22:@一个很帅的蓝孩子每一门语言都是入门简单，深入难。但是python生来就比别的语言简单，看兴趣所在咯

OnlyOneCap:哈哈，挺有趣的尝试。赞！

c37d344afd22: @黑瞳白眼哈哈，谢谢支持

6702fcf36fec:Mark

c37d344afd22: @IMJIE 谢谢咯

xiasuhuei321:辣鸡，有本事用安卓爬

c37d344afd22: @南宫尘全球最大同性交友中心github(gayhub)

南宫尘:@CoderFan github吧

c37d344afd22: @xiasuhuei321 妈个鸡你等着，我研究研究

橘子周二:难道python除了用来做爬虫就没别的更有意思的吗
另外，政府正在和各大互联网巨头协定中国xx数据安全协议法。
不久爬虫非法了~
xacker:多写点关于python的就好拉，git啦
鬼晓晓:标题gay里gay气的先举报了再说 (-.-)
c37d344afd22:@鬼才晓得
1d675d39473b:进步啦
c37d344afd22: @璐璐弟弟哈哈，谢谢我老婆的支持！
呵呵呵呵呵呵哒:一年学一门新的编程语言，真棒！
救兵请来的猴子:我也感兴趣，去爬黑丝吧
c37d344afd22:@Skate_Liu 2333333
__Objc:渣渣用mac竟然不用oc爬？
c37d344afd22:@救兵请来的猴子哈哈哈可以啊
一个很帅的蓝孩子:厉害了 Python好学吗
c37d344afd22:@一个很帅的蓝孩子 Python现在是语言排行榜第三名，用的还是蛮多的。
一个很帅的蓝孩子:@爱小丽没有接触，谈不上兴趣了！以后都是要学一点各种语言啦，学Python工作好找吗
c37d344afd22:@一个很帅的蓝孩子每一门语言都是入门简单，深入难。但是python生来就比别的语言简单，看兴趣所在咯
OnlyOneCap:哈哈，挺有趣的尝试。赞！
c37d344afd22: @黑瞳白眼哈哈，谢谢支持
6702fcf36fec:Mark
c37d344afd22: @IMJIE 谢谢咯
xiasuhuei321:辣鸡，有本事用安卓爬
c37d344afd22: @南宫尘全球最大同性交友中心github(gayhub)
南宫尘:@CoderFan github吧
c37d344afd22: @xiasuhuei321 妈个鸡你等着，我研究研究

Python爬虫从入门到出轨

最后

爱生活，爱小丽

相关文章

Python爬虫从入门到出轨

3分钟带你了解世界第一语言Python 入门上手也这么简单！

Django 创建第一个项目

使用UiAutomator操作Android(第十章)

2018-12-24 网页爬虫第一天

爬虫大神集锦

学渣讲爬虫之Python爬虫从入门到出门（第一讲）

Python爬虫：什么是爬虫？怎么样玩爬虫？

改变世界到语言—python，看完才知道从事python凭什么高

Python网络爬虫（八） - 利用有道词典实现一个简单翻译程序

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

自动化测试

首页投稿（暂停使用，暂停投稿）

程序员

大数据爬虫Python AI Sql

Python开发