微信、知乎、新浪随意爬

微信、知乎、新浪随意爬

作者: 苏克1900 | 来源:发表于2019-03-20 13:35 被阅读45次

微信、知乎、新浪随意爬
Python 实战项目
用python爬过这些网站，才敢说自己会爬虫！
520快速分手指南
一百年后，还有人吃粽子吗？
那些曾被爱情放弃的人
网络平台这些事儿
肥宅快乐抖音
贱人多忘事：那些欠你钱的家伙躲哪过年了？
如何阻止女朋友过儿童节？

摘要：介绍微信、知乎、新浪等一众主流网站的模拟登陆爬取方法。

网络上有形形色色的网站，不同类型的网站爬虫策略不同，难易程度也不一样。从是否需要登陆来说，一些简单网站不需要登陆就可以爬，比如之前爬过的猫眼电影、东方财富网等。有一些网站需要先登陆才能爬，比如知乎、微信等。这类网站在模拟登陆时需要处理验证码、js 加密参数这些问题，爬取难度会大很多。费很大力气登陆进去后才能爬取想要的内容，很花时间。

是不是一定要自己动手去实现每一个网站的模拟登陆方法呢，从效率上来讲，其实大可不必，已经有前人替我们造好轮子了。

最近发现一个神库，汇总了数十个主流网站的模拟登陆方法：

这些网站基本采用是直接登录或者使用 selenium+webdriver 的方式。每一个网站都有完整的模拟登陆代码，拿来就可以用到自己的爬虫中。

下面我们来测试一下。

先说说很难爬的「知乎」，假如我们想爬取知乎主页的 HTML 内容，就必须要先登陆才能爬，不然看不到这个界面。下面来简单梳理一下流程。

image

image

知乎需要手机号才能注册登陆。为了方便测试，可以随便找个手机号，手机号到哪儿去找呢，我上周写的那篇文章就发挥作用了。文章里介绍了一个免费电话号码网站，用上面的手机号可以成功注册。

文章传送门：两个神网站保护你的隐私

image

image

顺利登录后就可以进入主页了。

下面，我们用这个库提供的代码来模拟登陆，输出主页 HTML 内容作测试。操作很简单，只需要输入手机号、密码和验证码就可以了。

image

成功登陆后，接下来就可以做一些有意思的事了。比如曾有人爬取所有知乎账号的信息，分析了知乎用户群体画像。

是不是有点意思。

再来看看微信。用上面的微信代码可以把全部微信好友信息爬取下来，比如：昵称、性别、地域、个性签名。接着可以分析一下你的朋友圈是什么样的，应该会很有趣。

[图片上传失败...(image-7fdfab-1553060060700)]

还可以爬 B 站：

[图片上传失败...(image-66a1c4-1553060060700)]

还可以爬链家租房信息：

[图片上传失败...(image-2d566d-1553060060700)]

还有很多实用有趣的内容，就不一一罗列了，感兴趣的话可以试试，最后放上 GitHub 库地址：

https://github.com/CriseLYJ/awesome-python-login-model

不要闷头造轮子，多抬抬头会发现你在做/想做的东西，别人早已经弄好了，拿来用或者参考学习都是件好事。

本文完。

相关文章

微信、知乎、新浪随意爬
摘要：介绍微信、知乎、新浪等一众主流网站的模拟登陆爬取方法。网络上有形形色色的网站，不同类型的网站爬虫策略不同，...
Python 实战项目
web机器人 web实战博客BBS论坛系统成绩管理系统新闻系统爬取知乎爬取豆瓣爬取京东爬取新浪微博 ...
用python爬过这些网站，才敢说自己会爬虫！
摘要：微信、知乎、新浪等主流网站的模拟登陆爬取方法。网络上有形形色色的网站，不同类型的网站爬虫策略不同，难易程度...
520快速分手指南
-----一条温柔点的广告------ 新浪微博：@文案摇滚帮知乎：文摇合作加微信：wenyaoxiaomei
一百年后，还有人吃粽子吗？
-----一条世界和平的广告------ 新浪微博：@文案摇滚帮知乎：文摇合作加微信：wenanyaogunbang
那些曾被爱情放弃的人
-----一条珍惜爱情的广告------ 新浪微博：@文案摇滚帮知乎：文摇合作加微信：wenanyaogunbang
网络平台这些事儿
自从近几年网络平台盛行，没少加入其中。先后注册过新浪微博、新浪博客、QQ和QQ空间、美篇、微信、小红书、B站、知乎...
肥宅快乐抖音
-----一条心疼肥宅的推送------ 新浪微博：@文案摇滚帮知乎：文摇合作加微信：wenyaoxiaomei
贱人多忘事：那些欠你钱的家伙躲哪过年了？
--- 一条用真实故事安利的广告 --- 新浪微博：@文案摇滚帮知乎：文摇合作加微信：wenanyaogunbang
如何阻止女朋友过儿童节？
-----一条求生欲超强的广告------ 新浪微博：@文案摇滚帮知乎：文摇合作加微信：wenanyaogun...

网友评论

转行学 Python

本文标题：微信、知乎、新浪随意爬

本文链接：https://www.haomeiwen.com/subject/kkuzmqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

转行学 Python

热点阅读

转行学 Python

关于我们|服务条款|联系我们|微信、知乎、新浪随意爬|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！