爬虫的攻防战:爬虫与反爬虫的博弈 - 知乎 (zhihu.com)(博客)
昨天晚上写了一个爬虫,一直有问题,一直修改到网站,然后发现这个网站做了反爬虫,不愧是豆瓣 之前被爬的太多了,但是豆瓣还是挺友好的他的反爬虫机制不是特别难,然后顺便破解了一下,豆瓣的反爬虫是:检测请求头中的字段,比如:User-Agent、referer等字段,我的解决办法是创建一个新的请求,然后加入请求头字段进行模拟请求,然后实现爬虫功能。具体写一篇博客,这上面代码都放不上。
然后分享一下我最近知道的一个非常好的事情,那就是收费软件都可以免费使用 纯纯的正版,具体操作如下:进入河南科技学院官网--打开校长信箱--校长信箱里面有人询问如何申请学生电子邮箱--然后按照方法进行申请,然后z之后就是填写一个表格用邮箱发过去就可以了,但是最近可能改变政策了,需要打印出来然后进行盖章申报,比较简单,最后去0#1102交给负责的老师即可。
表示刚刚交上表格,我的邮箱里面老师就发来了我申请的学生邮箱账号密码,真的好快,赞一下

网友评论