美文网首页程序员
黑板课爬虫闯关 - 第二关

黑板课爬虫闯关 - 第二关

作者: MA木易YA | 来源:发表于2018-11-27 19:23 被阅读19次

第二关比较简单,只是在密码上一个一个循环即可,直接上代码,注意在传输数据时用到的请求方法是POST,其他的都比较基础,同样给出两种版本,可以参考

image.png
one.py
import re
import requests



if __name__ == '__main__':

    data = {'username': 'test'}

    url = 'http://www.heibanke.com/lesson/crawler_ex01/'

    for num in range(1, 31):
        data['password'] = num
        print(data)
        html = requests.post(url,data).content.decode('utf-8')
        result = re.findall('您输入的密码错误, 请重新输入', html)
        if result:
            print("错误")
        else:
            print('闯关成功,下一关网址是:http://www.heibanke.com' + re.findall('<a href="(.*?)" class', html)[0])
            break

two.py

import re
import requests
import time

def main():
    url = 'http://www.heibanke.com/lesson/crawler_ex01/'
    for psd in range(30):
        print(f'test password {psd}')
        r = requests.post(url, data={'username': 'test', 'password': psd})
        html = r.text
        if '密码错误' not in html:
            m = re.search('(?<=\<h3\>).*?(?=\</h3\>)', html)
            print(m.group())
            m = re.search('(\<).*?href="([^"]*?)".*?(\>下一关\</a\>)', html)
            print(f'下一关 http://www.heibanke.com{m.group(2)}')
            return
        else:
            time.sleep(1)


if __name__ == '__main__':
    main()
  • 更多代码详情参考我的Github

相关文章

  • 黑板课爬虫闯关 - 第二关

    第二关比较简单,只是在密码上一个一个循环即可,直接上代码,注意在传输数据时用到的请求方法是POST,其他的都比较基...

  • 黑板客爬虫闯关通关

    黑板客爬虫闯关通关 爬虫学的好 牢房进的早 前言 黑板客爬虫闯关共5关 http://www.heibanke.c...

  • 黑板客爬虫闯关

    第一关:url: http://www.heibanke.com/lesson/crawler_ex00/打开网页...

  • 黑板课爬虫闯关 - 第四关

    第四关增加了登录验证和密码获取,主页面如下: 但是想要进入主页面需要先登录: 进去后可以随便试下密码,果然错误,然...

  • 黑板课爬虫闯关 - 第五关

    这里是黑板课爬虫闯关第五关 同样的需要登陆 在前面的基础上,虽然没有第四关那么复杂,但这里增加了验证码环节,这个很...

  • 插画闯关训练 | 第二关总结

    插画闯关训练第二关已经结束啦!第二关的任务是临摹30张喜欢的作品,现围绕第二关进行总结。 ❤️❤️❤️第二关闯关步...

  • Python 爬虫闯关(第二关)

    在上次第一关爬虫闯关成功后,我们会得到第二关的地址:http://www.heibanke.com/lesson/...

  • 【爬虫】通关黑板客爬虫闯关游戏

    最近看到的一个关于Python爬虫的闯关游戏,手痒,试他一试。 第一关 地址:http://www.heibank...

  • 黑板课爬虫闯关 - 第一关

    第一关 主要是构建链接,令它一直获取网页,知道获取到除了输入数字以外的内容,提供两种方式,原理都差不多,都是主要用...

  • 黑板课爬虫闯关 - 第三关

    第三关相对之前的增加了登录这一块,首先需要先进行模拟登录,然后获取到cookie里面的登录验证csrf才能进行数据...

网友评论

    本文标题:黑板课爬虫闯关 - 第二关

    本文链接:https://www.haomeiwen.com/subject/cvenqqtx.html