美文网首页HTTP
小白白用python POST模拟登录百度

小白白用python POST模拟登录百度

作者: bbjoe | 来源:发表于2016-08-19 23:21 被阅读0次

    我的结果

    只是登录成功而已

    我的代码(模仿对象:单行道

    # -*- coding: utf-8 -*-
    import requests
    import re
    from lxml import etree
    
    
    def login_baidu(user, password):
        # get之后获得cookies
        session.get('http://www.baidu.com')
        session.get('https://passport.baidu.com/v2/api/?login')
        # 带着cookies访问,获取token
        token_data = session.get('https://passport.baidu.com/v2/api/?getapi&tpl=mn&apiver=v3').text
        token = re.findall(r'"token" : "(.*?)"', token_data)[0]
        print(token)
    
        # 构造headers
        headers = {
            'Host': 'passport.baidu.com',
            "User-Agent": "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/52.0.2743.116 Safari/537.36",
            'Content-Type': 'application/x-www-form-urlencoded',
            'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8',
            'Accept-Encoding': 'gzip, deflate, br',
            'Accept-Language': 'h-CN,zh;q=0.8,en;q=0.6'
        }
    
        # 构造POST data
        data = {
            'staticpage': 'https://www.baidu.com/cache/user/html/v3Jump.html',
            'charset': 'utf-8',
            'token': token,
            'tpl': 'mn',
            'apiver': 'v3',
            'tt': '1471614939403',
            'safeflg': '0',
            'u': 'https://www.baidu.com/',
            'isPhone': 'false',
            'quick_user': '0',
            'loginmerge': 'true',
            'logintype': 'dialogLogin',
            'username': user,
            'password': password,
            'ppui_logintime': '4173',
            'callback': 'parent.bd__pcbs__nmm7i5'
        }
    
        login = session.post('https://passport.baidu.com/v2/api/?login', data=data, headers=headers)
        if 'BDUSS' in session.cookies:
            print("登录成功")
        else:
            print("登录失败")
    
        web_data = session.get('http://www.baidu.com').text
        page = etree.HTML(web_data)
        my_name = page.xpath(u'//span[@class="user-name"]/text()')
        print(my_name)
    
    
    if __name__ == '__main__':
        # 构造一个会话,用来跨请求保存cookie
        session = requests.Session()
        user = '用户名'
        password = '密码'
        login_baidu(user, password)
    

    我的理解

    以我目前非常浅薄的经验和知识,模拟登录其实是:

    1. 找到登录地址(https://passport.baidu.com/v2/api/?login
    2. 拼凑登录data
    3. 获取data里面不能直接复制,同时又不可或缺的部分,此例中只有token
    4. token来自于一个地址(https://passport.baidu.com/v2/api/?getapi&tpl=mn&apiver=v3
    5. 这个地址截取自于一个js地址(我只是觉得能短则短)


      神秘的JS

    这个js地址是个密,我也不清楚我是怎么发现的。对,我还没有正式学会分析网页登陆过程。

    1. 在python中访问这个地址,从页面内容中用正则提取出token的部分。
    2. 对了,必须要带着cookies访问这个地址才能正常出现token,否则不能。
    3. 怎么“带着cookies”呢,在访问js之前,先get一下登陆地址和百度首页(非要两个同时吗?我也不知)
    4. 好,现在有token了,可以拼装data了
    5. data的剩余部分和headers的都来自一个访问方式为POST的doc文件


      POST doc
    6. 带上上面的headers、data放进login = session.post('https://passport.baidu.com/v2/api/?login', data=data, headers=headers)里面
    7. 最后通过cookies来验证是否访问成功
    8. 顺便我又get了一下首页,解析出了我的用户名

    我的感想

    模拟登陆是一门技术活,我刚刚才开始。

    相关文章

      网友评论

        本文标题:小白白用python POST模拟登录百度

        本文链接:https://www.haomeiwen.com/subject/xyzbsttx.html