美文网首页Python爬虫大数据 爬虫Python AI SqlPython爬虫作业
Python爬虫(二十二)_selenium案例:模拟登陆豆瓣

Python爬虫(二十二)_selenium案例:模拟登陆豆瓣

作者: 小七奇奇 | 来源:发表于2017-12-26 21:48 被阅读84次

    本篇博客主要用于介绍如何使用selenium+phantomJS模拟登陆豆瓣,没有考虑验证码的问题,更多内容,请参考:Python学习指南

    #-*- coding:utf-8 -*-
    
    from selenium import webdriver
    from selenium.webdriver.common.keys import Keys
    
    import time
    
    #如果获取页面时获取不到文本内容,加入下面参数
    driver = webdriver.PhantomJS(service_args=['--ignore-ssl-errors=true', '--ssl-protocol=any'])
    driver.set_window_size(1366, 768)
    driver.get("http://www.douban.com/")
    
    print(driver.page_source)
    #输入账号和密码
    
    driver.find_element_by_name("form_email").send_keys("xxxxx@qq.com")
    driver.find_element_by_name("form_password").send_keys('xxxx')
    
    #模拟点击登录
    driver.find_element_by_xpath("//input[@class='bn-submit']").click()
    
    #等待3秒
    time.sleep(3)
    
    #生成登录后快照
    
    with open('douban.html', 'w') as file:
        file.write(driver.page_source.encode('UTF-8'))
    
    driver.quit()
    

    期初使用driver = webdriver.PhantomJS(),返回的只是<html><head></head><body></body></html>,增加了参数就可以了

    参考:

    1. 获取不到内容,问题参考
    2. Selenium与phantomJS 登入豆瓣 有bug
    3. Python实例:通过selenium模拟登陆豆瓣

    相关文章

      网友评论

      本文标题:Python爬虫(二十二)_selenium案例:模拟登陆豆瓣

      本文链接:https://www.haomeiwen.com/subject/gogegxtx.html