Python 爬虫 - selenium动态渲染页面爬取

作者: 莫名ypc | 来源:发表于2019-01-07 10:22 被阅读0次

Python 爬虫 - selenium动态渲染页面爬取
Selenium 爬取动态渲染页面
Python学习
使用Selenium爬取动态渲染页面
在Scrapy中运用Selenium和Chrome
Python学习
使用Selenium模拟浏览器行为
QQ空间爬虫，打造历时说说词云图，python来唤醒你的记忆！
CentOS7上使用Chrome的无头浏览器
selenium被识别为爬虫怎么办

selenium

from selenium import webdriver
from selenium.common.exceptions import TimeoutException
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver import ActionChains


def f1(browser):
    # 访问页面
    browser.get('https://www.mkv99.com/vod-detail-id-9462.html')
    # # 获取渲染后的页面内容
    # print(browser.page_source)
    # # 获取当前网址
    # print(browser.current_url)
    # # 获取浏览器cookie
    # print(browser.get_cookies())

    # # 根据id获取单个节点
    # input1 = browser.find_element_by_id('1thUrlid第01集')
    # print(input1)
    # # # 获取节点属性
    # print(input1.get_attribute('href'))
    
    # # 用css选择器获取单个节点
    # input_list = browser.find_elements_by_css_selector('.dwon2')
    # for item in input_list:
    #   print(item.get_attribute('href'))
    # print(input2.get_attribute('href'))
    # # # 获取节点的坐标
    # print(input2.location)
    # # # 获取节点的宽高
    # print(input2.size)

    # # 用xpath方法获取单个节点
    # input3 = browser.find_element_by_xpath('//*[@class="dwon2"]')
    # print(input3.get_attribute('id'))

    # # 根据name获取单个节点
    # input4 = browser.find_element_by_name('CopyAddr1')
    # print(input4.tag_name)

    # # 根据链接文字获取单个节点
    # input5 = browser.find_element_by_link_text('今日更新')
    # input6 = browser.find_element_by_partial_link_text('教程')
    # # 获取节点文本值
    # print(input5.text)
    # print(input6.text)


def f2(browser):
    browser.get('http://www.runoob.com/try/try.php?filename=jqueryui-api-droppable')
    # 切换到指定iframe
    browser.switch_to.frame('iframeResult') 
    source = browser.find_element_by_css_selector('#draggable')
    target = browser.find_element_by_css_selector('#droppable')
    # 动作链
    actions = ActionChains(browser)
    # 将选定的源移动到目标的位置
    actions.drag_and_drop(source, target)
    actions.perform()


def main():
    # 使用chrome浏览器
    browser = webdriver.Chrome()
    # 使用Firefox浏览器
    # browser = webdriver.Firefox()
    # 使用Edge浏览器
    # browser = webdriver.Edge()
    # 使用Phantom浏览器
    # browser = webdriver.PhatomJS()
    # 使用Safari浏览器
    # browser = webdriver.Safari()

    try:
        f2(browser)
    finally:
        # 关闭浏览器
        browser.close()


if __name__ == '__main__':
    main()