美文网首页
Python 爬虫 - selenium动态渲染页面爬取

Python 爬虫 - selenium动态渲染页面爬取

作者: 莫名ypc | 来源:发表于2019-01-07 10:22 被阅读0次

    selenium

    from selenium import webdriver
    from selenium.common.exceptions import TimeoutException
    from selenium.webdriver.common.by import By
    from selenium.webdriver.support.ui import WebDriverWait
    from selenium.webdriver.support import expected_conditions as EC
    from selenium.webdriver import ActionChains
    
    
    def f1(browser):
        # 访问页面
        browser.get('https://www.mkv99.com/vod-detail-id-9462.html')
        # # 获取渲染后的页面内容
        # print(browser.page_source)
        # # 获取当前网址
        # print(browser.current_url)
        # # 获取浏览器cookie
        # print(browser.get_cookies())
    
        # # 根据id获取单个节点
        # input1 = browser.find_element_by_id('1thUrlid第01集')
        # print(input1)
        # # # 获取节点属性
        # print(input1.get_attribute('href'))
        
        # # 用css选择器获取单个节点
        # input_list = browser.find_elements_by_css_selector('.dwon2')
        # for item in input_list:
        #   print(item.get_attribute('href'))
        # print(input2.get_attribute('href'))
        # # # 获取节点的坐标
        # print(input2.location)
        # # # 获取节点的宽高
        # print(input2.size)
    
        # # 用xpath方法获取单个节点
        # input3 = browser.find_element_by_xpath('//*[@class="dwon2"]')
        # print(input3.get_attribute('id'))
    
        # # 根据name获取单个节点
        # input4 = browser.find_element_by_name('CopyAddr1')
        # print(input4.tag_name)
    
        # # 根据链接文字获取单个节点
        # input5 = browser.find_element_by_link_text('今日更新')
        # input6 = browser.find_element_by_partial_link_text('教程')
        # # 获取节点文本值
        # print(input5.text)
        # print(input6.text)
    
    
    def f2(browser):
        browser.get('http://www.runoob.com/try/try.php?filename=jqueryui-api-droppable')
        # 切换到指定iframe
        browser.switch_to.frame('iframeResult') 
        source = browser.find_element_by_css_selector('#draggable')
        target = browser.find_element_by_css_selector('#droppable')
        # 动作链
        actions = ActionChains(browser)
        # 将选定的源移动到目标的位置
        actions.drag_and_drop(source, target)
        actions.perform()
    
    
    def main():
        # 使用chrome浏览器
        browser = webdriver.Chrome()
        # 使用Firefox浏览器
        # browser = webdriver.Firefox()
        # 使用Edge浏览器
        # browser = webdriver.Edge()
        # 使用Phantom浏览器
        # browser = webdriver.PhatomJS()
        # 使用Safari浏览器
        # browser = webdriver.Safari()
    
        try:
            f2(browser)
        finally:
            # 关闭浏览器
            browser.close()
    
    
    if __name__ == '__main__':
        main()
    
    

    相关文章

      网友评论

          本文标题:Python 爬虫 - selenium动态渲染页面爬取

          本文链接:https://www.haomeiwen.com/subject/stiyrqtx.html