selenium-chromedriver多进程（seleniu

作者: 绝世一只猫 | 来源:发表于2017-08-29 17:30 被阅读0次

selenium-chromedriver多进程（seleniu
seleniu 初探
Selenium登录测试
selenium基于原生第二次封装
Selenium 使用 CSS locator 定位 HTML
python爬虫常用库介绍
UNIX基础--进程和守护进程
python selenium
Selenium2 简介
【转】Selenium 相关网站

很多人可能都没想过用selenium能做多线程爬虫
其实实现起来都是一样的简单

导入相关库

from selenium import webdriver
from multiprocessing.dummy import Pool

访问

def spider(url):
    driver = webdriver.Chrome('chromedriver')
    driver.get(url)
    html = driver.page_source
    print(html)
    driver.close()
    driver.quit()

控制

def run(x):
    url = 'https://www.baidu.com/s?wd=今天有哪些美女&pn={}'
    pages = []
    for i in range(0, x * 10, 10):
        page = url.format(i)
        pages.append(page)
    print(pages)
    pool = Pool(5)
    result = pool.map(spider, pages)
    pool.close()
    pool.join()
    return result

试一下

if __name__ == '__main__':
    run(10)

网友评论

我爱编程

本文标题：selenium-chromedriver多进程（seleniu

本文链接：https://www.haomeiwen.com/subject/cwfadxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

selenium-chromedriver多进程（seleniu

导入相关库

访问

控制

相关文章

selenium-chromedriver多进程（seleniu

seleniu 初探

Selenium登录测试

selenium基于原生第二次封装

Selenium 使用 CSS locator 定位 HTML

python爬虫常用库介绍

UNIX基础--进程和守护进程

python selenium

Selenium2 简介

【转】Selenium 相关网站

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

我爱编程