python爬虫(4)-多线程

python爬虫(4)-多线程

作者: 初灬终 | 来源:发表于2017-11-27 21:22 被阅读3次

男子大学生的無駄日常
python爬虫(4)-多线程
[CP_12] Python多线程爬虫应用实践(社招职位名称获取
Python爬虫基础教程（三）
Python爬虫技巧-西瓜视频MP4地址获取并下载
四. 开发网络爬虫的语言
基于asyncio与aiohttp实现异步爬虫
多线程爬虫
18年学习技术列表
Python 爬虫多线程

环境：python3.6
目标：下载整本小说。(使用多线程）

import requests
import re
import threading

#下载小说章节
class MyThread(threading.Thread):

    def __init__(self, threadID, threadName, url):
        threading.Thread.__init__(self)
        self.threadID = threadID
        self.threadName = threadName
        self.url = url

    def run(self):
        itemurl = self.url + '.html'
        itemreq = requests.get(baselink + itemurl)
        itemreq.encoding = 'utf-8'
        itemf = open(itemurl, 'w')
        itemf.write(itemreq.text)
        itemf.close()

#找到所有的html字段
def findLinks(htmlstring):
    linkPattern = re.compile("href=\"(.+?).html\"")
    return linkPattern.findall(htmlstring)

# 抓去网页内容
baselink = 'http://chuanyuezhe.yetianzi.com'
req = requests.get(baselink)
req.encoding = 'utf-8'

# 找到章节链接
alllink = findLinks(req.text)

# 抓取所有章节的内容
for item in alllink:
    thread = MyThread(alllink.index(item),item+"%s"% alllink.index(item),item)
    thread.start()
    thread.join()

相关文章

男子大学生的無駄日常
关键词：Python,爬虫,requests,BeautifulSoup,opencv,python多线程,正则表...
python爬虫(4)-多线程
环境：python3.6目标：下载整本小说。(使用多线程）
[CP_12] Python多线程爬虫应用实践(社招职位名称获取
目录结构一、多线程爬虫的使用 1. 多线程实现 <关联> [Pt_04] Python进程|多进程|线程|多线程...
Python爬虫基础教程（三）
九、多线程爬虫 9.1利用多线程爬虫爬取糗事百科的资源：十、爬虫代码总结：要实现一个完整的爬虫，无外乎4...
Python爬虫技巧-西瓜视频MP4地址获取并下载
参考文章: Python爬虫进阶---西瓜视频地址获取Python爬虫技巧-西瓜视频MP4地址获取【源码】爬虫--...
四. 开发网络爬虫的语言
常用语言有Python、Java、PHP、Node.JS、C++、Go等。 Python：爬虫框架非常丰富，多线程...
基于asyncio与aiohttp实现异步爬虫
之前爬虫一直用的python2.7，不用第三方框架的话只能用多线程来提升爬虫效率。自从听说python3.5原生自...
多线程爬虫
多线程爬虫 Queue（队列对象） Queue是python中的标准库，可以直接import Queue引用; 队...
18年学习技术列表
后端语言 java 继续夯实基础，注重于多线程，函数式编程，并发集合相关类。 Python scrapy爬虫框架...
Python 爬虫多线程
1、并发-----------------------------------------------------...

网友评论

本文标题：python爬虫(4)-多线程

本文链接：https://www.haomeiwen.com/subject/etkjbxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|python爬虫(4)-多线程|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！