糗事百科爬虫

作者: 薛落花随泪绽放 | 来源:发表于2017-10-29 19:30 被阅读4次
#糗事百科段子爬虫
import urllib.request
import re
headers=("User-Agent","Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/61.0.3163.100 Safari/537.36")
opener=urllib.request.build_opener()
opener.addheaders=[headers]
# 安装为全局
urllib.request.install_opener(opener)
'''
url="https://www.qiushibaike.com/8hr/page/10/"
urllib.request.urlopen(url)
'''
for i in range(0,35):
    thisurl="https://www.qiushibaike.com/8hr/page/"+str(i+1)+"/"
    data=urllib.request.urlopen(thisurl).read().decode("utf-8","ignore")
    pat='<div class="content">.*?<span>(.*?)</span>.*?</div>'
    rst=re.compile(pat,re.S).findall(data)
    print(rst)
    for j in range(0,len(rst)):
        print(rst[j])
        print("-------")

相关文章

  • python 3  爬糗事百科

    python 3 爬糗事百科(来源Python爬虫学习,实战一糗事百科(2017/7/21更新)) 关于head...

  • 使用Beautifulsoup和re爬取糗事百科笑话

    最近在学习爬虫,拿糗事百科练手。高手勿喷!

  • 糗事百科爬虫源码

    /*使用javascript编写的爬虫源码,用于爬取糗事百科上的信息。 代码粘贴到神箭手云爬虫平台(http://...

  • Python爬虫基础教程(三)

    九、多线程爬虫 9.1利用多线程爬虫爬取糗事百科的资源: 十、爬虫代码总结: 要实现一个完整的爬虫,无外乎4...

  • Python爬虫小实例

    爬虫糗事百科第一页的段子 import requests import re def comenzar(): ...

  • 爬虫学习之糗事百科

    ''' ''' 糗事百科爬虫 1.抓取糗事百科段子 2.过滤带有图片的段子 3.实现每按一次回车键显示一个段子的发...

  • Scrapy爬虫项目

    爬取糗事百科笑话https://www.qiushibaike.com/text/ 创建项目 创建爬虫主程序 确定...

  • 糗事百科爬虫

    糗事百科爬虫-爬取段子 【参考资料】 博主 http://cuiqingcai.com/1052.html

  • Python爬虫实战

    注:采转归档,自己学习查询使用 Python爬虫实战(1):爬取糗事百科段子Python爬虫实战(2):百度贴吧帖...

  • 糗事百科爬虫

网友评论

    本文标题:糗事百科爬虫

    本文链接:https://www.haomeiwen.com/subject/gxmypxtx.html