美文网首页
糗事百科爬虫

糗事百科爬虫

作者: 年画儿 | 来源:发表于2019-08-03 12:16 被阅读0次
#encoding: utf-8

import re
import requests

def parse_page(url):
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/62.0.3202.94 Safari/537.36'
    }
    response = requests.get(url,headers)
    text = response.text
    # re.S = re.DOTALL
    contents = re.findall(r'<div\sclass="content">.*?<span>(.*?)</span>',text,re.DOTALL)
    duanzi = []
    for content in contents:
#        x = content
        x = re.sub(r'<.*?>','',content)
        duanzi.append(x.strip())
        print(x.strip())
        print('='*50)


def main():
    url = 'https://www.qiushibaike.com/text/page/1/'
    for x in range(1,10):
        url = 'https://www.qiushibaike.com/text/page/%s/' % x
        parse_page(url)

if __name__ == '__main__':
    main()

相关文章

  • python 3  爬糗事百科

    python 3 爬糗事百科(来源Python爬虫学习,实战一糗事百科(2017/7/21更新)) 关于head...

  • 使用Beautifulsoup和re爬取糗事百科笑话

    最近在学习爬虫,拿糗事百科练手。高手勿喷!

  • 糗事百科爬虫源码

    /*使用javascript编写的爬虫源码,用于爬取糗事百科上的信息。 代码粘贴到神箭手云爬虫平台(http://...

  • Python爬虫基础教程(三)

    九、多线程爬虫 9.1利用多线程爬虫爬取糗事百科的资源: 十、爬虫代码总结: 要实现一个完整的爬虫,无外乎4...

  • Python爬虫小实例

    爬虫糗事百科第一页的段子 import requests import re def comenzar(): ...

  • 爬虫学习之糗事百科

    ''' ''' 糗事百科爬虫 1.抓取糗事百科段子 2.过滤带有图片的段子 3.实现每按一次回车键显示一个段子的发...

  • Scrapy爬虫项目

    爬取糗事百科笑话https://www.qiushibaike.com/text/ 创建项目 创建爬虫主程序 确定...

  • 糗事百科爬虫

    糗事百科爬虫-爬取段子 【参考资料】 博主 http://cuiqingcai.com/1052.html

  • Python爬虫实战

    注:采转归档,自己学习查询使用 Python爬虫实战(1):爬取糗事百科段子Python爬虫实战(2):百度贴吧帖...

  • 糗事百科爬虫

网友评论

      本文标题:糗事百科爬虫

      本文链接:https://www.haomeiwen.com/subject/xwkjdctx.html