re_糗事百科demo

作者: 蜗牛不牛不知道 | 来源:发表于2020-04-18 16:54 被阅读0次

re_糗事百科demo
每天一个小Demo-Python爬虫糗事百科的抓取
爬取糗百12-02
python 3 爬糗事百科
爬取糗事百科
Python爬虫(十七)_糗事百科案例
re_古诗文demo
糗事百科还是那个糗事百科吗？（v57）
Python爬虫(十八)_多线程糗事百科案例
爬虫系列（十五）：多线程爬虫

encoding: utf-8

import re
import requests

def parse_page(url):
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/62.0.3202.94 Safari/537.36'
    }
    response = requests.get(url,headers)
    text = response.text
    # re.S = re.DOTALL
    contents = re.findall(r'<div\sclass="content">.*?<span>(.*?)</span>',text,re.DOTALL)
    duanzi = []
    for content in contents:
        x = re.sub(r'<.*?>','',content)
        duanzi.append(x.strip())
        print(x.strip())
        print('='*50)


def main():
    url = 'https://www.qiushibaike.com/text/page/1/'
    for x in range(1,5):
        url = 'https://www.qiushibaike.com/text/page/%s/' % x
        parse_page(url)

if __name__ == '__main__':
    main()

网友评论

本文标题：re_糗事百科demo

本文链接：https://www.haomeiwen.com/subject/qqjivhtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

re_糗事百科demo

encoding: utf-8

相关文章

re_糗事百科demo

每天一个小Demo-Python爬虫糗事百科的抓取

爬取糗百12-02

python 3 爬糗事百科

爬取糗事百科

Python爬虫(十七)_糗事百科案例

re_古诗文demo

糗事百科还是那个糗事百科吗？（v57）

Python爬虫(十八)_多线程糗事百科案例

爬虫系列（十五）：多线程爬虫

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读