2019-10-09 笑话网爬虫（练习requests）

2019-10-09 笑话网爬虫（练习requests）

作者: 小楼主 | 来源:发表于2019-10-09 23:21 被阅读0次

2019-10-09 笑话网爬虫（练习requests）
2020-02-01 python 爬虫小练习-下载“百度”图片
Python常用第三方库总结
Node.js 笔记四：简单爬虫
【Python爬虫】requests模块练习
【零基础学爬虫】爬虫库
【Python爬虫】15行代码教你爬B站视频弹幕，词云图展示数据
Python 爬虫实战（二）：使用 requests-html
Python程序设计思维练习---股票数据定向爬虫
十行代码体验爬虫的尖锐之处

import requests
import re
def get_one_page(url):
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.100 Safari/537.36'}
    res = requests.get(url, headers=headers)
    return res.text

def parse_one_page(html):
    pattern=re.compile('<div class="one-cont".*?<i>(.*?)</i>.*?<a href=.*?>(.*?)</a>.*?</div>',re.S)
    items=re.findall(pattern,html)
    for item in items:
        yield {
            'author':item[0],
            'content':item[1]
        }

def main():
    url = 'https://www.xiaohua.com/duanzi?page=1'
    html=get_one_page(url)
    for item in parse_one_page(html):
        print(item)


if __name__=='__main__':
    main()

相关文章

2019-10-09 笑话网爬虫（练习requests）
2020-02-01 python 爬虫小练习-下载“百度”图片
1.python 爬虫小练习 #爬虫import requests#第三方库url="http://www.bai...
Python常用第三方库总结
网络爬虫网络请求 requests: Requests allows you to send HTTP/1.1 ...
Node.js 笔记四：简单爬虫
Node.js 笔记四：爬虫 Python 笔记七：Requests爬虫技巧讲解了一些requests的技巧。同...
【Python爬虫】requests模块练习
一、构造一个访问阳光电影网的请求(url,headers)二、输出请求的状态码三、输出请求的网页源码四、将源码保存...
【零基础学爬虫】爬虫库
爬虫库 urllib re requests ：pip install requests selenium:自动化...
【Python爬虫】15行代码教你爬B站视频弹幕，词云图展示数据
知识点爬虫基本流程正则 requests >>> pip install requests jieba >>>...
Python 爬虫实战（二）：使用 requests-html
Python 爬虫实战（一）：使用 requests 和 BeautifulSoup，我们使用了 requests...
Python程序设计思维练习---股票数据定向爬虫
本次练习是一个定向爬虫，爬取股票的相关数据，用到beautifulsoup,re,requests等库。爬前分析：...
十行代码体验爬虫的尖锐之处
爬虫入门模块: requests库 > 众所周知，学好requests库模块，就能解决爬虫一半的问题,下面让我们一...

网友评论

本文标题：2019-10-09 笑话网爬虫（练习requests）

本文链接：https://www.haomeiwen.com/subject/exbnpctx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|2019-10-09 笑话网爬虫（练习requests）|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！