Python爬虫笔记（2）：利用requests库和Beauti

Python爬虫笔记（2）：利用requests库和Beauti

作者: 坐下等雨 | 来源:发表于2018-10-28 23:19 被阅读0次

Python爬虫笔记（2）：利用requests库和Beauti
好用的python库目录
[Python]从Web解析到网络空间（一些第三方库的简要介绍）
2019-01-01
tenliu的爬虫-抓包分析
tenliu的爬虫-python的urllib库
tenliu的爬虫-python库urllib、urllib2、
tenliu的爬虫-urllib2学习
tenliu的爬虫-requests学习
Node.js 笔记四：简单爬虫

对于刚刚上路的新手，那就写一个简单点的爬虫练练手，提升一下信心吧。

生活总会无聊，不如看点段子开心一下吧。所以今天我写的第一个爬虫笔记——爬取煎蛋网段子（段子 - 轻松一刻 - 无节操，冷笑话，内涵段子）并保存成txt文件供自己阅读

一、本次爬虫涉及到的知识点

1. 利用requests库的get()方法获取煎蛋网的html。

2. 利用BeautifulSoup库的Select()方法解析并获取作者和段子。

3. zip()函数：用于将可迭代的对象作为参数，将对象中对应的元素打包成一个个元组，然后返回由这些元组组成的列表。

4. 对字符串的操作：strip()函数，将字符串两端的空格去掉

4. 用open()函数将结果写入到txt文档中。

具体代码如下:

二、运行结果

一共爬取四千多条段子

生成为txt文件

相关文章

Python爬虫笔记（2）：利用requests库和Beauti
对于刚刚上路的新手，那就写一个简单点的爬虫练练手，提升一下信心吧。生活总会无聊，不如看点段子开心一下吧。所以今天...
好用的python库目录
爬虫 requests：网页抓取，可替代官方库urllib lxml：正则表达式库，可替代官方库re beauti...
[Python]从Web解析到网络空间（一些第三方库的简要介绍）
Python库之网络爬虫 http://www.python-requests.org/Requests:最友好的...
2019-01-01
python爬虫---requests库的用法 requests是python实现的简单易用的HTTP库，使用起来...
tenliu的爬虫-抓包分析
基本爬虫知识python库urllib、urllib2、requests urllib、urllib2、reque...
tenliu的爬虫-python的urllib库
基本爬虫知识python库urllib、urllib2、requests urllib、urllib2、reque...
tenliu的爬虫-python库urllib、urllib2、
基本爬虫知识python库urllib、urllib2、requests urllib、urllib2、reque...
tenliu的爬虫-urllib2学习
基本爬虫知识python库urllib、urllib2、requests urllib、urllib2、reque...
tenliu的爬虫-requests学习
基本爬虫知识python库urllib、urllib2、requests urllib、urllib2、reque...
Node.js 笔记四：简单爬虫
Node.js 笔记四：爬虫 Python 笔记七：Requests爬虫技巧讲解了一些requests的技巧。同...

网友评论

本文标题：Python爬虫笔记（2）：利用requests库和Beauti

本文链接：https://www.haomeiwen.com/subject/ezndtqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|Python爬虫笔记（2）：利用requests库和Beauti|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！