Day3-用request爬百度贴吧图片

Day3-用request爬百度贴吧图片

作者: 小红鱼 | 来源:发表于2017-03-06 12:47 被阅读58次

Day3-用request爬百度贴吧图片
python爬取百度贴吧
python爬取百度贴吧
爬取百度贴吧图片
爬取百度贴吧图片
爬虫第二弹代码操作
python爬虫之百度贴吧
使用Selenium模拟浏览器行为！室友原来天天都在浏览这些网站
使用Selenium模拟浏览器行为！室友原来天天都在浏览这些网站
python爬虫-抓取百度贴吧帖子图片

最近姐姐我也掉《三生三世十里桃花》的坑里了，所以今天来爬点美图，这次用requests。

1.目标网站

分析目标网站https://tieba.baidu.com/p/5008608157，发现这个帖子一共有5页，可以以url?pn=x访问。

代码如下，其中spider是我们要写的爬虫函数：

2.写爬虫

我们写爬虫的时候，要从爬下来的源代码提取需要的信息，可以用re正则表达式。但是正则表达式使用起来不那么方便，容易写错，我们试一下更强大更简单的XPATH。XPATH是一种语言，用来在XML文档中查找信息，支持HTML。具体的写法参考XPATH的语法http://www.w3school.com.cn/xpath/xpath_syntax.asp

在python里使用XPATH，需要安装lxml库。lxml是Python语言中处理XML和HTML功能最丰富，最易于使用的库。

>pip install lxml

运行脚本：

我需要的图片已经被爬下来啦：

欣赏一下姑姑的美照：

相关文章

Day3-用request爬百度贴吧图片
最近姐姐我也掉《三生三世十里桃花》的坑里了，所以今天来爬点美图，这次用requests。 1.目标网站分析目标网...
python爬取百度贴吧
爬取百度贴吧python文件源代码如下（欢迎点赞哦） import urllib.request import u...
python爬取百度贴吧
爬取百度贴吧python文件源代码如下（欢迎点赞哦） import urllib.request import u...
爬取百度贴吧图片
依然是参考崔庆才写的关于Python爬虫的文章，大家有兴趣的话可以去他的个人博客静觅学习。源代码还是在我的Git...
爬取百度贴吧图片
爬虫第二弹代码操作
代码操作一爬取贴吧战狼2 网页信息运行结果：代码操作二百度图片爬取美女图网页结果展示代...
python爬虫之百度贴吧
最近又尝试着爬取了百度贴吧，发现新增的几个反爬点，故来做下记录。爬取百度贴吧大致流程为： 1 - 构造url，h...
使用Selenium模拟浏览器行为！室友原来天天都在浏览这些网站
前几天有位读者问我一个爬虫的问题，就是在爬去百度贴吧首页的热门动态下面的图片的时候，爬取的图片总是爬去不完整，比首...
使用Selenium模拟浏览器行为！室友原来天天都在浏览这些网站
前几天有位读者问我一个爬虫的问题，就是在爬去百度贴吧首页的热门动态下面的图片的时候，爬取的图片总是爬去不完整，比首...
python爬虫-抓取百度贴吧帖子图片
本爬虫可以爬取百度贴吧帖子中的图片，代码有待完善，欢迎大家指教！出处：https://github.com/jin...

网友评论

本文标题：Day3-用request爬百度贴吧图片

本文链接：https://www.haomeiwen.com/subject/eygygttx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

与Linda一起100天写作

热点阅读

与Linda一起100天写作

爬虫Scrapy

关于我们|服务条款|联系我们|Day3-用request爬百度贴吧图片|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！