利用Requests和Beautifulsoup爬取上海市高级人

利用Requests和Beautifulsoup爬取上海市高级人

作者: 平凡的浩仔 | 来源:发表于2018-12-03 16:49 被阅读0次

爬妹子图
利用Requests和Beautifulsoup爬取上海市高级人
爬取猫途鹰
python爬取妹子图全部图片
Python爬取链家网上海市租房信息
爬煎蛋网妹子图
利用python爬取城市公交站点
简单静态网站的爬取
Python爬取豆瓣读书
爬取京东商品信息

刚开始学习爬虫，尝试着使用Requests和Beautifulsoup对上海市高级人民法院开通公告信息(http://www.hshfy.sh.cn/shfy/gweb2017/ktgg_search.jsp?zd=splc)进行抓取。

一、导入所需库

二、编写相关函数

1、获取网页

函数get_html(url,data)有两个参数，url表示需要获取的目标url；data参数表示携带在url后的数据（这里有最早开庭时间‘pktrqks’、最晚开庭时间‘ktrqjs’和页数‘page_num’），使用携带的参数可以实现翻页功能，对每一页进行数据抓取。

response.encoding="gbk"将网页的编码设置为“gbk”，不然抓取出的html会乱码。

2、解析传入的网页，抽取出网页中的字段内容

这里yield关键字的作用是将每行的关键字内容形成一个 generator，可以迭代，优点是这种方式在数据量较大时比存成列表然后再返回占用的内存会少很多。

3、将爬取的数据写入文件中

4、获取一共需要爬取的页数

由于原网页是翻页的，我们所需要的信息分布在多个页上，首先获取总共需要爬取的页数，然后再进行信息爬取。

这里做了异常处理，当爬虫遇到网站反爬虫时，程序捕获异常并休眠设定的时间ERROR_SLEEP_TIME，继续运行程序抽取到<strong></strong>标签中的内容，该标签中的内容是所有符合筛选条件的记录数，计算得出总共的页数。

三、主函数

四、爬取结果

相关文章

爬妹子图
利用 BeautifulSoup + Requests 爬取妹子图
利用Requests和Beautifulsoup爬取上海市高级人
刚开始学习爬虫，尝试着使用Requests和Beautifulsoup对上海市高级人民法院开通公告信息(http:...
爬取猫途鹰
利用 BeautifulSoup + Requests 爬取猫途鹰一、用 BeautifulSoup 的 fi...
python爬取妹子图全部图片
摘要: 利用python, requests, BeautifulSoup爬取妹子图所有图片
Python爬取链家网上海市租房信息
使用Python进行上海市租房信息爬取，通过requests + Beautifulsoup对网页内容进行抓取和数...
爬煎蛋网妹子图
利用 BeautifulSoup + Requests 爬取煎蛋网妹子图一、爬煎蛋网一页图片此爬虫只能爬取...
利用python爬取城市公交站点
利用python爬取城市公交站点页面分析爬虫我们利用requests请求，利用BeautifulSoup来解...
简单静态网站的爬取
利用BeautifulSoup以及requests爬取静态网站http://seputu.com/的标题、章节、章...
Python爬取豆瓣读书
主要思路利用Python的requests模块和beautifulsoup模块来爬取豆瓣读书的数据，并对这些数据...
爬取京东商品信息
利用 BeautifulSoup + Requests 爬取京东商品信息并保存在Excel中一、查看网页信息打...

网友评论

爬虫

本文标题：利用Requests和Beautifulsoup爬取上海市高级人

本文链接：https://www.haomeiwen.com/subject/swmycqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

爬虫

关于我们|服务条款|联系我们|利用Requests和Beautifulsoup爬取上海市高级人|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！