python写爬虫为何都说简单？我能一文让你学会自己写爬虫！

python写爬虫为何都说简单？我能一文让你学会自己写爬虫！

作者: 48e0a32026ae | 来源:发表于2018-10-19 16:24 被阅读4次

python写爬虫为何都说简单？我能一文让你学会自己写爬虫！
python爬虫——scrapy框架总结
Python网络爬虫一
各语言简单爬虫
Python 爬虫：把廖雪峰教程转换成 PDF 电子书
给大家分享一篇爬虫：把廖雪峰的教程转换成 PDF 电子书
iOS程序员如何使用python写网路爬虫（一点更新）
python爬虫零基础入门——反爬的简单说明
爬虫入门-使用python写简单爬虫
我用Python爬了北京的房租和工资数据，北京的房租到底有多高？

爬虫，Web Spider，其实就像个在蜘蛛网上爬来爬去的蜘蛛。

这只蜘蛛无比聪明，所到之处的方位气味都被印在了它的脑中。

有一天我向这只在互联网上努力爬着的小蜘蛛提了个需求：

去巨潮网上，把工商银行这只股票最近一个月的公告信息发给我，并在我的本地电脑上存储最新的一份公告。

于是，这只蜘蛛就去做了这样几件事情：

1.找到巨潮网上工行这只上市公司的公告存储地址；

2.将我的筛选条件——上市公代码、页码、时间区间等输入输入输入，然后向网络发送请求；

3.将第一份公告复制粘贴到我本地电脑的特定路径中。

这只智能蜘蛛的逻辑和人类简直一模一样。

利用网红编程语言Python实现上述流程（爬虫），逻辑也如此简单清晰。

Step1：找地址

如果客官们认为这里的地址就单纯指网页最顶端的那个一般以www.开头的地址，就图样图森破了。

因为这个网址实际上包含了很多东西，比如页面角落的某个logo，甚至页面并没有展示出来的一些底层数据信息，而我们则需要屏蔽这些无用信息，稳准狠的找到我们要的那个。

●●●

在你需要爬取的页面右键选择“检查”（或“审查元素”）

选择“NetWork”

刷新页面

点击“XHR”

点击query（增加“时间不限”这一筛选条件，否则只展示最近一年的公告链接）

点击Headers，地址就在眼前了。

（PS：此步骤中的点击“XHR”、“query”仅适用于爬取公告）

以下是详细无比的图解

不过，此时你还需要注意请求方式。请求方式分为get和post两种，而用Python发送请求时，这点需要注明。

Step2：将筛选条件输入输入输入

筛选条件一般很简单，包括股票代码、页面等等。而用Python写入的语法，也简单粗暴：

Data={key1: value1, key2: value2}

综合Step1、Step2，我们汇总出三行代码，这只“蜘蛛”就完成了上述发送指令操作。

Step3：下载+存储

下载公告的姿势很简单，直接result即可。由于这个公告（result）是json格式，聪明的Python直接用.json()就可成功解析。

千言万语汇成Python一句话：

而下载公告前，我们需要指定公告下载后存储在电脑上的位置。

此处，将公告存在桌面上的“zaijiuye（再就业）”文件夹中，公告命名格式为“公司代码_公告名称_公告在巨潮中ID”。

两行代码就能搞定。

上述代码的具体结果就是：

最后一步，就是存储啦。我们先回忆一下手动从网上copy文件的步骤：

打开存储路径下提前建好的空白文件，将网上复制的文件粘贴进去，Over。

同样对于Python来说，也就是这个思路：

很成功的，我们最后得到了它：

●●●

以上，就是用Python爬取巨潮网上某股票公告信息的全部内容，对此客官们还需要了解：

1.此代码在巨潮网上爬取信息具有可操作性、可复制性；

2.代码虽只有聊聊几行，但背后隐藏了对网页信息的深入了解、对Python语言的熟练运用；

3.所有网站皆可爬，框架如上，但具体实践有差别。

相关文章

python写爬虫为何都说简单？我能一文让你学会自己写爬虫！
爬虫，Web Spider，其实就像个在蜘蛛网上爬来爬去的蜘蛛。这只蜘蛛无比聪明，所到之处的方位气味都被印在了它...
python爬虫——scrapy框架总结
Scrapy是用python写的一个爬虫框架，当然如果只是写一些简单爬虫，python自己就有做爬虫的库，scra...
Python网络爬虫一
前言很多人学习Python就是为了写爬虫的，给大家的印象就是Python=爬虫，既然如此，那我们也从最简单的爬虫...
各语言简单爬虫
各语言简单爬虫 Python 简单爬虫 golang简单爬虫
Python 爬虫：把廖雪峰教程转换成 PDF 电子书
写爬虫似乎没有比用 Python 更合适了，Python 社区提供的爬虫工具多得让你眼花缭乱，各种拿来就可以直接用...
给大家分享一篇爬虫：把廖雪峰的教程转换成 PDF 电子书
写爬虫似乎没有比用 Python 更合适了，Python 社区提供的爬虫工具多得让你眼花缭乱，各种拿来就可以直接用...
iOS程序员如何使用python写网路爬虫（一点更新）
原文链接： iOS程序员如何使用python写网路爬虫以前看到叶孤城写的iOS程序员如何使用python写网路爬虫...
python爬虫零基础入门——反爬的简单说明
之前在《如何开始写你的第一个python脚本——简单爬虫入门！》中给大家分享了一下写一个爬虫脚本的基本步骤，今天继...
爬虫入门-使用python写简单爬虫
从第一章到上一章为止，基本把python所有的基础点都已经包括了，我们有控制逻辑的关键字，有内置数据结构，有用于工...
我用Python爬了北京的房租和工资数据，北京的房租到底有多高？
此前已经很久没有写Python爬虫和分析的文章了，我觉得很惭愧。一直都说自己很忙，确实很忙。不过最近周末算是能空下...

网友评论

本文标题：python写爬虫为何都说简单？我能一文让你学会自己写爬虫！

本文链接：https://www.haomeiwen.com/subject/bofuzftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

Python新世界

python热爱者

热点阅读

Python新世界

python热爱者

关于我们|服务条款|联系我们|python写爬虫为何都说简单？我能一文让你学会自己写爬虫！|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！