DatistEQ之网页抓包分析

作者: 了无_数据科学 | 来源:发表于2020-09-01 22:30 被阅读0次

网页数据在我们的日常研究过程中,越来越常见。从网页上抓包分析的需求,也日趋普遍。

这不,今天刘就遇到这样的问题,他需要从USGS网站上,抓取每日发布的地震数据。

USGS网站

关于抓包,我们可以使用chrome浏览器进行,详细操作过程,度娘的 谷歌浏览器chrome怎么抓包,写得比较详细。

1、在Chrome浏览器地址栏输入地址:

https://earthquake.usgs.gov/earthquakes/map/?extent=-88.14489,-120.9375&extent=88.14489,509.0625&range=month&magnitude=significant&baseLayer=satellite&settings=true

2、开启开发者工具

开发者工具

3、查看数据通信情况

1)将开发者工具切换至Network页,可查到网页上的数据交换情况;
2)在网页上触发数据交换,点选Radio按钮1 Day,Magnitude 2.5....
3)Network的数据列表中,就呈现当前数据包的情况;

Network页

4、查看数据包的信息

单击2.5_day.geojson,在Headers的页签,可以看到它的访问地址及Request Method等相关信息,这里GET就是指这个地址可以在浏览器地址栏上直接使用的意思。Response页,可以查看到当前数据包的,返回的详细数据。可见,这个地址就是我们想要的。
地址:https://earthquake.usgs.gov/earthquakes/feed/v1.0/summary/2.5_day.geojson

地址信息 返回值信息

5、数据专家中访问

脚本工具栏中,找到“微服务”节点,并创建之,节点编辑器的数据源API文本框中,粘入网页地址,运行节点,即可抓取网页的数据。查看发现,抓取的数据是JSON(JavaScript Object Notation)格式,一种非常用的网页数据交换格式。

微服务

6、JSON数据结构化

JSON数据是一种典型的非结构化数据,不适合数据专家处理,我们可使用解析JSON节点,逐层对JSON数据进行解析,使其转换变二维结构化数据。

JSON数据 数据处理流程 三次解析后数据结果

小结

网页数据抓包分析,通过模拟浏览器的访问网站过程,获取数据。网站的数据交换方式有多种,本文中的遇到GET是最为简单的方式。同时,网页数据访问,通常需要认证信息,是一个比较复杂的过程。本文中,只是一种最简单的数据抓取分析过程。

相关文章

  • DatistEQ之网页抓包分析

    网页数据在我们的日常研究过程中,越来越常见。从网页上抓包分析的需求,也日趋普遍。 这不,今天刘就遇到这样的问题,他...

  • DatistEQ之彪悍的网页截图

    之前的文章中介绍了网页抓包分析,从网页上探查数据包,以便于数据分析与应用。 本文,我给大家介绍一个彪悍的节点,网页...

  • 2018-10-23day07fiddler强化&http协议

    fiddler抓包与http协议 fiddler抓包 pc端web网站抓包 一、网页不安全1.用fiddler抓包...

  • 爬取房天下二手房数据和二手房房价分析及预测

    第一部分 爬虫 数据来源:房天下 网页结构分析 通过抓包分析网页信息,房源信息就是包含在当前HTML文件中。 目标...

  • WebSee,一款优秀的抓包工具

    由于平时需要对一些网页进行抓包分析,用过几款通过代理的方式进行抓包的工具,但是都稍显繁琐,而且在https协议下,...

  • web抓包结果对应python request

    一、抓包内容 通过F12获取web网页中query-queue-rate的内容: 二、分析 该包中包含:Gener...

  • fiddler抓包

    fiddler抓包 一、网页不安全 用fiddler抓包时候,打开百度网页:https://www.baidu.c...

  • 2018-10-23

    fiddler抓包与http协议 一 网页不安全1,用fiddler抓包的时候,打开百度网页百度2.提示:网页不...

  • 拉勾网职位信息爬取

    分析网页 通过浏览器查看网页源代码,未能找到职位信息,因此需要打开F12开发者工具抓包分析职位数据使怎样被加载到网...

  • 2018-10-23Fiddler的使用以及抓包

    pc端web网站抓包 一、网页不安全 1.用fiddler抓包时候,打开百度网页:https://www.baid...

网友评论

    本文标题:DatistEQ之网页抓包分析

    本文链接:https://www.haomeiwen.com/subject/qksbsktx.html