美文网首页
cookie*web beacon*session在网络爬虫中的

cookie*web beacon*session在网络爬虫中的

作者: 幼姿沫 | 来源:发表于2021-04-02 16:17 被阅读0次

web beacon和cookie的区别和定义

网络臭虫(Web bug)也称为网络信标(Web beacon),是一个放置在网页或电子邮件上的文件对象,用于监测用户的行为。

它不像Cookie那样可以被浏览器用户接受或拒绝,网络臭虫只以图形交换格式(GIF)或其他文件对象的形式出现。

它通常只能被检测,如果用户查看网页的源版本会发现一个从不同的Web服务器而不是从网页的其他部分负载的标签。

虽然互联网隐私倡导者反对使用网络臭虫,但是他们大部分承认网络臭虫有积极用途,例如跟踪侵犯版权的网站。 根据Richard M.Smith,网络臭虫(Web bug)可以收集以下资料:

获取网络臭虫的计算机的IP地址

网络臭虫所在网页的网址

网络臭虫图象的网址

网络臭虫被访问的时间

获取网络臭虫图象的浏览器的类型

一个提前设定的cookie值

网络臭虫(Web bug)经常被垃圾邮件发送者用来验证电子邮件地址。当收件人打开一封有网络臭虫的电子邮件时,返回给发件人的信息就会显示邮件已被打开,这样就可以确认电子邮件地址是有效的。

Beacon API

编辑

信标API(Beacon API)是一种较新的Web技术,它不需要使用不可见图像或类似手段就能达到相同的目的。截至2017年4月,它还是一个万维网联盟的候选建议。其旨在使Web开发人员能在用户离开页面时将信息(如分析或诊断数据)发回Web服务器,以跟踪用户的活动。使用Web信标API能够不干扰或影响网站导航的完成此种跟踪,并且对最终用户不可见。信标API已于2014年被相继引入到Mozilla FirefoxGoogle Chrome网页浏览器。

Cookie

编辑

Cookie(复数形态Cookies),中文名称为“小型文本文件”或“小甜饼”,指某些网站为了辨别用户身份而储存在用户本地终端(Client Side)上的数据(通常经过加密)。由网景公司的前雇员卢·蒙特利在1993年3月发明。最初定义于RFC 2109。使用最广泛的 Cookie标准却不是RFC中定义的任何一个,而是在网景公司制定的标准上进行扩展后的产物。

Cookie总是保存在客户端中,按在客户端中的存储位置,可分为内存Cookie和硬盘Cookie。

内存Cookie由浏览器维护,保存在内存中,浏览器关闭后就消失了,其存在时间是短暂的。硬盘Cookie保存在硬盘里,有一个过期时间,除非用户手工清理或到了过期时间,硬盘Cookie不会被删除,其存在时间是长期的。所以,按存在时间,可分为非持久Cookie和持久Cookie。

相关文章

网友评论

      本文标题:cookie*web beacon*session在网络爬虫中的

      本文链接:https://www.haomeiwen.com/subject/vcgjhltx.html