Python opener 中的 Cookie 的使用

Python opener 中的 Cookie 的使用

作者: 我爱学python | 来源:发表于2019-08-01 15:41 被阅读14次

Python opener 中的 Cookie 的使用
requests,cookie,代理,证书忽略
python爬虫--day02
handler、opener、request
Python爬虫入门-Cookie的使用
Python爬虫中Cookie的使用
Python opener 应用中的 ProxyHandler
爬虫学习笔记-cookies
urllib2自定义opener
python爬虫(六)_urllib2：handle处理器和自定

Cookie 是指某些网站服务器为了辨别用户身份和进行Session跟踪，而储存在用户浏览器上的文本文件，Cookie可以保持登录信息到用户下次与服务器的会话。

HTTP是无状态的面向连接的协议, 为了保持连接状态, 引入了Cookie机制 Cookie是http消息头中的一种属性，包括：

Cookie名字（Name）Cookie的值（Value）Cookie的过期时间（Expires/Max-Age）Cookie作用路径（Path）Cookie所在域名（Domain），使用Cookie进行安全连接（Secure）。前两个参数是Cookie应用的必要条件，另外，还包括Cookie大小（Size，不同浏览器对Cookie个数及大小限制是有差异的）。

Cookie由变量名和值组成，根据 Netscape公司的规定，Cookie格式如下：

Set－Cookie: NAME=VALUE；Expires=DATE；Path=PATH；Domain=DOMAIN_NAME；SECURE

Cookie应用

Cookies在爬虫方面最典型的应用是判定注册用户是否已经登录网站，用户可能会得到提示，是否在下一次进入此网站时保留用户信息以便简化登录手续。

但是这样做太过复杂，我们先需要在浏览器登录账户，并且设置保存密码，并且通过抓包才能获取这个Cookie，那有么有更简单方便的方法呢？

cookielib库和 HTTPCookieProcessor处理器

在Python处理Cookie，一般是通过 http 模块的 cookiejar 模块和 urllib 模块的HTTPCookieProcessor 处理器类一起使用。

cookiejar模块：主要作用是提供用于存储cookie的对象

HTTPCookieProcessor处理器：主要作用是处理这些cookie对象，并构建handler对象。

模拟登录要注意几点：

登录一般都会先有一个HTTP GET，用于拉取一些信息及获得Cookie，然后再HTTP POST登录。

HTTP POST登录的链接有可能是动态的，从GET返回的信息中获取。

password 有些是明文发送，有些是加密后发送。有些网站甚至采用动态加密的，同时包括了很多其他数据的加密信息，只能通过查看JS源码获得加密算法，再去破解加密，非常困难。

大多数网站的登录整体流程是类似的，可能有些细节不一样，所以不能保证其他网站登录成功。

相关文章

Python opener 中的 Cookie 的使用
Cookie 是指某些网站服务器为了辨别用户身份和进行Session跟踪，而储存在用户浏览器上的文本文件，Cook...
requests,cookie,代理,证书忽略
handler和opener.py cookie.py 下载cookie.py 重复使用cookie.py 代理I...
python爬虫--day02
Handler处理器和自定义Opener 简单的自定义opener() Cookie Cookie应用 Coo...
handler、opener、request
handler、opener、request handler、opener Cookie 本身就是文件 Cooki...
Python爬虫入门-Cookie的使用
Python爬虫入门（6）：Cookie的使用
Python爬虫中Cookie的使用
opener 平时获取一个URL都使用的urlopen，可以将urlopen视为一个opener的一个实例，因为它...
Python opener 应用中的 ProxyHandler
使用代理IP，这是爬虫/反爬虫的第二大招，通常也是最好用的。很多网站会检测某一段时间某个IP的访问次数(通过流量...
爬虫学习笔记-cookies
Handler和Opener类1.cookies处理 cookies处理套路：定义对象cookie封装进Handl...
urllib2自定义opener
1.build_opener()urllib2.urlopen()函数不支持验证、cookie或者其它HTTP高级...
python爬虫(六)_urllib2：handle处理器和自定
本文将介绍handler处理器和自定义opener，更多内容请参考:python学习指南 opener和handl...

网友评论

Python基础系列

本文标题：Python opener 中的 Cookie 的使用

本文链接：https://www.haomeiwen.com/subject/idxcdctx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

Python基础系列

热点阅读

Python基础系列

关于我们|服务条款|联系我们|Python opener 中的 Cookie 的使用|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！