Scrapy爬虫——session与cookie详解

Scrapy爬虫——session与cookie详解

作者: youyuge | 来源:发表于2017-09-22 17:21 被阅读0次

Scrapy爬虫——session与cookie详解
Session
《python分布式爬虫打造搜索引擎》（下）----学习笔记
Cookie
第五章知乎问题爬取
去哪儿网图片爬虫及Scrapy使用详解
前端开发
cookie,session,localstorage,sess
PHP学习-POST、Cookie、Session
禁用COOKIE后SEESION；多台web服务器如何共享SES

有条件的请支持慕课实战正版课程，本blog仅仅是归纳总结，自用。

An HTTP cookie (also called web cookie, Internet cookie, browser cookie, or simply cookie) is a small piece of data sent from a website and stored on the user's computer by the user's web browser while the user is browsing.

一、cookie请求

应用层的http协议是无状态请求，为了方便服务器识别用户，使用cookie机制保存必要的用户信息：

带cookie的有状态请求

我们打开chrome的开发者工具，查看百度网页的cookies，注意这个cookies其实是存储在本地的，可以删除，数据结构类似字典dict

百度首页的cookie
利用cookie，我们可以把网站的用户名和密码存储起来，然后服务器收到后，提取数据，实现自动登录。但是存在安全隐患，因为把用户名和密码存储在本地，容易被窃取。于是有了session技术。

二、session

session机制还是利用的是cookie，但是避免了用户名和密码的本地存储与网络传输。
这里下面的id就是指session_id,而每个web后台生成session_id的方式不同。

带cookie的有状态请求

2.1 session的生成过程

django下session_id的生成过程：
当用户第一次登录之后，django根据用户名和密码，在数据库表中加密生成对应的session_key（就是session_id)和session_data，还有expired_date（过期时间）。
当我们登录网址一次后，查看下django后台的表：

django_session数据库表

回到浏览器，查看网页的cookie，发现已经拿到了服务器回传来的session_id：

网页cookie

至此，session生成结束。

2.2 利用session登陆流程

第二次请求时，带着session_id的cookie一起请求。
服务器收到session_id，进入数据库中查询，取出对应的session_data，若没过期，则解密，获得用户名，密码，其他信息后登陆。

2.3 django后台解析session机制

利用sessions这个模块，每次拦截request和response，做session生成与解密工作：

sessions模块

若注释掉它后，则无法自动登录

三、总结

cookie是浏览器本地的一种存储行为，存储键值对。分域名存储，不同域名的cookie不能互相访问。
cookie存在安全隐患，我们使用session机制。session是服务器端生成，发给用户，只有服务器端知道session对应的用户信息，存在过期时间。

相关文章

Scrapy爬虫——session与cookie详解
有条件的请支持慕课实战正版课程，本blog仅仅是归纳总结，自用。 An HTTP cookie (also cal...
Session
Session Cookie/Session机制详解
《python分布式爬虫打造搜索引擎》（下）----学习笔记
第八章 scrapy知乎问答网站爬取 8.1 session与cookie 首先要理解session和cookie...
Cookie
参考链接：HTTP cookies 详解cookie/session 的机制与安全nodejs 操作 cookie...
第五章知乎问题爬取
爬取知乎问答标签（空格分隔）： python scrapy session cookie session和coo...
去哪儿网图片爬虫及Scrapy使用详解
本文分为两部分，去哪儿网图片爬虫和Scrapy使用详解。Scrapy使用详解基于去哪儿网图片爬虫进行解析说明。去...
前端开发
@1:session+cookie 和 token有什么区别？ cookie与session的区别： Cookie...
cookie,session,localstorage,sess
Session 与 Cookie 的关系:一般来说，Session 基于 Cookie 来实现。 Cookie 服...
PHP学习-POST、Cookie、Session
POST、Cookie、Session详解菜鸟教程：1、http://www.runoob.com/php/ph...
禁用COOKIE后SEESION；多台web服务器如何共享SES
Session与cookie功能效果相同。Session与Cookie的区别在于Session是记录在服务端的，而...

网友评论

本文标题：Scrapy爬虫——session与cookie详解

本文链接：https://www.haomeiwen.com/subject/diyfextx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

WEB前端程序开发

热点阅读

让前端飞

WEB前端程序开发

关于我们|服务条款|联系我们|Scrapy爬虫——session与cookie详解|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！