这段时间做个项目,在Web爬虫中频繁的操作 cookie,由于没有系统的学习过前端,一知半解,直到看到一篇经典的博文前端开发中Cookie那些事儿,为方便以后查阅,特此转载!
cookie 操作在前端开发过程中经常遇到,当然如果只是用来存储一些简单用户数据,还是比较简单的,我们要做的可能只是设置 cookie 名,值,过期时间等,读取也只要根据 cookie 的名读取相应的 cookie 值就可以了。在复杂的应用中,光这些肯定就不够了。
cookie 的属性
除了 name(名)和 value(值),cookie 还有以下一些可选属性,用来控制 cookie 的有效期,作用域,安全性等:
expires 属性
指定了 cookie 的生存期,默认情况下 cookie 是暂时存在的,他们存储的值只在浏览器会话期间存在,当用户退出浏览器后这些值也会丢失,如果想让 cookie 存在一段时间,就要为 expires 属性设置为未来的一个用毫秒数表示的过期日期或时间点,expires 默认为设置的 expires 的当前时间。现在已经被 max-age 属性所取代,max-age 用秒来设置 cookie 的生存期。
如果 max-age 属性为正数,则表示该 cookie 会在 max-age 秒之后自动失效。浏览器会将 max-age 为正数的 cookie 持久化,即写到对应的 cookie 文件中。无论客户关闭了浏览器还是电脑,只要还在 max-age 秒之前,登录网站时该 cookie 仍然有效。
如果 max-age 为负数,则表示该 cookie 仅在本浏览器窗口以及本窗口打开的子窗口内有效,关闭窗口后该 cookie 即失效。max-age 为负数的 Cookie,为临时性 cookie,不会被持久化,不会被写到 cookie 文件中。cookie 信息保存在浏览器内存中,因此关闭浏览器该 cookie 就消失了。cookie 默认的 max-age 值为 - 1。
如果 max-age 为 0,则表示删除该 cookie。cookie 机制没有提供删除 cookie 的方法,因此通过设置该 cookie 即时失效实现删除 cookie 的效果。失效的 Cookie 会被浏览器从 cookie 文件或者内存中删除。
如果不设置 expires 或者 max-age 这个 cookie 默认是 Session 的,也就是关闭浏览器该 cookie 就消失了。
这里要说明一下:Session 的 cookie 在 ie6 下,如果用户实在网页上跳转打开页面或新开窗口(包括 target=”_blank”,鼠标右键新开窗口),都是在同一个 Session 内。如果用户新开浏览器程序或者说是进程再打开当前的页面就不是同一个 Session。其他浏览器只要你 Session 存在,还是同一个 Session,cookie 还能共享。在前段时间的项目中 ie6 下吃了很大一个亏。
domain 属性
domain 属性可以使多个 web 服务器共享 cookie。domain 属性的默认值是创建 cookie 的网页所在服务器的主机名。不能将一个 cookie 的域设置成服务器所在的域之外的域。例如让位于 a.sodao.com 的服务器能够读取 b.sodao.com 设置的 cookie 值。如果 b.sodao.com 的页面创建的 cookie 把它的 path 属性设置为 “/”,把 domain 属性设置成 “.sodao.com”,那么所有位于 b.sodao.com 的网页和所有位于 a.sodao.com 的网页,以及位于 sodao.com 域的其他服务器上的网页都可以访问这个 cookie。
path 属性
它指定与 cookie 关联在一起的网页。在默认的情况下 cookie 会与创建它的网页,该网页处于同一目录下的网页以及与这个网页所在目录下的子目录下的网页关联
secure 属性
它是一个布尔值,指定在网络上如何传输 cookie,默认是不安全的,通过一个普通的 http 连接传输;
HttpOnly 属性
HttpOnly 属性限制了 cookie 对 HTTP 请求的作用范围。特别的,该属性指示用户代理忽略那些通过 “非 HTTP” 方式对 cookie 的访问(比如浏览器暴露给 js 的接口)。注意 HttpOnly 属性和 Secure 属性相互独立:一个 cookie 既可以是 HttpOnly 的也可以有 Secure 属性。
在前段时间的项目中我就用 js 去读取一个 cookie,结果怎么都取不到这个值,最后查证这个 cookie 是 httpOnly 的,花了近 2 个小时,悲剧了。
cookie 的传输
浏览器将 cookie 信息以name-value对
的形式存储于本地,每当请求新文档时,浏览器将发送 Cookie,目的是让 Server 可以通过 HTTP 请求追踪客户。所以从 WEB 性能的角度来说我们要尽量的减小 cookie,以达到传输性能的最大化。
cookie 的编码和解码
由于 cookie 的名 / 值中的值不允许包含分号,逗号和空格符,为了最大化用户代理和服务器的兼容性,任何被存储为 cookie 值的数据都应该被编码,例如用我们前端熟知的 js 全局函数 encodeURIComponent 编码和 decodeURIComponent 解码。
cookie 作为客户端存储
前面说了每当请求新文档时,浏览器将发送 Cookie 到服务器,导致 WEB 性能下降。所以不建议将 cookie 作为客户端存储一种实现方案,替代方案参见:JavaScript 本地存储实践(html5 的 localStorage 和 ie 的 userData)等。
同名的 cookie
同名的 cookie,不同的 domain 或不同的 path,属不同的 cookie;同名的 cookie,相同的 domain 且相同的 path,不同的 expires,属同一个 cookie。
网友评论