浅谈浏览器缓存机制

作者: 沐源山 | 来源:发表于2019-08-04 20:15 被阅读0次

浅谈浏览器Http的缓存机制
<计算机与网络篇> 应用层缓存机制
Head Frist Web缓存
【转载】彻底理解浏览器的Http缓存机制
浏览器缓存机制
让我们学习了解浏览器的缓存，提高页面的流畅度
Web浏览器的缓存机制
2020-08-14 彻底理解浏览器的Http缓存机制
http的缓存机制(个人笔记)
nginx 缓存(11)

概述

在面试的过程中会常常提到浏览器的缓存机制，那么什么是浏览器的缓存机制？
浏览的缓存机制也就是我们常说的HTTP的缓存机制，根据HTTP报文的缓存标识进行的，那么小伙伴肯定会问，什么是HTTP报文？
在这里我给大家简单的介绍一下，有兴趣的小伙伴可以深入的探究一下。
HTTP请求分两种：
第一种：

HTTP请求报文

请求报文主体

如上图：报文的格式为：请求行-HTTP头（通用信息头，请求头，实体头）- 请求报文主体（只有POST才有报文主体）
第二种：

响应报文

响应主体
HTTP响应（Response）报文格式为：状态行-HTTP头（通用信息头，响应头，实体头）- 响应报文主体，
注：通用信息头指的是请求和响应报文都支持的头域，分别为Cache-Control、Connection、Date、Pragma、Transfer-Encoding、Upgrade、Via；实体头则是实体信息的实体头域，分别为Allow、Content-Base、Content-Encoding、Content-Language、Content-Length、Content-Location、Content-MD5、Content-Range、Content-Type、Etag、Expires、Last-Modified、extension-header。这里只是为了方便理解，将通用信息头，响应头/请求头，实体头都归为了HTTP头。

下面我们正式开始

缓存过程分析

浏览HTTP头的缓存标识，决定是否缓存结果，是则将请求结果和缓存标识存入浏览器缓存中，接下来我们来看一张图：

第一次发起请求

从上图我们可以知道：
1、浏览器每次发起请求，都会先在浏览器缓存中查找该请求的结果以及缓存标识
2、浏览器每次拿到返回的请求结果和缓存标识存入浏览器缓存中
以上两点结论就是浏览器缓存机制的关键，他确保了每个请求的缓存存入与读取，只要我们再理解浏览器缓存的使用规则，就可以解决问题。
在这里引入两个概念，强制缓存和协商缓存，更近一步的方便大家的理解。

强制缓存

强制缓存就是向浏览器缓存查找该请求结果，并根据该结果的缓存规则来决定是否使用该缓存结果的过程，那么强制缓存的情况主要有三种。

第一种

不存在该缓存结果和缓存标识，强制缓存失效，则直接向服务端发起请求（这里和第一次发起请求的效果一直）

第一种

第二种

存在该缓存结果和缓存标识，但该结果已失效，强制缓存失效，则使用协商缓存。

第二种

第三种

存在该缓存结果和标识，且该结果尚未失效，强制缓存生效，直接返回该结果。

第三种
在这里小伙伴肯定会迷糊，那么强制缓存的缓存规则什么呢？
当浏览器向服务器发起请求时，服务器会将缓存规则放入HTTP响应报文的HTTP头中和请求结果一起返回给浏览器，控制强制缓存的字段分别是Expires和Cache-Control,其中Cache-Control的优先级比Expires高。

什么是Expires？

Expires是HTTP/1.0控制网页缓存的字段，其值为服务器返回该请求结果缓存的到期时间，即再次发起该请求时，如果客户端的时间小于Expires的值是，直接使用缓存结果。

Expires是HTTP/1.0的字段，但是现在浏览器默认使用的是HTTP/1.1，那么在HTTP/1.1中网页缓存还是否由Expires控制？

到了HTTP/1.1，Expires已经被Cache-Control替代，原因就在于Expire控制缓存的原理是使用了客户端的时间与服务端的世家你做对比，那么如果客户端与服务端的时间因为某些原因发生误差，那么强制缓存则会直接失效，这样的话强制缓存的存在毫无意义。

Cache-Control

在HTTP/1.1中，Cache-Control是重要的规则，主要用于控制网页缓存，主要取值为：
public：所有内容都将被缓存（客户端和代理服务器都可缓存）

-private：所有内容只有客户端可以缓存，Cache-Control的默认取值

-no-cache：客户端缓存内容，但是是否使用缓存则需要经过协商缓存来验证决定

-no-store：所有内容都不会被缓存，即不使用强制缓存，也不使用协商缓存

-max-age=xxx (xxx is numeric)：缓存内容将在xxx秒后失效
举个栗子

Expires&cache-control

通过上图我们知道：
-HTTP响应报文中expires的时间值，是一个绝对值
-HTTP响应报文中Cache-Control为max-age=600，是相对值

由于Cache-Control的优先级比expires的高，那么直接根据Cache-Control的值进行缓存，在600秒内再次发起该请求，则会直接使用缓存结果，强制缓存生效。

PS：：在无法确定客户端的时间是否与服务端的时间同步的情况下，Cache-Control相比于expires是更好的选择，所以同时存在时，只有Cache-Control生效。
我们了解了强制缓存的过程后，我们再思考一个问题？

浏览器的缓存存放在哪里，如何在浏览器中判断强制缓存是否生效？

栗子

我们通过上面图片作为一个栗子，状态码为灰色的请求则代表使用了强制缓存，请求对应的Size值则代表改缓存存放放的位置，分别为
from memory cache和from disk cache

那么from memory cache和from disk cache又分别代表的是什么呢？什么时候会使用from disk cache又什么什么时候会使用from memory cache呢？

from memory cache代表使用内存中的缓存，ffrom disk cache则代表使用的是硬盘中的缓存，浏览器读取缓存的顺序为memory >>> disk
下面我们通过一个栗子来进一步的理解他们
访问https://frankeyang.github.io/ –> 200 –> 关闭博客的标签页 –> 重新打开https://frankeyang.github.io/ –> 200(from disk cache) –> 刷新 –> 200(from memory cache)

具体过程：
1，访问https://frankeyang.github.io/

network
2，关闭github
3，重新打开

network
4，刷新

image

看到这里又有疑惑了？最后一个步骤不是两个存储吗？

对于这个问题。我们需要了解内存缓存(from memory cache)和硬盘缓存(from disk cache)

-内存缓存(from memory cache)：内存缓存具有两个特点，分别是快速读取和时效性；
-快速读取：内存缓存会将编译解析后的文件，直接存入该进程的内存中，占据该进程一定的内存资源，以方便下次运行使用时的快速读取。

-时效性：一旦该进程关闭，则该进程的内存就会清空。

-硬盘缓存(from disk cache)：硬盘缓存则是直接将缓存写入硬盘文件中，读取缓存需要对该缓存存放的硬盘文件进行I/O操作，然后重新解析该缓存内容，读取复杂，速度比内存缓存慢。

在浏览器中，浏览器会在js和图片等文件解析执行后直接存入内存缓存中，那么当页面刷新时，只需要直接从内存缓存中读取(from memory cache)；而css文件则会存入硬盘中，所以每次渲染页面都会从硬盘中读取缓存(from disk cache)。

协商缓存

协商缓存就是强制缓存失效后，浏览器携带缓存标识向服务器发起请求，由服务器根据缓存标识决定是否使用缓存的过程，主要有以下两种情况：

第一种

协商缓存生效，返回304

304

第二种

协商缓存失效，返回200和请求结果

200

200
同样，协商缓存的标识也是在响应报文的HTTP头中和请求结果一起返回给浏览器的，控制协商缓存的字段分别有：Last-Modified / If-Modified-Since和Etag / If-None-Match，其中Etag / If-None-Match的优先级比Last-Modified / If-Modified-Since高。

Last-Modified / If-Modified-Since

Last-Modified是服务器响应请求时，返回该资源文件在服务器最后被修改的时间，看下图

Last-Modified

If-Modified-Since则是客户端再次发起该请求时，携带上次请求返回的Last-Modified值，通过此字段值告诉服务器该资源上次请求返回的最后被修改事件。服务器收到该请求，发现请求头中含有If-Modified-Since字段，则会根据If-Modified-Since的字段值与该资源在服务器的最后被修改时间作对比，若服务器的资源最后被修改时间大于If-Modified-Since的字段，则会重新返回资源，状态码为200，否则返回304，代表资源无更新可继续使用缓存文件。

If-Modified-Since

Etag / If-None-Match

Etag是服务器响应请求时，返回当前资源文件的一个唯一标识（由服务器生成）

Etag

If-None-Match是客户端再次发起该请求时，携带上次请求放回的唯一标识Etag值，通过此字段值告诉服务器该资源上次请求返回的唯一标识值。服务器收到该请求后，发现该请求头含有If-None-Match，则会根据If-None-Match的字段值与该资源在服务区的Etag值做对比，一则则返回304，代表无资源更新，可以使用缓存文件；不一致则重新返回资源文件，状态码为200，

If-None-Match

注：Etag / If-None-Match优先级高于Last-Modified / If-Modified-Since，同时存在则只有Etag / If-None-Match生效

总结

强制缓存优于协商缓存进行，若强制缓存(Expires和Cache-Control)生效则直接使用缓存，若不生效则进行协商缓存(Expires和Cache-Control)，协商缓存有服务器决定是否使用缓存，若协商缓存失效，那么就代表该请求失效，重新获取请求结果，再存入浏览器中；生效则返回304，继续使用缓存。
我们用一张图来生动的描述一下：

总结

；

文中若有不妥之处，还望斧正，共同学习，共同进步！

浅谈浏览器Http的缓存机制
浅谈浏览器Http的缓存机制 ✦ ✦ ✦ ✦ ✦ ✦ ✦ ✦ 针对浏览器的http缓存的分析也算是老生常谈了，每隔...
<计算机与网络篇> 应用层缓存机制
上篇我们讲到浏览器缓存策略中的 HTTP 缓存机制，接下来我们继续浅谈一下浏览器应用层面中的缓存机制，跟上篇一样先...
Head Frist Web缓存
参考资源图书：《图解HTTP》博客：[1] AlloyTeam Web缓存机制系列博客：[2] 浅谈浏览器h...
【转载】彻底理解浏览器的Http缓存机制
转自：彻底理解浏览器的缓存机制（http缓存机制）概述浏览器的缓存机制也就是我们说的HTTP缓存机制，其机制是...
浏览器缓存机制
浏览器缓存机制：浏览器缓存机制，其实主要就是http协议定义的缓存机制（如：Expires;Cache-contr...
让我们学习了解浏览器的缓存，提高页面的流畅度
浏览器的缓存机制也就是我们说的HTTP缓存机制，其机制是根据HTTP报文的缓存标识进行的，所以在分析浏览器缓存机制...
Web浏览器的缓存机制
原文转载【Web缓存机制系列】2 – Web浏览器的缓存机制浏览器端的缓存规则对于浏览器端的缓存来讲，这些规则...
2020-08-14 彻底理解浏览器的Http缓存机制
彻底理解浏览器的Http缓存机制概述浏览器的缓存机制也就是我们说的HTTP缓存机制，其机制是根据HTTP报文的...
http的缓存机制(个人笔记)
本文来源：彻底理解浏览器的Http缓存机制概述浏览器的缓存机制也就是我们说的HTTP缓存机制，其机制是根据HT...
nginx 缓存(11)
介绍nginx是如何设置缓存之前，我们还是先聊聊web浏览器的缓存机制。 1.浏览器缓存浏览器的缓存机制也就是我...