美文网首页
浅谈浏览器缓存机制

浅谈浏览器缓存机制

作者: 沐源山 | 来源:发表于2019-08-04 20:15 被阅读0次

    概述

    在面试的过程中会常常提到浏览器的缓存机制,那么什么是浏览器的缓存机制?
    浏览的缓存机制也就是我们常说的HTTP的缓存机制,根据HTTP报文的缓存标识进行的,那么小伙伴肯定会问,什么是HTTP报文?
    在这里我给大家简单的介绍一下,有兴趣的小伙伴可以深入的探究一下。
    HTTP请求分两种:
    第一种:


    HTTP请求报文
    请求报文主体

    如上图:报文的格式为:请求行-HTTP头(通用信息头,请求头,实体头)- 请求报文主体(只有POST才有报文主体)
    第二种:


    响应报文
    响应主体
    HTTP响应(Response)报文格式为:状态行-HTTP头(通用信息头,响应头,实体头)- 响应报文主体,
    注:通用信息头指的是请求和响应报文都支持的头域,分别为Cache-Control、Connection、Date、Pragma、Transfer-Encoding、Upgrade、Via;实体头则是实体信息的实体头域,分别为Allow、Content-Base、Content-Encoding、Content-Language、Content-Length、Content-Location、Content-MD5、Content-Range、Content-Type、Etag、Expires、Last-Modified、extension-header。这里只是为了方便理解,将通用信息头,响应头/请求头,实体头都归为了HTTP头。

    下面我们正式开始

    缓存过程分析

    浏览HTTP头的缓存标识,决定是否缓存结果,是则将请求结果和缓存标识存入浏览器缓存中,接下来我们来看一张图:


    第一次发起请求

    从上图我们可以知道:
    1、浏览器每次发起请求,都会先在浏览器缓存中查找该请求的结果以及缓存标识
    2、浏览器每次拿到返回的请求结果和缓存标识存入浏览器缓存中
    以上两点结论就是浏览器缓存机制的关键,他确保了每个请求的缓存存入与读取,只要我们再理解浏览器缓存的使用规则,就可以解决问题。
    在这里引入两个概念,强制缓存和协商缓存,更近一步的方便大家的理解。

    强制缓存

    强制缓存就是向浏览器缓存查找该请求结果,并根据该结果的缓存规则来决定是否使用该缓存结果的过程,那么强制缓存的情况主要有三种。

    第一种

    不存在该缓存结果和缓存标识,强制缓存失效,则直接向服务端发起请求(这里和第一次发起请求的效果一直)


    第一种
    第二种

    存在该缓存结果和缓存标识,但该结果已失效,强制缓存失效,则使用协商缓存。


    第二种
    第三种

    存在该缓存结果和标识,且该结果尚未失效,强制缓存生效,直接返回该结果。

    第三种
    在这里小伙伴肯定会迷糊,那么强制缓存的缓存规则什么呢?
    当浏览器向服务器发起请求时,服务器会将缓存规则放入HTTP响应报文的HTTP头中和请求结果一起返回给浏览器,控制强制缓存的字段分别是ExpiresCache-Control,其中Cache-Control的优先级比Expires高。
    什么是Expires?

    Expires是HTTP/1.0控制网页缓存的字段,其值为服务器返回该请求结果缓存的到期时间,即再次发起该请求时,如果客户端的时间小于Expires的值是,直接使用缓存结果。

    Expires是HTTP/1.0的字段,但是现在浏览器默认使用的是HTTP/1.1,那么在HTTP/1.1中网页缓存还是否由Expires控制?

    到了HTTP/1.1,Expires已经被Cache-Control替代,原因就在于Expire控制缓存的原理是使用了客户端的时间与服务端的世家你做对比,那么如果客户端与服务端的时间因为某些原因发生误差,那么强制缓存则会直接失效,这样的话强制缓存的存在毫无意义。

    Cache-Control

    在HTTP/1.1中,Cache-Control是重要的规则,主要用于控制网页缓存,主要取值为:
    public:所有内容都将被缓存(客户端和代理服务器都可缓存)

    -private:所有内容只有客户端可以缓存,Cache-Control的默认取值

    -no-cache:客户端缓存内容,但是是否使用缓存则需要经过协商缓存来验证决定

    -no-store:所有内容都不会被缓存,即不使用强制缓存,也不使用协商缓存

    -max-age=xxx (xxx is numeric):缓存内容将在xxx秒后失效
    举个栗子


    Expires&cache-control

    通过上图我们知道:
    -HTTP响应报文中expires的时间值,是一个绝对值
    -HTTP响应报文中Cache-Control为max-age=600,是相对值

    由于Cache-Control的优先级比expires的高,那么直接根据Cache-Control的值进行缓存,在600秒内再次发起该请求,则会直接使用缓存结果,强制缓存生效。

    PS::在无法确定客户端的时间是否与服务端的时间同步的情况下,Cache-Control相比于expires是更好的选择,所以同时存在时,只有Cache-Control生效。
    我们了解了强制缓存的过程后,我们再思考一个问题?

    浏览器的缓存存放在哪里,如何在浏览器中判断强制缓存是否生效?

    栗子

    我们通过上面图片作为一个栗子,状态码为灰色的请求则代表使用了强制缓存,请求对应的Size值则代表改缓存存放放的位置,分别为
    from memory cachefrom disk cache

    那么from memory cachefrom disk cache又分别代表的是什么呢?什么时候会使用from disk cache又什么什么时候会使用from memory cache呢?

    from memory cache代表使用内存中的缓存,ffrom disk cache则代表使用的是硬盘中的缓存,浏览器读取缓存的顺序为memory >>> disk
    下面我们通过一个栗子来进一步的理解他们
    访问https://frankeyang.github.io/ –> 200 –> 关闭博客的标签页 –> 重新打开https://frankeyang.github.io/ –> 200(from disk cache) –> 刷新 –> 200(from memory cache)

    具体过程:
    1,访问https://frankeyang.github.io/

    network
    2,关闭github
    3,重新打开
    network
    4,刷新
    image

    看到这里又有疑惑了?最后一个步骤不是两个存储吗?

    对于这个问题。我们需要了解内存缓存(from memory cache)和硬盘缓存(from disk cache)

    -内存缓存(from memory cache):内存缓存具有两个特点,分别是快速读取和时效性;
    -快速读取:内存缓存会将编译解析后的文件,直接存入该进程的内存中,占据该进程一定的内存资源,以方便下次运行使用时的快速读取。

    -时效性:一旦该进程关闭,则该进程的内存就会清空。

    -硬盘缓存(from disk cache):硬盘缓存则是直接将缓存写入硬盘文件中,读取缓存需要对该缓存存放的硬盘文件进行I/O操作,然后重新解析该缓存内容,读取复杂,速度比内存缓存慢。

    在浏览器中,浏览器会在js和图片等文件解析执行后直接存入内存缓存中,那么当页面刷新时,只需要直接从内存缓存中读取(from memory cache);而css文件则会存入硬盘中,所以每次渲染页面都会从硬盘中读取缓存(from disk cache)。

    协商缓存

    协商缓存就是强制缓存失效后,浏览器携带缓存标识向服务器发起请求,由服务器根据缓存标识决定是否使用缓存的过程,主要有以下两种情况:

    第一种

    协商缓存生效,返回304


    304
    第二种

    协商缓存失效,返回200和请求结果


    200

    200
    同样,协商缓存的标识也是在响应报文的HTTP头中和请求结果一起返回给浏览器的,控制协商缓存的字段分别有:Last-Modified / If-Modified-Since和Etag / If-None-Match,其中Etag / If-None-Match的优先级比Last-Modified / If-Modified-Since高。

    Last-Modified / If-Modified-Since

    Last-Modified是服务器响应请求时,返回该资源文件在服务器最后被修改的时间,看下图


    Last-Modified

    If-Modified-Since则是客户端再次发起该请求时,携带上次请求返回的Last-Modified值,通过此字段值告诉服务器该资源上次请求返回的最后被修改事件。服务器收到该请求,发现请求头中含有If-Modified-Since字段,则会根据If-Modified-Since的字段值与该资源在服务器的最后被修改时间作对比,若服务器的资源最后被修改时间大于If-Modified-Since的字段,则会重新返回资源,状态码为200,否则返回304,代表资源无更新可继续使用缓存文件。


    If-Modified-Since
    Etag / If-None-Match

    Etag是服务器响应请求时,返回当前资源文件的一个唯一标识(由服务器生成)


    Etag

    If-None-Match是客户端再次发起该请求时,携带上次请求放回的唯一标识Etag值,通过此字段值告诉服务器该资源上次请求返回的唯一标识值。服务器收到该请求后,发现该请求头含有If-None-Match,则会根据If-None-Match的字段值与该资源在服务区的Etag值做对比,一则则返回304,代表无资源更新,可以使用缓存文件;不一致则重新返回资源文件,状态码为200,


    If-None-Match

    注:Etag / If-None-Match优先级高于Last-Modified / If-Modified-Since,同时存在则只有Etag / If-None-Match生效

    总结

    强制缓存优于协商缓存进行,若强制缓存(Expires和Cache-Control)生效则直接使用缓存,若不生效则进行协商缓存(Expires和Cache-Control),协商缓存有服务器决定是否使用缓存,若协商缓存失效,那么就代表该请求失效,重新获取请求结果,再存入浏览器中;生效则返回304,继续使用缓存。
    我们用一张图来生动的描述一下:


    总结


    文中若有不妥之处,还望斧正,共同学习,共同进步!

    相关文章

      网友评论

          本文标题:浅谈浏览器缓存机制

          本文链接:https://www.haomeiwen.com/subject/ibxjdctx.html