#003 HTML5缓存机制浅析

作者: izhongxia | 来源:发表于2017-03-29 15:11 被阅读194次

#003 HTML5缓存机制浅析
Android ListView 与 RecyclerView
Android缓存浅析
复习
Glide缓存机制浅析
Glide缓存机制浅析
浏览器缓存机制1
2021-01-27面试题
基于Android 的Log机制
Android cache缓存

时间：2017-03-27 18:02:47

该文章为《HTML5缓存机制浅析：移动端Web加载性能优化》的读书笔记，整理一下自己的收获。

一、HTML5缓存机制介绍

HTML5是新一代的HTML标准，加入很多新的特性。离线存储（也可称为缓存机制）是其中一个非常重要的特性。HTML5引入的离线存储，这意味着Web应用可进行缓存，并可在没有因特网连接时进行访问。

1.1 HTML5应用程序缓存带来的优势

离线浏览
提高加载速度（从缓存中加载）
减少服务器负载（浏览器将只从服务器下载更新的资源，强缓存的则不发起HTTP请求，协商缓存会发起HTTP，和服务器验证文件是否修改过了）

1.2 现有的HTML5缓存机制

勾选的，表示熟悉

[x] 浏览器缓存机制（强缓存，协商缓存）
[x] DOM Storgage 存储机制
[ ] Web SQL DataBase 存储机制【关系型数据库】
[ ] Application Cache (App Cache)机制
[ ] Indexed DataBase （IndexedDB）【NoSQL】
[ ] File System API

Web SQL DataBase 官方的标准文档不在推荐使用，将来也不再维护，（2015年12月）;

各大桌面浏览器和移动端浏览器都有很好的实现这个接口，兼容性问题不大，底层基本都是 sqlite（正因为这样，作为一个web标准是不可接受的）
- 经测试，IOS上容量最大支持50M，不过用系统自带的safari，超过5MB，会主动提醒用户是否要增加数据库大小，不友好（不过微信里面不会）
- 5MB 如果用来存一些日志，还是够的（当然需要记得清理旧的日志）
- websql 目前是主要的解决方案（腾讯用来做日志记录，方便排查用户的错误反馈）
Indexed DataBase 是下一代的客服端结构化数据持久存储反感，目前各大浏览器中也有很好的支持，是未来用来替换 websql 的方案。

等下查下最新的情况。

这里只是官网推荐的比较，具体使用还需要看目前业界上的情况。
比如websql目前还是主流的，indexdb是未来用来替换的，具体需要多久，还需要等等。

1.3 目标

[ ] 分析各种缓存机制的原理，用法，特点
[ ] Android移动端Web性能加载优化
[ ] 如何利用缓存机制提高Web加载性能

二、分析各个缓存机制

先对各个缓存机制有一个大体的了解，然后才能去考虑如何优化。目前对浏览器缓存和DOM Storage比较熟悉，其他的大体了解，但是没有项目中用过。

2.1 浏览器缓存机制

浏览器缓存机制是指通过HTTP协议头里的 Cache-Control / Expires 和 Last-Modified / ETag 等字段控制文件缓存的机制。

和 DOM Storage, AppCache 等缓存机制，本质一样。一个在HTTP协议层实现（浏览器缓存），一个在应用层实现。

2.1.1 强缓存

采用 Cache-Control 和 Expires 来控制缓存。 Chrome开发者工具NetWork，查看为 form disk cache

Cache-Control (HTTP1.1标准中新增的字段)
1. 控制文件本地缓存的有效时间.
2. Cache-Control:max-age=600 表示文件本地缓存有效时间600s，接下来600s内请求这个资源，浏览器不发出HTTP请求，直接从本地缓存拿
3. 是一个相对的时间

Expires （HTTP1.0标准中的字段）
1. Expires: Thu, 10 Nov 2015 08:45:11 GMT 表示在这个时间前，缓存有效
2. 是一个绝对时间，由于服务器的时间和客服端的时间可能不一致造成缓存问题，因此引入了HTTP1.1的Cache-Control
3. 优先级小于 Cache-Control

2.1.2 协商缓存

HTTP 的状态为 304 表示协商缓存

Last-Modified 和 If-Modified-Since

Last-Modified是标识文件在服务器上的最新更新时间。下次请求时，如果文件缓存过期，浏览器通过If-Modified-Since字段带上这个时间，发送给服务器，由服务器比较时间戳来判断文件是否有修改。如果没有修改，服务器返回304告诉浏览器继续使用缓存；如果有修改，则返回200，同时返回最新的文件。

ETag 和 If-None-Match

Etag也是和Last-Modified一样，对文件进行标识的字段。不同的是，Etag的取值是一个对文件进行标识的特征字串。在向服务器查询文件是否有更新时，浏览器通过If-None-Match字段把特征字串发送给服务器，由服务器和文件最新特征字串进行匹配，来判断文件是否有更新。没有更新回包304，有更新回包200。

Etag和Last-Modified可根据需求使用一个或两个同时使用。两个同时使用时，只要满足基中一个条件，就认为文件没有更新。

2.1.3 F5 和 Ctrl+F5 的特殊情况

手动刷新页面（F5)，浏览器会直接认为缓存已经过期（可能缓存还没有过期），在请求中加上字段：Cache-Control:max-age=0，发包向服务器查询是否有文件是否有更新。

可能存在304协商缓存

强制刷新页面（Ctrl+F5)，浏览器会直接忽略本地的缓存（有缓存也会认为本地没有缓存），在请求中加上字段：Cache-Control:no-cache（或 Pragma:no-cache），发包向服务重新拉取文件。

不存在强缓存和协商缓存

三、LocalStorage， SessionStorage

一个简单的键值对存储系统，接口简单实用，兼容性也很好。有大小限制，提供5M（不同浏览器可能不同，区分host， cookie 只有 4k）

3.1 LocalStorage和 SessionStorage的用法

interface Storage { 

    readonly attribute unsigned long length;
    
    [IndexGetter] DOMString key(in unsigned long index); 
    
    [NameGetter] DOMString getItem(in DOMString key); 
    
    [NameSetter] void setItem(in DOMString key, in DOMString data); 
    
    [NameDeleter] void removeItem(in DOMString key); 
    
    void clear();
};

3.2 LocalStorage 和 SessionStorage 的区别

LocalStorage 和 SessionStorage 的区别， SessionStorage 在页面选项卡关闭后，就不存在了，但是 LocalStorage会还存在。但是注意：页面刷新的时候，SessionStorage还是存在的。

比如在页面刷新后，表单填写的内容还存在，这个时候使用 SessionStorage最有用了。

3.3 总结

分析：Dom Storage给Web提供了一种更录活的数据存储方式，存储空间更大（相对Cookies），用法也比较简单，方便存储服务器或本地的一些临时数据。

适合存储简单数据
如果存结构化数据，可以借住JSON的功能
不适合存储复杂，存储空间要求比较大的数据，还有不适合存静态文件

四、Web SQL Database存储机制

目前用来存储结构化数据还是比较主流的一个选择。参考《腾讯开发工程师：前端异常监控到底怎么做》

IOS下，最大支持50M , 系统自带浏览器Safari，默认超过5M的时候，会弹出提示让用户增加大小，不太友好。

微信浏览器下，不会提示。

4.1 简单例子

<script>
    if(window.openDatabase){
      //打开数据库，如果没有则创建
      var db = openDatabase('mydb', '1.0', 'Test DB', 2 * 1024);
       //通过事务，创建一个表，并添加两条记录
      db.transaction(function (tx) {
           tx.executeSql('CREATE TABLE IF NOT EXISTS LOGS (id unique, log)');
           tx.executeSql('INSERT INTO LOGS (id, log) VALUES (1, "foobar")');
           tx.executeSql('INSERT INTO LOGS (id, log) VALUES (2, "logmsg")');
       });
      //查询表中所有记录，并展示出来
     db.transaction(function (tx) {
         tx.executeSql('SELECT * FROM LOGS', [], function (tx, results) {
             var len = results.rows.length, i;
             msg = "<p>Found rows: " + len + "</p>";
             for(i=0; i<len; i++){
                 msg += "<p>" + results.rows.item(i).log + "</p>";
             }
             document.querySelector('#status').innerHTML =  msg;
             }, null);
      });
}
</script>
<div id="status" name="status">Status Message</div><br>

4.2 分析

适合存储结构复杂的数据
使用起来相对麻烦点，需要了解SQL语句
不是和做静态文件的存储

五、Application Cache 机制

似乎是为了支持 Web App 离线使用二开发的缓存机制。缓存和浏览器缓存机制类似。

按文件单位进行缓存
通过manifest来控制文件的缓存
大小5M的限制

AppCache的原理有两个关键点：manifest属性和 manifest文件。

缓存文件有更新需要更新 manifest文件 [正常有更新文件就修改mainfest里面的一个版本号]

CACHE MANIFEST
# 2012-02-21 v1.0.0
/theme.css
/logo.gif
/main.js
NETWORK:
login.asp
FALLBACK:
/html/ /offline.html <br>

5.2 分析

分析：AppCache看起来是一种比较好的缓存方法，除了缓存静态资源文件外，也适合构建Web离线 App。在实际使用中有些需要注意的地方，有一些可以说是”坑“。

要更新缓存的文件，需要更新包含它的manifest文件，那怕只加一个空格。常用的方法，是修改manifest文件注释中的版本号。如：# 2012-02-21 v1.0.0；
被缓存的文件，浏览器是先使用，再通过检查manifest文件是否有更新来更新缓存文件。这样缓存文件可能用的不是最新的版本。
在更新缓存过程中，如果有一个文件更新失败，则整个更新会失败。
manifest和引用它的HTML要在相同Host。
manifest文件中的文件列表，如果是相对路径，则是相对manifest文件的相对路径。
manifest也有可能更新出错，导致缓存文件更新失败。
没有缓存的资源在已经缓存的HTML中不能加载，即使有网络。例如：http://appcache-demo.s3-website-us-east-1.amazonaws.com/without-network/。
manifest文件本身不能被缓存，且manifest文件的更新使用的是浏览器缓存机制。所以manifest
文件的Cache-Control缓存时间不能设置太长。
另外，根据官方文档，AppCache已经不推荐使用了，标准也不会再支持。现在主流的浏览器都是还支持AppCache的，以后就不太确定了。

六、 Indexed Database

IndexedDB也是一种数据库的存储机制，但不同于已经不再支持的Web SQL Database。IndexedDB不是传统的关系数据库，可归为NoSQL数据库。IndexedDB又类似于Dom Storage的key-value的存储方式，但功能更强大，且存储空间更大。

NoSQL数据库
类似DOM Storage 键值对存储方式

6.1 基本使用

<script type="text/javascript">
var db;
window.indexedDB = window.indexedDB || window.mozIndexedDB || window.webkitIndexedDB || window.msIndexedDB;
//浏览器是否支持IndexedDB
if (window.indexedDB) {
   //打开数据库，如果没有，则创建
   var openRequest = window.indexedDB.open("people_db", 1);
   //DB版本设置或升级时回调
   openRequest.onupgradeneeded = function(e) {
       console.log("Upgrading...");
       var thisDB = e.target.result;
       if(!thisDB.objectStoreNames.contains("people")) {
           console.log("Create Object Store: people.");
           //创建存储对象，类似于关系数据库的表
           thisDB.createObjectStore("people", { autoIncrement:true });
          //创建存储对象， 还创建索引
          //var objectStore = thisDB.createObjectStore("people",{ autoIncrement:true });
         // //first arg is name of index, second is the path (col);
        //objectStore.createIndex("name","name", {unique:false});
       //objectStore.createIndex("email","email", {unique:true});
     }
}
//DB成功打开回调
openRequest.onsuccess = function(e) {
    console.log("Success!");
    //保存全局的数据库对象，后面会用到
    db = e.target.result;
   //绑定按钮点击事件
    document.querySelector("#addButton").addEventListener("click", addPerson, false);
    document.querySelector("#getButton").addEventListener("click", getPerson, false);
    document.querySelector("#getAllButton").addEventListener("click", getPeople, false);
    document.querySelector("#getByName").addEventListener("click", getPeopleByNameIndex1, false);
}
  //DB打开失败回调
  openRequest.onerror = function(e) {
      console.log("Error");
      console.dir(e);
   }
}else{
    alert('Sorry! Your browser doesn\'t support the IndexedDB.');
}
//添加一条记录
function addPerson(e) {
    var name = document.querySelector("#name").value;
    var email = document.querySelector("#email").value;
    console.log("About to add "+name+"/"+email);
    var transaction = db.transaction(["people"],"readwrite");
var store = transaction.objectStore("people");
   //Define a person
   var person = {
       name:name,
       email:email,
       created:new Date()
   }
   //Perform the add
   var request = store.add(person);
   //var request = store.put(person, 2);
   request.onerror = function(e) {
       console.log("Error",e.target.error.name);
       //some type of error handler
   }
   request.onsuccess = function(e) {
      console.log("Woot! Did it.");
   }
}
//通过KEY查询记录
function getPerson(e) {
    var key = document.querySelector("#key").value;
    if(key === "" || isNaN(key)) return;
    var transaction = db.transaction(["people"],"readonly");
    var store = transaction.objectStore("people");
    var request = store.get(Number(key));
    request.onsuccess = function(e) {
        var result = e.target.result;
        console.dir(result);
        if(result) {
           var s = "<p><h2>Key "+key+"</h2></p>";
           for(var field in result) {
               s+= field+"="+result[field]+"<br/>";
           }
           document.querySelector("#status").innerHTML = s;
         } else {
            document.querySelector("#status").innerHTML = "<h2>No match!</h2>";
         }
     }
}
//获取所有记录
function getPeople(e) {
    var s = "";
     db.transaction(["people"], "readonly").objectStore("people").openCursor().onsuccess = function(e) {
        var cursor = e.target.result;
        if(cursor) {
            s += "<p><h2>Key "+cursor.key+"</h2></p>";
            for(var field in cursor.value) {
                s+= field+"="+cursor.value[field]+"<br/>";
            }
            s+="</p>";
            cursor.continue();
         }
         document.querySelector("#status2").innerHTML = s;
     }
}
//通过索引查询记录
function getPeopleByNameIndex(e)
{
    var name = document.querySelector("#name1").value;
    var transaction = db.transaction(["people"],"readonly");
    var store = transaction.objectStore("people");
    var index = store.index("name");
    //name is some value
    var request = index.get(name);
    request.onsuccess = function(e) {
       var result = e.target.result;
       if(result) {
           var s = "<p><h2>Name "+name+"</h2><p>";
           for(var field in result) {
               s+= field+"="+result[field]+"<br/>";
           }
           s+="</p>";
    } else {
        document.querySelector("#status3").innerHTML = "<h2>No match!</h2>";
     }
   }
}
//通过索引查询记录
function getPeopleByNameIndex1(e)
{
    var s = "";
    var name = document.querySelector("#name1").value;
    var transaction = db.transaction(["people"],"readonly");
    var store = transaction.objectStore("people");
    var index = store.index("name");
    //name is some value
    index.openCursor().onsuccess = function(e) {
        var cursor = e.target.result;
        if(cursor) {
            s += "<p><h2>Key "+cursor.key+"</h2></p>";
            for(var field in cursor.value) {
                s+= field+"="+cursor.value[field]+"<br/>";
            }
            s+="</p>";
            cursor.continue();
         }
         document.querySelector("#status3").innerHTML = s;
     }
}
</script>
<p>添加数据<br/>
<input type="text" id="name" placeholder="Name"><br/>
<input type="email" id="email" placeholder="Email"><br/>
<button id="addButton">Add Data</button>
</p>
<p>根据Key查询数据<br/>
<input type="text" id="key" placeholder="Key"><br/>
<button id="getButton">Get Data</button>
</p>
<div id="status" name="status"></div>
<p>获取所有数据<br/>
<button id="getAllButton">Get EveryOne</button>
</p>
<div id="status2" name="status2"></div>
<p>根据索引:Name查询数据<br/>
    <input type="text" id="name1" placeholder="Name"><br/>
    <button id="getByName">Get ByName</button>
</p>
<div id="status3" name="status3"></div><br>

6.2 分析

分析：IndexedDB是一种灵活且功能强大的数据存储机制，它集合了Dom Storage和Web SQL Database的优点，用于存储大块或复杂结构的数据，提供更大的存储空间，使用起来也比较简单。可以作为Web SQL Database的替代。不太适合静态文件的缓存。

以key-value 的方式存取对象，可以是任何类型值或对象，包括二进制。
可以对对象任何属性生成索引，方便查询。
较大的存储空间，默认推荐250MB（分Host），比Dom Storage的5MB要大得多。
通过数据库的事务（tranction）机制进行数据操作，保证数据一致性。
异步的 API 调用，避免造成等待而影响体验。

七、File System API

HTML5新加入的存储机制
为 webApp提供了虚拟的文件系统，类似Native App访问本地系统一样

7.1 File System 的优势

满足大块的二进制文件存储
通过预加载资源文件提供性能
可以直接编辑文件

7.2 两种文件空间

临时型

由浏览器自动分配的，但可能被浏览器收回

持久性

需要显示的申请，申请时浏览器会给用户提示，让用户确定。浏览器不会收回（提供用户则不太友好），大小不够用需要再次申请。

7.3 分析

File System API给Web App带来了文件系统的功能，Native文件系统的功能在Web App中都有相应的实现。任何需要通过文件来管理数据，或通过文件系统进行数据管理的场景都比较适合。

八、参考文章

#003 HTML5缓存机制浅析
时间：2017-03-27 18:02:47 该文章为《HTML5缓存机制浅析：移动端Web加载性能优化》 ...
Android ListView 与 RecyclerView
Android ListView 与 RecyclerView 对比浅析：缓存机制【备注】只用于个人收藏
Android缓存浅析
Android缓存浅析 By吴思博 1、引言 2、常见的几种缓存算法 3、Android缓存的机制 4、LruCa...
复习
RecyclerView的缓存机制bitmap 优化性能优化view 的绘制流程浅析LRUCache原理（Andr...
Glide缓存机制浅析
前言由于最近项目加载图片这一块用到了Glide框架，以前也用到过，其最核心的部分应该是属于缓存的机制，最近花了点...
Glide缓存机制浅析
into调用链：来到Engine的load Glide的三级缓存：活动缓存：使用弱引用缓存图片，表正在使用的图...
浏览器缓存机制1
浏览器缓存机制之一（经典缓存）因为在接手的项目中用到过比较新的HTML5应用缓存，也用到了经典的缓存如设置max...
2021-01-27面试题
简述下html5的离线储存原理，同时说明如何使用？利用浏览的.appcache 缓存机制(不是技术),通过 ap...
基于Android 的Log机制
基于Android N的Log机制浅析上篇基于Android N的Log机制浅析下篇 android log...
Android cache缓存
Android 缓存机制 LruCache缓存机制分析