浏览器~加载,解析,渲染

作者: Miss____Du | 来源:发表于2014-11-06 22:58 被阅读21825次

    昨天为了 了解浏览器是怎么处理(.html、.css、.js)这些文件,我看了网上的好多资料,这好多资料中,有很多是通过转载、或是转载后加之自己的理解,但是因为自己对专业的词汇理解不好,还有一些作者将不同浏览器的处理过程混着说,总之,看完了,还是有很多疑虑的地方。我先根据昨天了解到的内容总结一下,日后随着学的深了,再回过来补充。2014.11.6


    why

    为什么要了解浏览器加载、解析、渲染这个过程?
    • 了解浏览器如何进行加载,我们可以在引用外部样式文件,外部js时,将他们放到合适的位置,使浏览器以最快的速度将文件加载完毕。
    • 了解浏览器如何进行解析,我们可以在构建DOM结构,组织css选择器时,选择最优的写法,提高浏览器的解析速率。
    • 了解浏览器如何进行渲染,明白渲染的过程,我们在设置元素属性,编写js文件时,可以减少”重绘“”重新布局“的消耗。
      这三个过程在实际进行的时候又不是完全独立,而是会有交叉。会造成一边加载,一边解析,一边渲染的工作现象。

    how

    浏览器是如何进行加载、解析、渲染的呢?

    1. 用户访问网页,DNS服务器(域名解析系统)会根据用户提供的域名查找对应的IP地址,找到后,系统会向对应IP地址的网络服务器发送一个http请求。
    2. 网络服务器解析请求,并发送请求给数据库服务器。
    3. 数据库服务器将请求的资源返回给网络服务器,网络服务器解析数据,并生成html文件,放入http response中,返回给浏览器。
    4. 浏览器解析 http response。
      1~4步骤需要了解HTTP协议。
      访问服务器端可能遭遇的问题:如果网络服务器无法获取数据库服务器返回的资源文件(http response 404),或者由于并发原因暂时无法处理用户的http请求(http response 500)
    5. 浏览器解析 http response后,需要下载html文件,以及html文件内包含的外部引用文件,及文件内涉及的图片或者多媒体文件。
    以下的内容相对比较复杂 O(∩_∩)O~

    关于加载顺序:当浏览器获得一个html文件时,会”自上而下“加载,并在加载过程中进行解析渲染。

    加载

    即为获取资源文件的过程,不同浏览器,以及他们的不同版本在实现这一过程时,会有不同的实现效果(资源间互相阻塞),。(需要学习使用timeline来做测试,我还不太会用,学会了在上文。)

    <!DOCTYPE html>
    <html>
         <head>
               <meta charset="utf-8">
               <link rel="stylesheet"  href="test.css"  type="text/css" />
               <script src="test.js" type="text/javascript"></script>
         </head>
         <body>    
               <p>阻塞</p>
               <img src="test.jpg" /> 
         </body>
    </html>
    

    加载过程中遇到外部css文件,浏览器另外发出一个请求,来获取css文件。
    遇到图片资源,浏览器也会另外发出一个请求,来获取图片资源。这是异步请求,并不会影响html文档进行加载,但是当文档加载过程中遇到js文件,html文档会挂起渲染(加载解析渲染同步)的线程,不仅要等待文档中js文件加载完毕,还要等待解析执行完毕,才可以恢复html文档的渲染线程。

    原因:JS有可能会修改DOM,最为经典的document.write,这意味着,在JS执行完成前,后续所有资源的下载可能是没有必要的,这是js阻塞后续资源下载的根本原因。
    办法:可以将外部引用的js文件放在</body>前。

    虽然css文件的加载不影响js文件的加载,但是却影响js文件的执行,即使js文件内只有一行代码,也会造成阻塞。

    原因:可能会有 var width = $('#id').width(),这意味着,js代码执行前,浏览器必须保证css文件已下载和解析完成。这也是css阻塞后续js的根本原因。
    办法:当js文件不需要依赖css文件时,可以将js文件放在头部css的前面。

    当然除了,<link href="" />这种形式,内部<style></style>这种样式定义,在考虑阻塞时也要考虑。
    以上对于代码布局对文档加载的影响是比较基础的,随着浏览器的升级,以及js技术的应用,html的发展,web性能也会逐渐提高。
    列举一下,以后可以逐一扩充一下:

    • 不要在外部调用的js文件中调用运行时间较长的函数,如果一定要用,可以使用setTimeout函数。

    为什么呢?

    1. 浏览器GUI渲染线程
    2. javascript引擎线程
    3. 浏览器定时器触发线程(setTimeout)
    4. 浏览器事件触发线程
    5. 浏览器http异步请求线程(.jpg <link />这类请求)
      原因:浏览器有以上五个常驻线程
      发现第3个线程,我们便知道,如果在js内使用setTimeout()那么会调用另一个线程。
      注意:这里也涉及到 阻塞 的现象,当js引擎线程(第二个)进行时,会挂起其他一切线程,这个时候3、4、5这三类线线程也会产生不同的异步事件(这句话不懂啊),由于 javascript引擎线程为单线程,所以代码都是先压到队列,采用先进先出的方式运行,事件处理函数,timer函数也会压在队列中,不断的从队头取出事件,这就叫:javascript-event-loop。
    • 现代浏览器存在 prefetch 优化,浏览器会另外开启线程,提前下载js、css文件,需要注意的是,预加载js并不会改变dom结构,他将这个工作留给主加载。
    • 预加载网页,利用空余时间来提前加载该网页的后续网页。
      <link rel="prefetch" href="http://">
    • 为js脚本添加defer属性,使得浏览器不等js脚本加载执行完,就加载后面的图片。既然图片资源都已经加载出来了,就不要在js内写document.write啦。
      <script defer="true" src="JavaScript.js" type="text/javascript"/>

    解析

    解析的概念有些多,需要另写一篇文章。于是我就先简单的写一下。

    • html文档解析生成解析树即dom树,是由dom元素及属性节点组成,树的根是document对象。

    DOM:文档对象模型的缩写,是html文档的对象表示,作为html的外部接口供js调用。

    document.getElementById('test').style.display="none";//通过dom接口将id为test的display值设为none。
    
    • css解析将css文件解析为样式表对象。该对象包含css规则,该规则包含选择器和声明对象。
    css解析.png
    • js解析因为文件在加载的同时也进行解析,详看js加载部分。

    渲染

    即为构建渲染树的过程,他是原来DOM树的可视化表示,构建这棵树是为了以正确的顺序绘制文档内容。
    渲染树和DOM树的关系,不可见的dom元素(<head>…</head> display=none)不会被插入渲染树中。还有像一些节点的位置为绝对或浮动定位(需要css知识理解),这些节点会在文本流之外,因此会在两棵树上的不同位置,渲染树标识出真实的位置,并用一个占位结构标识出他们原来的位置。

    渲染最大的一个困难就是为每一个dom节点计算符合他的最终样式。
    • 为每一个元素查找到匹配的样式规则,需要遍历整个规则表。关于遍历规则表的方法,我之前理解错啦。
      #test p{ color:#999999}
      正解:遍历是自右向左,也就是先查询到p元素,再找到上一级id为test的元素。之前的理解正好相反。这样发现,遍历的效率好低。
      为什么:可以去看之前css解析时,生成的样式对象,遍历的顺序,自然是从树的低端向上遍历。

    计算样式的一些困难:

    1. 样式数据是非常大的结构,保存这样是的数据是很耗内存的。
    1. 选择器迭代太深,造成太多的无用遍历。
    2. 样式规则涉及非常复杂的级联,定义了规则的层次(理解:<head>里引用的外部样式表,会被局部样式表中同一属性的设置取代。还有例如body内对font的设置本来会应用于孩子元素,但是如果body的孩子元素定义font属性,则会被后者取代)。

    解决办法:共享样式数据。(元素可以共享样式数据的条件就是他们的状态是”一致“的。)

    webkit渲染

    计算样式并生成渲染对象的过程为attachment,每个dom节点有一个attach方法,attachment的过程是同步的,调用新节点的attach方法插入到dom树中。
    parser:解析, Render Tree:渲染树 Layout:安排布局

    webkit主流程.png
    渲染过程中,webkit使用一个标志位标志所有顶层样式都已经被加载完毕,如果dom元素进行attach时,css元素并没有被加载完毕,则放置占位符,并在文档中标记,当样式表加载完毕,则重新进行计算。
    说明,文档的渲染还是要等待顶层css加载完毕。接下来的gecko应该也是需要等待顶层css加载完毕,否则“css规则树”(见下文)无法建立啊

    Gecko渲染

    webkit渲染是一个元素与样式规则匹配的过程,Gecko则需要构建样式计算规则书,然后与dom树对应生成样式上下文数(及渲染树)。例子:

    <html>
         <body>
              <div class=”err” id=”div1″>
                   <p>
                        this is      a <span class=”big”> big error    </span>
                        this is also a <span class=”big”> very big error</span>
                   </p>
              </div>
              <div class=”err” id=”div2″>
                    another error
              </div>
         </body>
    </html>
    
    //规则
     1. div {margin:5px;color:black}
     2. .err {color:red}
     3. .big {margin-top:3px}
     4. div span {margin-bottom:4px}
     5. #div1 {color:blue}
     6. #div2 {color:green}
    
    样式规则树.png

    解释一下:A:任意一个父级元素。B、E:代表元素选择器,B指div,E指div下的span。C、G:代表类选择器。D、F:代表:id选择器。后面的123456,代表匹配的规则。

    样式上下文树.png

    解释一下:当遇到一个dom节点,例如:第二个div,根据css解析结果,进行规则匹配发现符合126这条规则线,我们发现,当遇到第一个div时已经匹配过12这条规则线,所以只需为规则6新增一个节点至样式上下文树的div:F节点。样式上下文树,是元素匹配样式的最终结果(原本是比例的也要换算成具体的px)。*** Gecko利用样式规则树,有效的实现了样式共享。Webkit没有规则树,则需要对css解析结果进行多次遍历。出现多次的属性将会被按照正确的级联顺序进行处理最后一个生效。***

    根据对计算样式困难的理解,我们在编写css样式表时应该注意一下:

    1. dom深度尽量浅。
    2. 减少inline javascript、css的数量。
    3. 使用现代合法的css属性。
    4. 不要为id选择器指定类名或是标签,因为id可以唯一确定一个元素。
    5. 不要给类选择器指定标签,类,代表具有一类属性的标签,不仅是一个,虽然可以实现,但是降低了效率。
    6. 避免后代选择符,尽量使用子选择符。原因:子元素匹配符的概率要大于后代元素匹配符。后代选择符;#tp p{} 子选择符:#tp>p{}
    7. 避免使用通配符,举一个例子,.mod .hd *{font-size:14px;} 根据匹配顺序,将首先匹配通配符,也就是说先匹配出通配符,然后匹配.hd(就是要对dom树上的所有节点进行遍历他的父级元素),然后匹配.mod,这样的性能耗费可想而知.

    参考文章:
    浏览器加载和渲染html顺序
    JS 和 CSS 的位置对其他资源加载顺序的影响

    欢迎补充与指正☺

    相关文章

      网友评论

      • zxqian1991:讲的很详细,很易理解,赞
      • e9493e641d72:《浏览器~加载,解析,渲染 - 简书》写的不错不错,收藏了。

        推荐下,分布式作业中间件 Elastic-Job 源码解析 16 篇:http://tinyurl.com/y93r9wfg


        8afe04d66ee7:写的蛮用心的,希望多多坚持那
      • haileym:感觉这类东西比较抽象,理解不了 @Miss____Du
      • 路漫漫在狂奔:喜欢这种带入自己理解与思考的文章
      • d9be21c768e1:提个问题,一个html文档是最先加载完毕的。然后解析的时候,解析一部分dom,构建一部分dom树,渲染一部分。是这样的过程吗?
        Miss____Du:http://www.jianshu.com/p/18893ab32fa7
      • BigLeGor:拜读了
      • Miss____Du:http://www.jianshu.com/p/18893ab32fa7
        新增与这个有关的笔记 ,建议看完这篇笔记的同学 ,继续看
      • 95f704fdc081: :smile: 既然提到JS顺便提一下,由于自上而下的渲染模式以及JS单线程的执行方式,所以引入外部JS的时候,若存在依赖关系,独立的那个要放在前面先加载,也就是说引入顺序是有讲究的,不然会出BUG
        Miss____Du:http://www.jianshu.com/p/18893ab32fa7
      • Miss____Du:@风吹云动 谢谢!谢谢!我看过之后,一定得再补充一下我当时的理解,么么哒
      • Miss____Du: @wenjoy 嗯嗯,是这样的,但是这种情况如果这个类下只有span特殊,不如直接为span赋予id值,其他元素共享类。要么又要为了span去遍历一遍,这样效率会高一点。我应该把“不要”,改成“尽量”。 :flushed: 肿么样?
      • wenjoy:5.不要给类选择器指定标签,类,代表具有一类属性的标签,不仅是一个,虽然可以实现,但是降低了效率。
        这条存疑。比如span.abs li.abs,共享一个类名,如果只要选择其中的span,那必须得为类指定标签。
      • Miss____Du:@看不清的魂 刚刚开始学习前端,多多指教哦

      本文标题:浏览器~加载,解析,渲染

      本文链接:https://www.haomeiwen.com/subject/jfdbtttx.html