什么是垃圾?
没有被引用的可能是垃圾,而如果三个对象在一起互相引用形成一个环(孤岛)则他们也是垃圾。
不再需要——即为垃圾
全局变量在任何时候都可能被用到,所以不能被当作垃圾回收。
局部变量在函数退出后就变成了垃圾。
垃圾回收算法
推荐阅读
可以将这个过程想象成从根溢出一个巨大的油漆桶,它从一个根节点出发将可到达的对象标记染色, 然后移除未标记的。
第一步:标记空间中的可达值
V8 采用的是可达性 (reachability) 算法来判断堆中的对象应不应该被回收。
思路:从根节点(Root)出发,遍历所有的对象。可以遍历到的对象,是可达的(reachable),没有被遍历到的对象,不可达的(unreachable)。
在浏览器环境下,根节点有很多,主要包括:
- 全局变量window,位于每个iframe中
- 文档DOM树
- 存放在栈上的变量
这些根节点不是垃圾,不可能被回收。
第二步:回收不可达值所占据的内存
在所有标记完成之后,统一清理内存中所有不可达的对象。
第三步:内存整理
当频繁回收对象后,内存中就会存在大量不连续空间,专业名词叫“内存碎片”。
当内存中出现大量内存碎片,如果需要连续分配较大内存时,就可能出现内存不足的情况。
标记-清除算法(Mark-Swap)
从全局作用域开始把所有遇到的变量都标记一下,然后这些被标记的变量如果引用了其他变量就继续标记,直到找不到新的对象这个标记过程就结束了。
然后就开始清除,把所有没标记的对象都删掉。
优点:实现简单,容易和其他算法组合。
缺点:标记的过程中会中断JS执行。(如果需要标记的对象太多会中断很长时间)。
引用计数算法(Reference Counting)
引用计数,就是记录每个对象被引用的次数,每次新建对象、赋值引用和删除引用的同时更新计数器,如果计数器值为0则直接回收内存。
优点:暂停时间短、可以即刻回收垃圾,没有必要沿指针查找(不需要像标记清除算法一样沿着根集合开始查找)
缺点:计数器的增减处理繁重、计数器需要占用很多位、实现繁琐复杂、每个赋值操作都得替换成引用更新操作、循环引用无法回收
什么时候垃圾回收
浏览器进行垃圾回收的时候,会暂停 JavaScript 脚本,等垃圾回收完毕再继续执行。
对于普通应用这样没什么问题,但对于 JS 游戏、动画对连贯性要求比较高的应用,如果暂停时间很长就会造成页面卡顿。
浏览器将数据分为两种,一种是「临时」对象,一种是「长久」对象。
临时对象:
大部分对象在内存中存活的时间很短;
比如函数内部声明的变量,或者块级作用域中的变量。当函数或者代码块执行结束时,作用域中定义的变量就会被销毁;
这类对象很快就变得不可访问,应该快点回收。
长久对象:
生命周期很长的对象,比如全局的 window、DOM、Web API 等等;
这类对象可以慢点回收。
这两种对象对应不同的回收策略,所以,V8 把堆分为新生代和老生代两个区域, 新生代中存放临时对象,老生代中存放持久对象。
并且让副垃圾回收器、主垃圾回收器,分别负责新生代、老生代的垃圾回收。
主垃圾回收器
负责老生代的垃圾回收,有两个特点:对象占用空间大;对象存活时间长。
它使用「标记-清除」的算法执行垃圾回收。
首先是标记。从一组根元素开始,递归遍历这组根元素;
在这个遍历过程中,能到达的元素称为活动对象,没有到达的元素就可以判断为垃圾数据。然后是垃圾清除。直接将标记为垃圾的数据清理掉。多次标记-清除后,会产生大量不连续的内存碎片,需要进行内存整理。
副垃圾回收器
负责新生代的垃圾回收,通常只支持 1~8 M 的容量。新生代被分为两个区域:一般是对象区域,一半是空闲区域。
新加入的对象都被放入对象区域,等对象区域快满的时候,会执行一次垃圾清理。先给对象区域所有垃圾做标记;标记完成后,存活的对象被复制到空闲区域,并且将他们有序的排列一遍;
副垃圾回收器没有碎片整理。因为空闲区域里此时是有序的,没有碎片,也就不需要整理了
复制完成后,对象区域会和空闲区域进行对调。将空闲区域中存活的对象放入对象区域里。这样,就完成了垃圾回收。因为副垃圾回收器操作比较频繁,所以为了执行效率,一般新生区的空间会被设置得比较小。一旦检测到空间装满了,就执行垃圾回收。
一句话总结分代回收就是:将堆分为新生代与老生代,多回收新生代,少回收老生代。这样就减少了每次需遍历的对象,从而减少每次垃圾回收的耗时。
增量收集
如果脚本中有许多对象,引擎一次性遍历整个对象,会造成一个长时间暂停。所以引擎将垃圾收集工作分成更小的块,每次处理一部分,多次处理。
这样就解决了长时间停顿的问题。
闲时收集
垃圾收集器只会在 CPU 空闲时尝试运行,以减少可能对代码执行的影响。
网友评论