一、垃圾回收简述
-
JS 是使用垃圾回收的语言,简单来说就是执行环境负责在代码执行时管理内存。基本思路很简单:确定哪个变量不会再使用,释放它占用的内存。这个过程是周期性的,每隔一段时间就会自动运行。
-
垃圾回收程序必须跟踪记录哪个变量还会使用、以及哪个变量不会再使用,以便回收内存。如果标记未使用的变量也许有不同的实现方式。不过在浏览器的发展史上、用过两种主要的标记策略:标记清理和引用计数。
二、标记清理
-
JS 中最常用的垃圾回收策略是标记清理。
-
垃圾回收程序运行的时候,会标记内存中存储的所有变量。然后它会将所有在上下文中的变量,以及被在上下文中的变量引用的变量的标记去掉。在此之后再被加上标记的变量就是待删除的了,原因是任何在上下文中的变量都访问不到它们了。
-
随后垃圾回收程序做一次内存清理,销毁带标记的所有值并收回它们的内存。
三、引用计数
-
JS 中没那么常用的垃圾回收策略是引用计数。
-
思路是对每个值都记录它被引用的次数。声明变量并赋予一个引用值时,这个值的引用数是 1。如果同一个值又被赋予另一个变量,那么引用数加 1。类似地,如果保存对该值引用的变量被其他值给覆盖了,那么引用值减 1。当这个值的引用数为 0 时,就说明没有办法再访问到这个值了,因此可以安全地收回其内存了。
-
引用计数最早有 Netscape Navigator3.0 采用,但很快就遇到了验证的问题:循环引用。所谓循环引用,就是对象 A 有一个指针指向对象 B,而对象 B 也引用了对象 A,比如:
function problem() {
let objectA = new Object();
let objectB = new Object();
objectA.someOtherObject = objectB;
objectB.anotherObject = objectA;
}
这个例子中,objectA 和 objectB 通过各自的属性相互引用,意味着它们的引用数都是 2。在标记清理的策略下,这不是问题,因为在函数结束后,这两个对象都不在作用域中。而在引用计数策略下 objectA 和 objectB 在函数结束后还会存在,因为它们的引用计数永远不会变成 0,如果函数被多次调用,则会导致大量内存永远不会被释放。为此,Netscape 在 4.0 版放弃了引用计数,转而采用标记清理。
- 在早起,并非所有对象都是原生的
javascript
对象。BOM
和DOM
中的对象都是 C++ 实现的组件对象模型(COM,Component Object Model)对象,而 COM 对象使用引用计数实现垃圾回收。因此,即使这些版本 IE 的javascript
引擎使用标记清理,但存取的 COM 对象依旧使用引用计数。下面例子展示了涉及 COM 对象的循环引用问题:
let element = document.getElementById("some_element");
let myObject = new Object();
myObject.element = element;
element.someObject = myObject;
这个例子在一个 DOM
对象(element)和 一个原生 javascript
对象(myObject)之间制造了循环引用。由于存在循环引用,因此 DOM
元素的内存永远不会被回收,即使它从页面删除了也是如此。
- 为避免类似的循环引用问题,应该在确保不使用的情况下切断原生
javascript
对象与DOM
元素之间的连接。比如以下代码可以清除前面的例子中建立的循环引用。
myObject.element = null;
element.someObject = null;
把变量设置为 null 实际上也会切断变量与其之前引用值的关系。当下次垃圾回收程序运行时,这些值就会被删除,内存也会被回收。
四、性能
垃圾回收程序会周期性运行,如果内存中分配了很多变量,则可能造成性能损失,因此垃圾回收的时间调度很重要。尤其是在内存有限的移动设备上,垃圾回收可能会明显拖慢渲染的速度和帧屏率。因此最好的办法是在写代码时就要做到:无论什么时候开始收集垃圾,都让它尽快结束工作。
五、内存管理
优化内存占用的最佳手段就是保证在执行代码时只保存必要的数据。如果数据不再必要,那么把它设置为 null
,从而释放其引用。这也可以叫作解除引用。这个建议最适合全局变量和全局对象的属性。局部变量在超出作用域会被自动解除引用。
function createPeroson(name) {
let localPerson = new object();
localPerson.name = name;
return localPerson ;
}
let globalPerson = new createPerson("name");
// 解除引用
globalPerson = null;
globalPerosn
是一个全局变量,应该在不再需要的时候手动解除其引用。不过要注意,解除对一个值的引用并不会自动导致相关内存被回收。解除引用的关键在于确保相关的值不在上下文里了,因此它在下次垃圾回收时会被回收。
- 使用
let
和const
声明提高性能,const
优先let
次之。 - 把不想要的属性设置为
null
。
六、内存泄漏
- 不合理的引用会导致内存泄漏的问题。
- 意外声明全局变量,将变量当做
window
的属性来创建,在window
对象上创建的属性,主要window
本身不被清理就不会消失。(在变量声明前加上var
、let
、const
关键字即可,执行完毕后会离开作用域)。 - 定时器的回调通过闭包引用外部变量也会导致内存泄漏。
let name = "Fn";
setInterval(() => {
console.log(name);
}, 100);
- 闭包也会不知不觉造成内存泄漏。调用
fn()
会导致分配给name
的内存被泄露。创建一个内部闭包,只要返回的函数存在就不能清理name
,因为闭包一直引用它,假设name
的内容很大,那就问题很大了。
const fn = function() {
let name = "hi";
return function() {
return name;
}
}
七、静态分配和对象池
为了提升 javascript
性能,最后要考虑的一点就是压榨浏览器了。关键问题就是如何减少浏览器执行垃圾回收的次数。我们无法直接控制什么时候开始收集垃圾,但可以间接控制触发垃圾回收的条件。理论上,如果能合理使用分配的内存,同时避免多余的垃圾回收,那就可以保住因释放内存而损失的性能。
-
浏览器决定何时运行垃圾回收程序的一个标准就是对象的更替速度。
-
很多对象初始化,然后一下子又超出了作用域,那么浏览器就会采用更激进的方式调度垃圾回收程序运行影响性能。
function addPerson(a, b) {
let p = new Person();
p.x = a.x + b.x;
p.y = b.x + b.y;
return p;
}
调用这个函数时,会在堆上创建一个新对象,然后修改它,最后再把它返回给调用者。这个矢量的 周期很短,那么它会很快失去所有对它的引用,成为可以被回收的值。假设这个矢量加法函数频繁被调用,那么垃圾回收程序会发现这里对象更替的速度很快,从而会更频繁地安排垃圾回收。
- 不要动态创建矢量对象,让他成为一个已有的矢量对象。
function addPerson(a, b, p) {
p.x = a.x + b.x;
p.y = a.y + b.y;
return p;
}
这需要在其他地方实例化矢量参数 p
,但这个函数的行为没有变。
- 一个策略是使用对象池,在初始化的某一时刻,可以创建对象池,用来管理一组可回收的对象。应用程序可以向这个对象池请求一个对象、设置其属性、使用它,然后在操作完成后再把它还给对象池,由于没发生对象初始化,垃圾回收探测就不会发现有对象更替,因此垃圾回收程序就不会那么频繁地运行。
// 已有的对象池
let p = new Person();
let p1 = p.allocate();
let p2 = p.allocate();
let p3 = p.allocate();
p1.x = 1;
p1.y = 2;
p2.x = 1;
p2.y = 2;
addPerson(p1, p2, p3);
p1 = null;
p2 = null;
p3 = null;
八、总结
- 离开作用域的值会被自动标记可回收,然后在垃圾回收期间被删除。
- 主流的垃圾回收算法是标记清理, 即先给当前不使用的值加上标记,再回来回收它们的内存。
- 引用计数是另一种的垃圾回收策略,需要记录值被引用了多少次。
- 引用计数在代码中存在循环引用会出现问题。
- 解除变量的引用不仅可以消除循环引用,而且对垃圾回收也有帮助。为促进内存回收,全局对象、全局对象的属性和循环引用都应该在不需要时解除引用。
网友评论