美文网首页
如何避免内存泄漏 - 2023-02-18

如何避免内存泄漏 - 2023-02-18

作者: 勇敢的小拽马 | 来源:发表于2023-02-17 13:21 被阅读0次

    V8引擎的内存限制

    虽然V8引擎帮助我们实现了自动的垃圾回收管理,解放了我们勤劳的双手,但V8引擎中的内存使用也并不是无限制的。具体来说,默认情况下,V8引擎在64位系统下最多只能使用约1.4GB的内存,在32位系统下最多只能使用约0.7GB的内存,在这样的限制下,必然会导致在node中无法直接操作大内存对象,比如将一个2GB大小的文件全部读入内存进行字符串分析处理,即使物理内存高达32GB也无法充分利用计算机的内存资源,那么为什么会有这种限制呢?这个要回到V8引擎的设计之初,起初只是作为浏览器端JavaScript的执行环境,在浏览器端我们其实很少会遇到使用大量内存的场景,因此也就没有必要将最大内存设置得过高。但这只是一方面,其实还有另外两个主要的原因:

    • JS单线程机制:作为浏览器的脚本语言,JS的主要用途是与用户交互以及操作DOM,那么这也决定了其作为单线程的本质,单线程意味着执行的代码必须按顺序执行,在同一时间只能处理一个任务。试想如果JS是多线程的,一个线程在删除DOM元素的同时,另一个线程对该元素进行修改操作,那么必然会导致复杂的同步问题。既然JS是单线程的,那么也就意味着在V8执行垃圾回收时,程序中的其他各种逻辑都要进入暂停等待阶段,直到垃圾回收结束后才会再次重新执行JS逻辑。因此,由于JS的单线程机制,垃圾回收的过程阻碍了主线程逻辑的执行。

    虽然JS是单线程的,但是为了能够充分利用操作系统的多核CPU计算能力,在HTML5中引入了新的Web Worker标准,其作用就是为JS创造多线程环境,允许主线程创建Worker线程,将一些任务分配给后者运行。在主线程运行的同时,Worker在后台运行,两者互不干扰。等到Worker线程完成计算任务,再把结果返回给主线程。这样的好处是, 一些计算密集型或高延迟的任务,被Worker线程负担,主线程(通常负责UI交互)就会很流畅,不会被阻塞或者拖慢。Web Worker不是JS的一部分,而是通过JS访问的浏览器特性,其虽然创造了一个多线程的执行环境,但是子线程完全受主线程控制,不能访问浏览器特定的API,例如操作DOM,因此这个新标准并没有改变JS单线程的本质。

    • 垃圾回收机制:垃圾回收本身也是一件非常耗时的操作,假设V8的堆内存为1.5G,那么V8做一次小的垃圾回收需要50ms以上,而做一次非增量式回收甚至需要1s以上,可见其耗时之久,而在这1s的时间内,浏览器一直处于等待的状态,同时会失去对用户的响应,如果有动画正在运行,也会造成动画卡顿掉帧的情况,严重影响应用程序的性能。因此如果内存使用过高,那么必然会导致垃圾回收的过程缓慢,也就会导致主线程的等待时间越长,浏览器也就越长时间得不到响应。

    基于以上两点,V8引擎为了减少对应用的性能造成的影响,采用了一种比较粗暴的手段,那就是直接限制堆内存的大小,毕竟在浏览器端一般也不会遇到需要操作几个G内存这样的场景。但是在node端,涉及到的I/O操作可能会比浏览器端更加复杂多样,因此更有可能出现内存溢出的情况。不过也没关系,V8为我们提供了可配置项来让我们手动地调整内存大小,但是需要在node初始化的时候进行配置,我们可以通过如下方式来手动设置。

    我们尝试在node命令行中输入以下命令:

    笔者本地安装的node版本为v10.14.2,可通过node -v查看本地node的版本号,不同版本可能会导致下面的命令会有所差异。

    // 该命令可以用来查看node中可用的V8引擎的选项及其含义
    node --v8-options
    

    然后我们会在命令行窗口中看到大量关于V8的选项,这里我们暂且只关注图中红色选框中的几个选项:

    image.png
    // 设置新生代内存中单个半空间的内存最小值,单位MB
    node --min-semi-space-size=1024 xxx.js
    
    // 设置新生代内存中单个半空间的内存最大值,单位MB
    node --max-semi-space-size=1024 xxx.js
    
    // 设置老生代内存最大值,单位MB
    node --max-old-space-size=2048 xxx.js
    

    通过以上方法便可以手动放宽V8引擎所使用的内存限制,同时node也为我们提供了process.memoryUsage()方法来让我们可以查看当前node进程所占用的实际内存大小。

    image.png

    在上图中,包含的几个字段的含义分别如下所示,单位均为字节:

    • heapTotal:表示V8当前申请到的堆内存总大小。
    • heapUsed:表示当前内存使用量。
    • external:表示V8内部的C++对象所占用的内存。
    • rss(resident set size):表示驻留集大小,是给这个node进程分配了多少物理内存,这些物理内存中包含堆,栈和代码片段。对象,闭包等存于堆内存,变量存于栈内存,实际的JavaScript源代码存于代码段内存。使用Worker线程时,rss将会是一个对整个进程有效的值,而其他字段则只针对当前线程。

    在JS中声明对象时,该对象的内存就分配在堆中,如果当前已申请的堆内存已经不够分配新的对象,则会继续申请堆内存直到堆的大小超过V8的限制为止。

    如何避免内存泄漏

    在我们写代码的过程中,基本上都不太会关注写出怎样的代码才能有效地避免内存泄漏,或者说浏览器和大部分的前端框架在底层已经帮助我们处理了常见的内存泄漏问题,但是我们还是有必要了解一下常见的几种避免内存泄漏的方式,毕竟在面试过程中也是经常考察的要点。

    尽可能少地创建全局变量

    在ES5中以var声明的方式在全局作用域中创建一个变量时,或者在函数作用域中不以任何声明的方式创建一个变量时,都会无形地挂载到window全局对象上,如下所示:

    var a = 1; // 等价于 window.a = 1;
    
    function foo() {
        a = 1;
    }
    // 等价于
    function foo() {
        window.a = 1;
    }
    

    我们在foo函数中创建了一个变量a但是忘记使用var来声明,此时会意想不到地创建一个全局变量并挂载到window对象上,另外还有一种比较隐蔽的方式来创建全局变量:

    function foo() {
        this.a = 1;
    }
    foo(); // 相当于 window.foo()
    

    复制代码当foo函数在调用时,它所指向的运行上下文环境为window全局对象,因此函数中的this指向的其实是window,也就无意创建了一个全局变量。当进行垃圾回收时,在标记阶段因为window对象可以作为根节点,在window上挂载的属性均可以被访问到,并将其标记为活动的从而常驻内存,因此也就不会被垃圾回收,只有在整个进程退出时全局作用域才会被销毁。如果你遇到需要必须使用全局变量的场景,那么请保证一定要在全局变量使用完毕后将其设置为null从而触发回收机制。

    手动清除定时器

    在我们的应用中经常会有使用setTimeout或者setInterval等定时器的场景,定时器本身是一个非常有用的功能,但是如果我们稍不注意,忘记在适当的时间手动清除定时器,那么很有可能就会导致内存泄漏,示例如下:

    const numbers = [];
    const foo = function() {
        for(let i = 0;i < 100000;i++) {
            numbers.push(i);
        }
    };
    window.setInterval(foo, 1000);
    

    在这个示例中,由于我们没有手动清除定时器,导致回调任务会不断地执行下去,回调中所引用的numbers变量也不会被垃圾回收,最终导致numbers数组长度无限递增,从而引发内存泄漏。

    少用闭包

    闭包是JS中的一个高级特性,巧妙地利用闭包可以帮助我们实现很多高级功能。一般来说,我们在查找变量时,在本地作用域中查找不到就会沿着作用域链从内向外单向查找,但是闭包的特性可以让我们在外部作用域访问内部作用域中的变量,示例如下:

    function foo() {
        let local = 123;
        return function() {
            return local;
        }
    }
    const bar = foo();
    console.log(bar()); // -> 123
    

    在这个示例中,foo函数执行完毕后会返回一个匿名函数,该函数内部引用了foo函数中的局部变量local,并且通过变量bar来引用这个匿名的函数定义,通过这种闭包的方式我们就可以在foo函数的外部作用域中访问到它的局部变量local。一般情况下,当foo函数执行完毕后,它的作用域会被销毁,但是由于存在变量引用其返回的匿名函数,导致作用域无法得到释放,也就导致local变量无法回收,只有当我们取消掉对匿名函数的引用才会进入垃圾回收阶段。

    清除DOM引用

    以往我们在操作DOM元素时,为了避免多次获取DOM元素,我们会将DOM元素存储在一个数据字典中,示例如下:

    const elements = {
        button: document.getElementById('button')
    };
    
    function removeButton() {
        document.body.removeChild(document.getElementById('button'));
    }
    

    复制代码在这个示例中,我们想调用removeButton方法来清除button元素,但是由于在elements字典中存在对button元素的引用,所以即使我们通过removeChild方法移除了button元素,它其实还是依旧存储在内存中无法得到释放,只有我们手动清除对button元素的引用才会被垃圾回收。

    弱引用

    通过前几个示例我们会发现如果我们一旦疏忽,就会容易地引发内存泄漏的问题,为此,在ES6中为我们新增了两个有效的数据结构WeakMapWeakSet,就是为了解决内存泄漏的问题而诞生的。其表示弱引用,它的键名所引用的对象均是弱引用弱引用是指垃圾回收的过程中不会将键名对该对象的引用考虑进去,只要所引用的对象没有其他的引用了,垃圾回收机制就会释放该对象所占用的内存。这也就意味着我们不需要关心WeakMap中键名对其他对象的引用,也不需要手动地进行引用清除,我们尝试在node中演示一下过程(参考阮一峰ES6标准入门中的示例,自己手动实现了一遍)。

    首先打开node命令行,输入以下命令:

    node --expose-gc // --expose-gc 表示允许手动执行垃圾回收机制
    

    然后我们执行下面的代码。

    // 手动执行一次垃圾回收保证内存数据准确
    > global.gc();
    undefined
    
    // 查看当前占用的内存,主要关心heapUsed字段,大小约为4.4MB
    > process.memoryUsage();
    { rss: 21626880,
      heapTotal: 7585792,
      heapUsed: 4708440,
      external: 8710 }
    
    // 创建一个WeakMap
    > let wm = new WeakMap();
    undefined
    
    // 创建一个数组并赋值给变量key
    > let key = new Array(1000000);
    undefined
    
    // 将WeakMap的键名指向该数组
    // 此时该数组存在两个引用,一个是key,一个是WeakMap的键名
    // 注意WeakMap是弱引用
    > wm.set(key, 1);
    WeakMap { [items unknown] }
    
    // 手动执行一次垃圾回收
    > global.gc();
    undefined
    
    // 再次查看内存占用大小,heapUsed已经增加到约12MB
    > process.memoryUsage();
    { rss: 30232576,
      heapTotal: 17694720,
      heapUsed: 13068464,
      external: 8688 }
    
    // 手动清除变量key对数组的引用
    // 注意这里并没有清除WeakMap中键名对数组的引用
    > key = null;
    null
    
    // 再次执行垃圾回收
    > global.gc()
    undefined
    
    // 查看内存占用大小,发现heapUsed已经回到了之前的大小(这里约为4.8M,原来为4.4M,稍微有些浮动)
    > process.memoryUsage();
    { rss: 22110208,
      heapTotal: 9158656,
      heapUsed: 5089752,
      external: 8698 }
    

    在上述示例中,我们发现虽然我们没有手动清除WeakMap中的键名对数组的引用,但是内存依旧已经回到原始的大小,说明该数组已经被回收,那么这个也就是弱引用的具体含义了。

    相关文章

      网友评论

          本文标题:如何避免内存泄漏 - 2023-02-18

          本文链接:https://www.haomeiwen.com/subject/ddgmkdtx.html