美文网首页我的Python自学之路Python 运维
进程的内存结构及Python的GC机制

进程的内存结构及Python的GC机制

作者: 阿铮OnMyWay | 来源:发表于2017-03-16 16:04 被阅读470次
进程空间

进程运行时需要在内核中占据一段内存空间,用以存储程序和数据。

每个进程空间分布如下所示:

进程空间的结构
  • text段:
    代码段(code segment/text segment)通常是指用来存放程序执行代码的一块内存区域。在代码段中,也有可能包含一些只读的常数变量,例如字符串常量等。

  • data段:
    数据段(data segment)通常用来存放程序中已初始化的全局变量数据段属于静态内存分配。

  • bss段:
    bss(Block Started by Symbol) 通常用来存放程序中未初始化的全局变量。bss段属于静态内存分配。

  • 堆(heap):
    堆用于存放动态变量,它的大小并不固定,可动态扩张或缩减。
    主要由程序员手工分配:
      当进程调用malloc等函数分配内存时,新分配的内存就被动态添加到堆上;
      当利用free等函数释放内存时,被释放的内存从堆中被剔除。

  • 栈(stack):
    存储局部、临时变量,函数调用时,存储函数的返回指针,用于控制函数的调用和返回,在程序块开始时自动分配内存,结束时自动释放内存,主要由编译器自动管理。
      在函数被调用时,其参数会被压入发起调用的进程栈中,并且待到调用结束后,函数的返回值也会被存放回栈中。

注:堆和栈的区别参见末尾附图1.

可能产生的问题

内存泄漏
当程序中使用malloc的时候,堆(heap)会向上增长,其增长的部分就成为malloc从内存中分配的空间。malloc开辟的空间会一直存在,直到程序员手工用free系统调用来释放,或者进程结束。

内存泄漏(memory leakage), 就是指我们没有释放不再使用的堆空间,导致堆不断增长,而内存可用空间不断减少。

栈溢出
栈和堆的大小则会随着进程的运行增大或者变小。当栈和堆增长到两者相遇时候,也就是内存空间图中stack和heap之间的可用内存区域完全耗尽时,进程会出现栈溢出(stack overflow)的错误,导致进程终止。

垃圾回收机制(Garbage-Collection)

由上文可知,进程的内存管理是十分重要的,内存需要被合理分配使得进程能够正常运行,避免出现内存泄漏、栈溢出等异常情况。

内存空间是有限的,不能一味地分配内存,需要有人负责回收分配出去的内存空间,如果交由程序员手动进行内存管理,程序员就比较累,没法完全专注于业务逻辑的实现,影响开发效率,而且手动管理内存是纯技术活,人工错误很常见,这就有了垃圾回收机制(Garbage-Collection),程序员只要专注于业务逻辑的实现,尽管用内存,不必关心内存的回收。

垃圾回收机制(Garbage-Collection)的职能:

识别那些垃圾对象,从垃圾对象那回收内存。并分配给新生成的对象使用。

历史上几种经典的GC算法:标记-清除算法引用计数法

python采用的是引用计数机制为主,标记-清除分代回收两种机制为辅的策略

引用计数机制

优点:简单且具备实时性:一旦一个对象的引用计数归零,内存就直接释放了。不用像其他机制等到特定时机。实时性还带来一个好处:处理回收内存的时间分摊到了平时。

缺点:维护引用计数消耗资源,无法回收循环引用对象。

频繁的垃圾回收会降低程序执行效率,Python只会在特定条件下,自动启动垃圾回收。Python解释器保持对新创建的对象,以及因为引用计数为零而被释放掉的对象的追踪,当被分配对象的计数值与被释放对象的计数值之达到某一阈值时便启动垃圾回收机制。

Python也采用了分代回收的策略。基于“存活时间越久的对象越不容易成为垃圾。”这一假说,若某一对象在经历多次垃圾回收后依然健在,则提升该对象的等级。对象等级一共分0,1,2三代,每次垃圾回收从0代开始,经过一定次数对0代对象的垃圾回收后,便启动对0代和1代对象的垃圾回收,1代对象经过一定次数的的垃圾回收,便启动对0代1代2代即所有对象的垃圾回收。

查看方法

import gc 
gc.set_threshold(700, 10, 5)

返回(700, 10, 10),后面的两个10是与分代回收相关的阈值,后面可以看到。700即是垃圾回收启动的阈值。

若要手动启动垃圾回收,使用gc.collect()。


附图1


栈和堆的对比
参考资料:

[转载]Python垃圾回收机制--完美讲解! - 简书
http://www.jianshu.com/p/1e375fb40506
Python深入06 Python的内存管理 - Vamei - 博客园
http://www.cnblogs.com/vamei/p/3232088.html
为什么Python要使用有明显缺陷的引用计数而不是像JavaScript一样的标记清除? - 编程 - 知乎
https://www.zhihu.com/question/33529443?sort=created

相关文章

  • 进程的内存结构及Python的GC机制

    进程空间 进程运行时需要在内核中占据一段内存空间,用以存储程序和数据。 每个进程空间分布如下所示: text段:代...

  • JVM的内存结构及GC机制

    JVM内存管理 根据JVM规范,JVM把内存划分成了如下几个区域: 方法区(Method Area) 堆区(Hea...

  • JVM内存结构

    以下信息摘录自:深入理解JVM的内存结构及GC机制 JVM内存管理 根据JVM规范,JVM把内存区域划分成了以下几...

  • Python的垃圾回收机制,可变类型,不可变类型

    Python的垃圾回收机制 什么是GC(垃圾回收机制),出现的原因 GC:说白了就是内存自动管理机制.它的出现的原...

  • Java基础 (14) 垃圾回收

    1)GC算法(各种算法的优缺点以及应用场景)2)内存对象的循环引用及避免3)内存回收机制、GC回收策略、GC原理时...

  • 浅谈 JVM 内存结构及 GC 机制

    前言 JAVA GC(Garbage Collection,垃圾回收)机制是区别C++的一个重要特征,C++需要开...

  • Python C扩展的引用计数问题探讨

    简介: Python GC机制 对于Python这种高级语言来说,开发者不需要自己管理和维护内存。Python采用...

  • Dart

    Dart线程模型及异常捕获 Flutter 实战 Dart的内存回收机制 Dart GC

  • JVM

    简介 Jvm 系列一:Java类的加载机制Jvm系列二:JVM内存结构 --内存泄漏与内存溢出Jvm系列三:GC算...

  • 2018-03-09 GC垃圾回收机制学习日记一

    看到Java中的GC垃圾回收机制,必定离不开Java JVM中的内存模型及Java对象的生命周期,学习GC机制前我...

网友评论

    本文标题:进程的内存结构及Python的GC机制

    本文链接:https://www.haomeiwen.com/subject/kkqjnttx.html