Day7-堆,栈,方法区和GC

作者: 我不是死胖子 | 来源:发表于2017-08-23 14:35 被阅读104次

Tips

只要类持有对外部实力对象的引用, 垃圾回收机制就不会回收该对象

JVM中

堆和栈对比

存什么

栈内存存储基本数据类型, 局部变量和方法调用和形参,栈分为java方法栈和native方法栈,

方法栈主要记录的是方法运行时的栈帧, 每执行一个方法就会添加一个栈帧 ,方法返回后, 栈被清空, 堆等待GC回收
为单个函数分配的那部分栈空间叫做栈帧(StackFrame)
正在使用的栈空间叫做调用栈(CallStack)
在内存中，栈是从高地址向低地址延伸的，即栈底对应高地址，栈顶对应低地址。

java线程是不是开两个栈存放不同的栈帧看具体JDK, 比如Oracle JDK和OpenJDK就是一个调用栈存放两种栈帧
堆内存存储Java中的全部对象,this

int a[] = new int[4];
new int[] 存放在堆, int a[] 存放在栈

Double a[] = new Double[10000000];
   Double qq = 3.1d;
   for (int i = 0; i < a.length; i++) {
       a[i] = qq.doubleValue();
   }

a[i] = qq.doubleValue;
a[i] = Double.valueOf(qq);
a[i] = new Double(qq.doubleValue);
所以此double类的值存在堆

独有/共享

栈内存归属于线程, 每个线程都会有一个栈内存, 其存储的变量只能在其所属的线程中可见, 栈内存可以理解成线程的私有内存, 所以叫线程栈
堆内存的对象, 对所有线程可见, 可以被所有线程访问

异常

栈没有空间存储方法调用和局部变量, JVM会抛出Java.lang.StackOverFlowError, 纯java代码无法泄漏栈空间, 它完全被JVM掌控
堆没有空间存储对象, JVM会抛出java.lang.OutOfMemoryError

空间大小

栈内存远小于堆内存, 栈可通过jvm参数 -XSS设置, 默认随着虚拟机和操作系统改变

执行效率

栈是存取效率灵活, 仅次于寄存器, 栈数据可以共享, 但栈中的数据大小和生命周期固定, 缺乏灵活性
堆是自动分配内存大小, 生存期不用告诉编译器, 等gc回收, 但是因为动态分配内存, 存储效率会比较慢

方法区

方法区存类信息, 静态方法, 常量, 即时编译器编译后的代码

GC(Garabage Collection)

指的是堆中数据的回收, 首先堆可以划分为新生代和老年代

新生代继续划分为 Eden 和 Survivor Space(幸存区), Survivor Space 再被划分成 From 和 To

新对象首先被创建在 Eden, (如果对象过大，如数组，则直接放入老年代). 在 GC 中, Eden 会被移入Survivor Space. 直到对象熬过一定的Minor GC的次数, 会被移到老年代, 老年代用Major GC来清理

空间占比:

新生代 : 老年代 = 1:2
Eden : From : To = 8:1:1

分代收集

新生代使用Minor GC, 老年代使用Major GC
Minor GC 和 Major GC 统称为 Full GC
所有的Minor GC 会触发全世界暂停 STW(stop-the-world), 停止应用程序的线程, 当然对于大多数应用，停顿的延迟可以忽略不计, 真相是大部分Eden区中的对象都能被认为是垃圾，所以不会存放到Survivor Space.
现在很多的GC机制都会清理永久代(静态方法区)

JVM并不强制要求GC实现哪种GC算法

纯java代码无法泄漏栈空间, 它完全被JVM掌控, 但如果有其他资源依附在java对象上, 如native memory(DirectByteBuffer), file(fileInputStream), 那么当然自己关闭最合适

虽然有finalizer, PhantomReference之类的让程序员向GC注册, 请求释放资源,但是GC运行时间不确定(因为是一条单独的线程), 还是自己释放的好

可达性检测

引用计数: 一种在jdk1.2之前被使用的垃圾收集算法，我们需要了解其思想。其主要思想就是维护一个counter，当counter为0的时候认为对象没有引用，可以被回收。缺点是无法处理循环引用。目前iOS开发中的一个常见技术ARC（Automatic Reference Counting）也是采用类似的思路。在当前的JVM中应该是没有被使用的。
根搜算法: gc root 根据引用关系来便利整个堆, 并标记, 这称之为Mark, 之后回收掉违背Mark的对象, 解决了「孤岛效应」, 这里的gc root 指的是：
- 虚拟机栈中引用的对象(栈帧中的本地变量表)
- 方法区中的类静态属性引用的对象
- 方法区中的常用变量的对象
- 本地方法栈中JNI 引用的对象

java减小GC开销 from

不要显示调用System.gc()
此函数只是建议JVM进行GC, 无法保证立马执行
减小临时对象的使用
对象不用时显示置为null
使用StringBuilder拼接字符串
String的扩增是新建对象, 多次 + 会多次创建新对象
能用基本类型就不用对象
少用静态
分散对象创建和删除的时间

整理策略

复制
主要在新生代的回收上, 通过from 和 to 区的来回拷贝.对于新生成的对象, 频繁的复制可以很快找到那些不用的对象.
标记清除和标记整理
主要在老生代的回收上, 通过根搜的标记清除或者处理掉不用的对象.
整理的过程

清除的过程

清除会产生碎片，对内存的利用不是很好, 但是不代表整理比清除好, 毕竟整理慢, 比如CMSGC就是使用清除而不是整理的

具体的垃圾收集器
- 新生代收集器：有Serial收集器、ParNew收集器、Parallel Scavenge收集器
- 老生代收集器：Serial Old收集器、Parallel Old收集器、CMS收集器、G1收集器

思考一下复制和标记清除/整理的区别，为什么新生代要用复制？因为对新生代来讲，一次垃圾收集要回收掉绝大部分对象，我们通过冗余空间的办法来加速整理过程（不冗余空间的整理操作要做swap，而冗余只需要做move）。同时可以记录下每个对象的『年龄』从而优化『晋升』操作使得中年对象不被错误放到老年代。而反过来老年代偏稳定，我们哪怕是用清除，也不会产生太多的碎片，并且整理的代价也并不会太大。

作者：纳达丶无忌
链接：http://www.jianshu.com/p/c9ac99b87d56
來源：简书
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

寄存器

在计算机领域，寄存器是CPU内部的元件，它是有限存贮容量的高速存贮部件，可用来暂存指令、数据和地址。
寄存器分为通用寄存器和特殊寄存器。通用寄存器有 ax/bx/cx/dx/di/si，在大多数指令中可以任意选用，但也有一些规定某些指令只能用某个特定的「通用」寄存器；特殊寄存器有 bp/sp/ip 等，特殊寄存器均有特定用途。

在 Stack Frame 中，涉及到三种重要的特殊寄存器：

bp ( base pointer ) 寄存器
sp ( stack poinger ) 寄存器
ip ( instruction pointer ) 寄存器

需要注意的是，不同架构的CPU，寄存器名称会添加不同的前缀来表示寄存器的大小。例如对于x86架构，字母「e」用作名称前缀，表示寄存器大小为32位；对于x86_64架构，字母「r」用作名称前缀，表示寄存器大小为64位。

举例

下图是linux 中一个进程的虚拟内存分布：
图中0号地址在最下边，越往上内存地址越大。
以32位地址操作系统为例，一个进程可拥有的虚拟内存地址范围为0-2^32。分为两部分，一部分留给kernel使用(kernel virtual memory)，剩下的是进程本身使用，即图中的process virtual memory。
普通Java 程序使用的就是process virtual memory.
上图中最顶端的一部分内存叫做user stack. 这就是题目问的 stack. 中间有个 runtime heap。就是题目中的heap. 他们的名字和数据结构里的stack 和 heap 几乎每啥关系。
注意在上图中，stack 是向下生长的; heap是向上生长的。
当程序进行函数调用时，每个函数都在stack上有一个 call frame。
比如对于以下程序，

public void foo(){
  //do something...
  println("haha"); // <<<=== 在这儿设置breakpoint 1
}

public void bar(){
  foo();
}

main(){
  bar();
  println("hahaha"); // <<<=== 在这儿设置 breakpoint 2
}

当程序运行到breakponit1时，user stack 里会有三个frame
|
| main 函数的 frame－－－－－－－－－－－－－－－－－－－
|
| bar 函数的 frame－－－－－－－－－－－－－－－－－－－<<<=== %ebp
|
| foo 函数的 frame－－－－－－－－－－－－－－－－－－－ <<<===%esp
其中 esp 和 ebp 都是寄存器。 esp 指向stack 的顶（因为stack 向下生长，esp会向下走）; ebp 指向当前frame的边界。
当程序继续执行到brekapoing 2的时候stack 大概是这样的:
|
－－－－－－－－－－－－－－－－－－－<<<=== %ebp
|
| main 函数的 frame－－－－－－－－－－－－－－－－－－－ <<<===%esp
也就是说当一个函数执行结束后，它对应的call frame就被销毁了。(其实就是esp 和 ebp分别以东，但是内存地址中的数据只有在下一次写的时候才被覆盖。)
说了这么多，终于该说什么东西放在stack 上什么东西放在heap 上了。
最直白的解释：

public void foo(){
  int i = 0; // <= i 的值存在stack上，foo()的call frame 里。
  Object obj = new Object(); // object 对象本身存在heap 里， foo()的call frame 里存该对象的地址。
}

图片引自CMU15-213的课件
https://www.cs.cmu.edu/~213/

作者：雷博
链接：https://www.zhihu.com/question/29833675/answer/45811216
来源：知乎
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

数据结构中

栈是先进后出的结构

参考

栈帧 Stack Frame

知乎 | Java虚拟机的堆、栈、堆栈如何去理解？以及RednaxelaFX回答下的几个链接

知乎| 为什么Java有GC还需要自己来关闭某些资源？

Java中的堆和栈的区别

简书 | JVM内存模型你只要看这一篇就够了

importnew | Minor GC、Major GC和Full GC之间的区别

掘金 | Java 垃圾回收手记

网友评论

本文标题：Day7-堆,栈,方法区和GC

本文链接：https://www.haomeiwen.com/subject/phiddxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！