当我们提到JVM的时候,前提是我们知道啥是JVM,谈这事的基础,至少知道它是java 虚拟机。此时至少要知道什么是虚拟机,如果听说过VM ware的话,需要知道这个VM是Virtual Machine的简称,这样就知道了JVM 是全称是Java Virtual Machine。
那虚拟机是干啥的呢,用Java编写的程序,计算机是没法识别出来的,它根本就不懂这门语言,那么怎么办?就要有角色给它翻译翻译,这个角色就是JVM,但是我们编写的.java文件JVM也没法直接识别,所以,需要把java程序编程成.class文件,JVM才能识别这个程序并且运行它。JVM的好处体现在,无论我们使用的是什么操作系统,只要有JVM环境存在,就可以运行java程序。
1.生命周期
讨论JVM生命周期的目的是,我们需要知道它是怎么来的,也需要知道它是怎么没的。
简单的是:JVM随着程序的运行启动,程序的结束而停止。
这里分为两个线程,守护线程和普通线程。
守护线程体现在GC(垃圾回收),这个后面再说。守护线程是JVM自己的。普通的线程是运行的程序的。
2.JVM内存模型
这个比较基础的是,大家都知道有:程序计数器、方法区、堆、虚拟机栈、本地方法栈、局部变量表、运行时常量池。
其中具体在我这篇文章里有体现:JVM运行时数据区域
3.JVM类加载
了解前面两点,就可以开始谈论jvm类加载过程了。
刚刚也说了,代码编译后,会生成二进制字节流文件(*.class)。
JVM把Class文件中的类描述数据加载到内存,并对数据进行校验、准备、解析、初始化,使这些数据最终成为可以被JVM直接使用的Java类型,这就叫做JVM的类加载机制。是不是并不复杂?
不过里面有一些名词没有解释清楚。让我们一起康康!!(震声)
类加载过程
ok,我们逐步来说。
a.首先是加载
这是类加载过程的第一个阶段,JVM在这个阶段完成了三件事:
1.通过类的全限定名,获取class文件。
2.把class文件代表的静态存储结构转化为运行时数据结构,放在方法区。
3.在内存生成Class对象,代表这个类,作为方法区里这个类的访问入口,这个Class对象虽然是对象,但是存在方法区中,而不是堆。
b.连接
连接分为三个小步骤:检验、准备、编译。
1.验证:被加载的类结构是否正确,保障安全性。
2.准备:给类的静态变量分配内存(在方法区),并赋值,这个是默认初始值。
3.解析:类的常量池内的符号引用替换为直接引用。符号引用就是一组符号来描述目标,可以是任何字面量;直接引用就是直接指向目标的指针、相对偏移量或一个间接定位到目标的句柄。
c.初始化
初始化是给静态变量设置正确的初始值。这里和前面准备过程进行区分,因为准备过程只是赋默认初始值,这里才是设置正确的值。
值得注意的是以下情况,必须对类进行初始化:
1.new 字节码创建类的实例,或者调用静态方法的时候,或者get static、put static读取或设置静态字段的时候。
2.反射调用的时候。
3.初始化一个类,如果其父类米有初始化,先触发父类初始化。
4.虚拟机启动时,指定的主类,比如包含main方法的类,虚拟机会初始化这个类。
5.使用jdk1.7的动态语言支持时,如果一个java.lang.invoke.MethodHandle实例最后的解析结果REF_getStatic、REF_putStatic、RE_invokeStatic的方法句柄,并且这个方法句柄对应的类没有进行初始化,则需要先触发其初始化。(这个之前我还真不知道~)
以上这几种情况,被称作“主动引用”。
4.GC 垃圾回收
这里简单说一下前面提到的垃圾回收机制。当然和JVM类加载关系倒是没特别特别大。
有一篇我记录的文章也谈论过这个,详细的可以看这个:JVM垃圾收集器与内存分配策略
先说哪些区域需要垃圾回收??为啥要回收内存??
垃圾回收主要集中在堆和方法区,这两个区域内存分配和回收是动态的。回收内存的意义在于空间是有限的,就算内存特别大,也会有上限。
大家应该也知道垃圾回收的两种算法,一个是引用计数,一个是可达性分析。引用计数算法由于存在两个对象相互引用的可能性,并没有在java中使用。
可达性分析算法,基本思想是通过GC Root的对象作为起点,然后开始向下搜索。走过的路径称为引用链,当一个对象到GC Root没有引用链的话,此对象可以被回收了。
GC Root对象的选取条件包括:
1.栈(局部变量表)中引用的对象
2.方法区类静态属性引用的对象
3.方法区常量引用对象
4.本地方法栈中JNI引用的对象
引用状态也分为四种:强引用、软引用、弱引用、虚引用
强引用不参与垃圾回收,软引用在内存溢出前回收,弱引用垃圾回收的时候直接收走,虚引用也收走,回收时收到一个系统通知。
要知道的是,不可达的对象被标记一次之后还能再抢救一下,如果被标记两次就直接GG了。具体是finalize方法,如果对象覆盖这个方法,被标记一下之后会被放入小黑屋——F-Queue,如果对象在finalize方法里面成功自救,关联上GC Root,那他就不会被马上回收,否则直接被干掉。
方法区里面废弃常量和无用的类会被回收,至于什么是无用的类。
1.java堆里面不存在该类的实例
2.加载该类的ClassLoader已经被回收
3.对象没有被引用。
符合以上三点,就是无用的类。
刚刚提到了标记!这就要简单说一下垃圾收集算法。
- 标记-清除算法
- 复制算法
- 标记-整理算法
- 分代收集算法
1.标记-清除算法
最基础最简单,先扫一圈,标记对象,然后再删除,这种方法效率比较低下。而且清除之后产生了不连续的内存碎片。以后分配大对象的时候,会以为空间不足,就会提前触发垃圾回收动作。
2.复制算法
效率比较高,将可用内存分成两块,每次只用一块,用完之后会把活着的对象扔到另外一块区域。然后直接清理之前的区域。这个算法效率提升了,但是直接把内存缩了一半。
3.标记-整理算法
可以说是标记-清除2.0,区别在于并没有直接干掉对象,而是先标记,然后让存活的对象向一端进行移动。然后再清理。
4.分代收集算法
现在用的就是分代收集,把复制算法和标记-整理进行结合使用,我们知道根据对象的生命周期,可以分为新生代和老年代。
新生代的对象一般是大批量死去,少量存活,可以类比新陈代谢快,所有对于新生代使用复制算法,而且1:1很不科学,现在是新生代内存分一块Eden和两块Survivor。
老年代的对象,存活率比较高,而且大多不易回收,新陈代谢慢,所以采用标记清理算法。
然后执行这些算法的就是收集器了,java这么多年发展,有很多收集器。全说比较费劲,简述一下
1.Serial
最老的,采用复制算法,单线程会影响其他线程工作。
2.ParNew
Serial的多线程版本。
3.Parallel Scavenge
由于使用的依然是复制算法,它也依然是一个新生代收集器。Parallel Scavenge主要引入吞吐量这个概念,
吞吐量=运行用户代码时间/(运行用户代码时间+垃圾收集时间)。它提供了参数可以控制垃圾售后机停顿使劲和吞吐量。
4.Serial Old
Serial的老年代版本。标记-整理算法
5.Parallel Old
Parallel Scavenge 老年代版本。
6.CMS(Conrrurent Mark Sweep)
目标是获取最短回收停顿时间,使用标记-清除。这个可能会提前触发Full GC
7.G1
这个比较NB,现在用的也是它。最主要的是支持了分代收集。
网友评论