简单总结JVM的编译与运行过程。
1. Java的编译
第一步:前端编译
从.java文件将Java源代码翻译为.class的字节码,由javac完成,主要过程和一般编译器的前端很相似,输出的字节码是可以按行解释的中间结果代码。
具体步骤(与一般编译器前端类似):词法分析器 => 语法分析器(输出AST)=> 符号表,语义分析器(输出AST with attributes)=> 字节码(“中间结果/IR”)。
第二步:后端编译/翻译执行
从字节码到机器码有两个方法,主要由JIT完成:
1) 翻译器按行翻译,优点是剩下了单次编译的时间,缺点是很多instruction需要重复翻译(例如loop中的代码);
2) 编译器一次性翻译成machine code;
两种方法有的时候可以共同使用(Java混合模式)。
总的来说,Java一般的执行模式有三:(1)0:直接通过解释器进行执行;(2)1:C1,即client mode,通过一般编译执行machine code;(3)2:C2,server mode,编译过程进行大幅度(甚至激进)的优化。
在分层编译(即混合模式)中一种可能的策略是:先通过解释器开始执行,当一些hotspot code/function的被调用数量超过一些阈值则使用编译器编译,将结果代码放入cache。
两步并一步:src直接到machine code
AOT编译器,直接编译,但是由于Java的动态属性(例如动态类加载),使得AOT编译结果的效率一般差于JIT编译,但好在对内存消耗更少,并且效率至少比解释器更高。
小总结
javac,JIT,AOT都是JVM中的编译器,以及JVM的解释器,各有优劣和分工。
2. JVM的运行时
JVM运行数据区结构
堆:存放所有Object(除且仅除基本数据类型外),可以划分成三个大区:新生代(Eden区,两个存活区S0和S1),老年代和永久代【JDK8中移除】;
线程栈:每个线程一个栈,线程们共享堆。在JVM启动时创建,空间不需要连续;
本地方法栈:调用本地其他服务(一般由其它语言编写);
方法区:存储所有类的申明,字段,常数,方法;
以及PC寄存器。
内存回收机制
1. 内存标记算法:辨别哪些Object是不用的,可以被清除。目前Java使用的是“可达性分析算法”:从一组根节点开始建立对象的reference关系,能够被reference的就留存。根节点包括:两栈中变量,静态常量及其应用的变量;
2. 复制清除策略(Copying):新创建Object放在Eden,数量超过阈值时将Eden和S0内仍然存活Object复制到S1(S0中是上一轮复制清除的幸存者),然后S0和S1互换角色,周而复始。大小上Eden:S0:S1为8:1:1。一般存活了15轮的Object会被放入老年区。而老年区满了之后会进行一个全面的回收操作;
更多关于收集器种类:https://segmentfault.com/a/1190000021654965。
参考
https://blog.csdn.net/baichoufei90/article/details/85238879
https://segmentfault.com/a/1190000021654965
https://zhuanlan.zhihu.com/p/102171664
网友评论