早期(编译期)优化

作者: lsh的学习笔记 | 来源:发表于2020-04-13 16:08 被阅读0次

早期（编译期）优化
早期(编译期)优化
要点提炼| 理解JVM之程序编译&代码优化
《深入理解Java虚拟机》学习笔记（七）（早期（编译期）优化（J
程序编译与代码优化
《深入理解Java虚拟机-JVM高级特性与最佳实践》学习总结（第
早期编译优化
程序编译和代码优化
Javac早期(编译期)
深入JVM（五）早期（编译期）优化

概述

Java语言的“编译期”其实是一段“不确定”的操作过程，因为它可能是指一个前端编译器（其实叫“编译器的前端”更准确一些）把.java文件转变成.class文件的过程；也可能是指虚拟机的后端运行期编译器（JIT编译器，Just InTime Compiler）把字节码转变成机器码的过程；还可能是指使用静态提前编译器（AOT编译器，Ahead Of Time Compiler）直接把*.java文件编译成本地机器代码的过程。

前端编译器：Sun的Javac、EclipseJDT中的增量式编译器（ECJ）[1]。
JIT编译器：HotSpotVM的C1、C2编译器。
AOT编译器：GNUCompilerfortheJava（GCJ）[2]、ExcelsiorJET[3]。

Javac编译器

Javac编译器是一个由Java语言编写的程序。

Javac的源码与调试

Javac的源码存放在JDK_SRC_HOME/langtools/src/share/classes/com/sun/tools/javac中，除了JDK自身的API外，就只引用了JDK_SRC_HOME/langtools/src/share/classes/com/sun/*里面的代码，调试环境建立起来简单方便，因为基本上不需要处理依赖关系。

以EclipseIDE环境为例，先建立一个名为"Compiler_javac"的Java工程，然后把JDK_SRC_HOME/langtools/src/share/classes/com/sun/*目录下的源文件全部复制到工程的源码目录中。

image.png

导入代码期间，源码文件"AnnotationProxy Maker.java"可能会提示"Access Restriction"，被Eclipse拒绝编译，这是由于Eclipse的JRE System Library中默认包含了一系列的代码访问规则（AccessRules），如果代码中引用了这些访问规则所禁止引用的类，就会提示这个错误。可以通过添加一条允许访问JAR包中所有类的访问规则来解决这个问题。如图所示：

image.png

导入了Javac的源码后，就可以运行com.sun.tools.javac.Main的main()方法来执行编译了，与命令行中使用Javac的命令没有什么区别，编译的文件与参数在Eclipse的"Debug Configurations"面板中的"Arguments"页签中指定。

从SunJavac的代码来看，编译过程大致可以分为3个过程，分别是：

解析与填充符号表过程。
插入式注解处理器的注解处理过程。
分析与字节码生成过程。

image.png

Javac编译动作的入口是com.sun.tools.javac.main.JavaCompiler类，上述3个过程的代码逻辑集中在这个类的compile()和compile2()方法中，整个编译最关键的处理就由图中标注的8个方法来完成。

image.png

解析与填充符号表

1.词法、语法分析

词法分析是将源代码的字符流转变为标记（Token）集合。

单个字符是程序编写过程的最小元素，
标记则是编译过程的最小元素，关键字、变量名、字面量、运算符都可以成为标记。

语法分析是根据Token序列构造抽象语法树的过程。

抽象语法树（AbstractSyntaxTree,AST）

是一种用来描述程序代码语法结构的树形表示方式，语法树的每一个节点都代表着程序代码中的一个语法结构（Construct），例如包、类型、修饰符、运算符、接口、返回值甚至代码注释等都可以是一个语法结构。

经过这个步骤之后，编译器就基本不会再对源码文件进行操作了，后续的操作都建立在抽象语法树之上。

2.填充符号表

完成了语法分析和词法分析之后，下一步就是填充符号表的过程。

符号表（SymbolTable）

是由一组符号地址和符号信息构成的表格，读者可以把它想象成哈希表中K-V值对的形式（实际上符号表不一定是哈希表实现，可以是有序符号表、树状符号表、栈结构符号表等）。

符号表中所登记的信息在编译的不同阶段都要用到。

在语义分析中，符号表所登记的内容将用于语义检查（如检查一个名字的使用和原先的说明是否一致）和产生中间代码。
在目标代码生成阶段，当对符号名进行地址分配时，符号表是地址分配的依据。

注解处理器

在JDK1.5之后，Java语言提供了对注解（Annotation）的支持，这些注解与普通的Java代码一样，是在运行期间发挥作用的。

在JDK1.6中实现了JSR269规范，提供了一组插入式注解处理器的标准API在编译期间对注解进行处理，我们可以把它看做是一组编译器的插件，在这些插件里面，可以读取、修改、添加抽象语法树中的任意元素。

如果这些插件在处理注解期间对语法树进行了修改，编译器将回到解析及填充符号表的过程重新处理，直到所有插入式注解处理器都没有再对语法树进行修改为止，每一次循环称为一个Round，也就是图104中的回环过程。

有了编译器注解处理的标准API后，我们的代码才有可能干涉编译器的行为，由于语法树中的任意元素，甚至包括代码注释都可以在插件之中访问到，所以通过插入式注解处理器实现的插件在功能上有很大的发挥空间。

举例：典型的 Lombok 插件。

语义分析与字节码生成

1. 标注检查

标注检查步骤检查的内容包括诸如变量使用前是否已被声明、变量与赋值之间的数据类型是否能够匹配等。

在标注检查步骤中，还有一个重要的动作称为常量折叠，如果我们在代码中写了如下定义：inta=1+2；·那么在语法树上仍然能看到字面量“1”、“2”以及操作符“+”，但是在经过常量折叠之后，它们将会被折叠为字面量“3”。由于编译期间进行了常量折叠，所以在代码里面定义"a=1+2"比起直接定义"a=3"，并不会增加程序运行期哪怕仅仅一个CPU指令的运算量`。

2.数据及控制流分析

数据及控制流分析是对程序上下文逻辑更进一步的验证。

它可以检查出诸如程序局部变量在使用前是否有赋值、方法的每条路径是否都有返回值、是否所有的受查异常都被正确处理了等问题。

编译时期的数据及控制流分析与类加载时的数据及控制流分析的目的基本一致，但校验范围有所区别，有一些校验项只有在编译期或运行期才能进行。

3. 解语法糖

语法糖（SyntacticSugar），也称糖衣语法，指在计算机语言中添加的某种语法，这种语法对语言的功能并没有影响，但是更方便程序员使用。

通常来说，使用语法糖能够增加程序的可读性，从而减少程序代码出错的机会。

Java中最常用的语法糖主要是前面提到过的泛型（泛型并不一定都是语法糖实现，如C#的泛型就是直接由CLR支持的）、变长参数、自动装箱/拆箱等。

虚拟机运行时不支持这些语法，它们在编译阶段还原回简单的基础语法结构，这个过程称为解语法糖。

4. 字节码生成

字节码生成是Javac编译过程的最后一个阶段。

把前面各个步骤所生成的信息（语法树、符号表）转化成字节码写到磁盘中，编译器还进行少量的代码添加和转换工作。

例如，前面章节中多次提到的实例构造器＜init＞()方法和类构造器＜clinit＞()方法就是在这个阶段添加到语法树之中的。

注意，这里的实例构造器并不是指默认构造函数，如果用户代码中没有提供任何构造函数，那编译器将会添加一个没有参数的、访问性（public、protected或private）与当前类一致的默认构造函数，这个工作在填充符号表阶段就已经完成。

这两个构造器的产生过程实际上是一个代码收敛的过程，编译器会把语句块（对于实例构造器而言是“{}”块，对于类构造器而言是"static{}"块）、变量初始化（实例变量和类变量）、调用父类的实例构造器（仅仅是实例构造器，＜clinit＞()方法中无须调用父类的＜clinit＞()方法，虚拟机会自动保证父类构造器的执行，但在＜clinit＞()方法中经常会生成调用java.lang.Object的＜init＞()方法的代码）等操作收敛到＜init＞()和＜clinit＞()方法之中，并且保证一定是按先执行父类的实例构造器，然后初始化变量，最后执行语句块的顺序进行。

除了生成构造器以外，还有其他的一些代码替换工作用于优化程序的实现逻辑，如把字符串的加操作替换为StringBuffer或StringBuilder（取决于目标代码的版本是否大于或等于JDK1.5）的append()操作等。

Java语法糖的味道

1. 泛型与类型擦除

本质是参数化类型（ParametersizedType）的应用，也就是说所操作的数据类型被指定为一个参数。这种参数类型可以用在类、接口和方法的创建中，分别称为泛型类、泛型接口和泛型方法。

2. 自动装箱、拆箱与遍历循环

自动装箱、拆箱在编译之后被转化成了对应的包装和还原方法，如Integer.valueOf()与Integer.intValue()方法.
遍历循环则把代码还原成了迭代器的实现，这也是为何遍历循环需要被遍历的类实现Iterable接口的原因。
变长参数，它在调用的时候变成了一个数组类型的参数。

自动装箱陷阱

包装类的“==”运算在不遇到算术运算的情况下不会自动拆箱，以及它们equals()方法不处理数据转型。

3. 条件编译

根据布尔常量值的真假，编译器将会把分支中不成立的代码块消除掉，这一工作将在编译器解除语法糖阶段完成。

Java语言的语法糖：泛型、自动装箱、自动拆箱、遍历循环、变长参数、条件编译、内部类、枚举类、断言语句、对枚举和字符串（在JDK1.7中支持）的switch支持、try语句中定义和关闭资源（在JDK1.7中支持）等，都可以通过跟踪Javac源码、反编译Class文件等方式了解它们的本质实现。

早期（编译期）优化
1. 解析与填充符号表 1.1 词法、语法分析词法分析：将源代码的字符流变成Token的过程例如：int a =...
早期(编译期)优化
概述 Java语言的“编译期”其实是一段“不确定”的操作过程，因为它可能是指一个前端编译器（其实叫“编译器的前端”...
要点提炼| 理解JVM之程序编译&代码优化
本篇将介绍程序编译时期的代码优化手段，分成两个阶段：概述早期（编译期）优化晚期（运行期）优化 1.概述 a....
《深入理解Java虚拟机》学习笔记（七）（早期（编译期）优化（J
早期（编译期）优化前端编译器（把*.java文件转变成*.class文件）：Sun的Javac、 Eclipse...
程序编译与代码优化
早期（编译期）优化编译器类型前端编译器：把java文件变成class文件；比如我们的idea，javac等。（...
《深入理解Java虚拟机-JVM高级特性与最佳实践》学习总结（第
第十章早期(编译期)优化目录: 10.1 对于编译器的概述10.2 Javac编译器10.3 妈妈，我想吃语法...
早期编译优化
Javac编译器源码解读编译过程：解析与填充符号表过程插入式注解处理器的注解处理过程分析与字节码生成过程 ...
程序编译和代码优化
早期(编译期)优化 java泛型在java中，泛型方法在编译之后，生成的class文件里面保存的是原生类型。晚...
Javac早期(编译期)
Javac早期(编译期)
深入JVM（五）早期（编译期）优化
从计算机程序出现的第一天起，对效率的追求就是程序天生的坚定信仰，这个过程犹如一场没有终点，永不停歇的F1方程式竞赛...