美文网首页我爱编程
内存区域与创建对象时的内存分配

内存区域与创建对象时的内存分配

作者: kindol | 来源:发表于2018-04-15 09:10 被阅读0次

    一些基本概念:

    • 计算机存储元件

      寄存器:CPU的一部分,计算机中读写速度最快的存储元件,容量少

      内存:属于独立的一个部件,是和CPU沟通的桥梁,用于存放CPU中的运算数据以及与外部存储器交换的数据。对内存的读写速度和对于寄存器的读写速度有几个数量级的差距。但是寄存器数量容量有限,不可能通过寄存器来完成所有的运算任务。

    • 内核空间和用户空间

      连接内存和寄存器的是地址总线,地址总线的宽度影响了物理地址的索引范围(最大可寻址地址空间)。比如32位系统,可寻址范围为0×00000000~0xFFFFFFFF,即2^(32)个内存位置,每个内存位置1个字节,即32位系统可以有4GB的内存空间。不过应用程序是不可以完全使用这些地址空间的,因为这些地址空间被划分为了内核空间和用户空间程序只能使用用户空间的内存内核空间主要是指操作系统运行时所使用的用于程序调度、虚拟内存的使用或者链接硬件资源的程序逻辑区分内核空间和用户空间的目的主要是从系统的稳定性的角度考虑的

    • 堆栈

      首先堆栈不是一个概念,而是两个概念,堆和栈是两块不同的内存区域——堆是用来存放对象而栈是用来执行程序的。而所谓java内存区域,远不止仅有堆栈,只是人们关注的更多是内存泄漏溢出等问题,而JVM帮我们管理了这一切,因此一个好的Java程序员应该去了解虚拟机的内存区域以及会引起内存泄露和内存溢出的场景。

    运行时数据区域总览:

    内存区域

    图中绿色部分就是所有线程之间共享的内存区域,而白色部分则是线程运行时独有的数据区域

    1. 线程独有的内存区域

      1. PROGRAM COUNTER REGISTER,程序计数器

        当前线程所执行的字节码的行号指示器,字节码解释器通过此确定下一条指令;如果执行的是native方法,则计数器为空

      2. JAVA STACK,虚拟机栈

        生命周期和线程相同。每个方法执行的同时都会创建一个栈帧,用于执行方法,帧栈存储局部变量表、操作数栈、动态链接、方法出口等信息,每一个方法从调用直至执行完毕的过程,就对应着一个栈帧在虚拟机中入栈到出栈的过程。栈的大小和具体JVM的实现有关,通常在256K~756K之间。

      3. NATIVE METHOD STACK,native方法栈

        和虚拟机栈起的作用一样,只不过方法栈为虚拟机使用到的Native方法服务。虚拟机规范并没有对这个区域有什么强制规定,因此我们使用的HotSpot虚拟机,就干脆没有这块区域了,它和虚拟机栈是一起的

    2. 线程间共享的内存区域

      1. HEAP,堆

        存放对象实例,堆也细分为新生代和老年代(没有永久代)。

      2. METHOD AREA,方法区

        这块区域用于存储虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据,虚拟机规范是把这块区域描述为堆的一个逻辑部分的,但实际它是和堆区不相连的,只是与堆共享物理内存。从上面提到的分代收集算法的角度看,HotSpot中,方法区≈永久代。不过JDK7之后,我们使用的HotSpot就没有永久代这个概念了,采用Native Memory来实现方法区的规划。

      3. RUNTIME CONSTANT POOL,运行时常量池

        上面的图中没有画出来,因为它是方法区的一部分。用于存放编译期间生成的各种字面量和符号引用(以一组符号来描述所引用的目标,可为字面量,只要使用时能够无歧义的定位到目标即可),这部分内容将在类加载后进入方法区的运行时常量池中,另外翻译出来的直接引用也会存储在这个区域中。这个区域另外一个特点就是动态性,Java并不要求常量一定要在编译期间才能产生,运行期间也可以在这个区域放入新的内容,String.intern()方法就是这个特性的应用。

    3. 直接内存

      直接内存并不是虚拟机运行时数据区的一部分,也不是Java虚拟机规范中定义的内存区域。但是这部分内存也被频繁地使用,而且也可能导致内存溢出问题。JDK1.4中新增加了NIO,引入了一种基于通道与缓冲区的I/O方式,它可以使用Native函数库直接分配堆外内存,然后通过一个存储在Java堆中的DirectByteBuffer对象作为这块内存的引用进行操作。这样能在一些场景中显著提高性能,因为避免了在Java堆和Native堆中来回复制数据。显然,本机直接内存的分配不会受到Java堆大小的限制,但是,既然是内存,肯定还是会受到本机总内存(包括RAM、SWAP区)大小以及处理器寻址空间的限制。

    对象创建:

    看看java语言的new关键字在JVM的执行过程:

    1. JVM遇到new,先检查指令参数是否在常量池中定位到一个类的符号引用,并且检查对应的类是否已经被加载、解析和初始化,如果没有,先执行类的初始化过程。

    2. 类加载检查通过后,JVM为新生对象分配内存(对象优先分配在eden区,大对象直接进老年区,静态对象等进入方法区),。对象所需内存大小在类加载完成后便可以确定,分配空间其实就是在java堆中划分出一块确定大小的内存,但这可能会有两个问题:

      • 若内存是规整的,则jvm将采用指针碰撞法为对象分配内存。即用过的内存放一边,空闲的房一遍,中间放指针做分界指示器,分配内存就仅仅是把指针向空闲那边挪动一段与对象大小相等的距离。若垃圾收集器选择的是Serial、ParNew这种基于压缩算法的,虚拟机采用这种分配方式。
      • 若内存不是规整的,已使用的内存和未使用的内存相互交错,那么虚拟机将采用的是空闲列表法来为对象分配内存。如果垃圾收集器选择的是CMS这种基于标记-清除算法的,虚拟机采用这种分配方式。
      • 以上是一个问题,内存分配问题。还有另一个问题是new对象的时候的线程安全性。虚拟机采用了CAS配上失败重试的方式保证更新更新操作的原子性和TLAB两种方式来解决这个问题。

      插入一张跟GC结合的图片

      分配内存空间


      如果Major GC之后还是老年代不足,JVM会抛出内存不足的异常

    3. 内存分配结束,jvm将分配到的内存空间都初始化为零值(不包括对象头),这一步保证了对象的实例字段在Java代码中可以不用赋初始值就可以直接使用。

    4. 对对象进行必要的设置,例如这个对象是哪个类的实例、如何才能找到类的元数据信息、对象的哈希码、对象的GC分代年龄等信息,这些信息存放在对象的对象头中。

    5. 执行<init>方法,把对象按照程序员的意愿进行初始化,一个真正可用的对象就完全产生出来。

    对象定位方式:

    建立对象是为了使用对象,Java程序需要通过栈上的reference(引用)数据来操作堆上的具体对象。比如我们写了一句

    Object obj = new Object()
    

    而new Object()之后其实有两部分内容,一部分是类数据(比如代表类的Class对象)、一部分是实例数据。

    由于reference在Java虚拟机规范中只是一个指向对象new Object()的引用obj,并没有规定obj应该通过何种方式去定位、访问堆中对象的具体位置,所以对象访问方式也是取决于虚拟机而定的。主流方式有两种:

    1. 句柄访问。Java堆中划分出一块句柄池obj指向的是对象的句柄地址,句柄中则包含了类数据的地址和实例数据的地址
    2. 指针访问。对象中存储所有的实例数据和类数据的地址obj指向的是这个对象

    HotSpot虚拟机采用的是后者,不过前者的对象访问方式也是十分常见的。

    符号引用和直接引用的区别:

    • 符号引用

      以一组符号来描述所引用的目标,符号可以是字面量,只要使用时能够无歧义的定位到目标即可。例如,在Class文件中它以CONSTANT_Class_info、CONSTANT_Fieldref_info、CONSTANT_Methodref_info等类型的常量出现。符号引用与虚拟机的内存布局无关引用的目标并不一定加载到内存中。在Java中,一个java类将会编译成一个class文件。在编译时,java类并不知道所引用的类的实际地址,因此只能使用符号引用来代替。比如org.simple.People类引用了org.simple.Language类,在编译时People类并不知道Language类的实际内存地址,因此只能使用符号org.simple.Language(假设是这个,当然实际中是由类似于CONSTANT_Class_info的常量来表示的)来表示Language类的地址。各种虚拟机实现的内存布局可能有所不同,但是它们能接受的符号引用都是一致的,因为符号引用的字面量形式明确定义在Java虚拟机规范的Class文件格式中。

    • 直接引用

      直接引用可以是

      1. 直接指向目标的指针(比如,指向类变量、类方法的直接引用可能是指向方法区的指针)
      2. 相对偏移量(比如,指向实例变量、实例方法的直接引用都是偏移量)
      3. 一个能间接定位到目标的句柄

      直接引用是和虚拟机的布局相关的,同一个符号引用在不同的虚拟机实例上翻译出来的直接引用一般不会相同。如果有了直接引用,那引用的目标必定已经被加载入内存中了

    参考:

    http://www.cnblogs.com/xrq730/p/4827590.html
    

    相关文章

      网友评论

        本文标题:内存区域与创建对象时的内存分配

        本文链接:https://www.haomeiwen.com/subject/fgfdkftx.html