当前位置 博文首页 > RtxTitanV的博客:JVM总结之Java内存区域

    RtxTitanV的博客:JVM总结之Java内存区域

    作者:[db:作者] 时间:2021-07-07 10:05

    本文主要对JVM中内存区域进行简单总结。

    一、运行时数据区域

    Java虚拟机在执行Java程序的过程中会把它管理的内存划分成若干个不同的数据区域。具体划分如下图所示:
    1
    在JDK1.8之前的HotSpot虚拟机中的内存区域是按上图划分,只不过方法区的实现为永久代。而在JDK1.8的HotSpot虚拟机中的内存区域和之前有所不同,变化如下图:
    2

    1.程序计数器

    程序计数器是一块较小的内存空间,可以看作是当前线程所执行的字节码的行号指示器。字节码解释器工作时通过改变这个计数器的值来选取下一条需要执行的字节码指令,分支、循环、跳转、异常处理、线程恢复等功能都需要依赖这个计数器来完成。

    为了线程切换后能恢复到正确的执行位置,每条线程都需要有一个独立的程序计数器,各线程之间计数器互不影响,独立存储,我们称这类内存区域为“线程私有”的内存。

    如果线程正在执行的是一个Java方法,这个计数器记录的是正在执行的虚拟机字节码指令的地址;如果正在执行的是Native方法,这个计数器值则为空。程序计数器是唯一一个在Java虚拟机规范中没有规定任何OutOfMemoryError的内存区域。

    总结,程序计数器主要有两个作用:

    • 字节码解释器通过改变程序计数器来依次读取指令,从而实现代码的流程控制,如:顺序执行、选择、循环、异常处理。
    • 在多线程的情况下,程序计数器用于记录当前线程执行的位置,从而当线程被切换回来的时候能够知道该线程上次运行到哪儿了。

    2.Java虚拟机栈

    与程序计数器一样,Java虚拟机栈也是线程私有的,它的生命周期和线程相同。虚拟机栈描述的是Java方法执行的内存模型:每个方法在执行的同时都会创建一个栈帧。栈帧用于存储局部变量表、操作栈、动态链接、方法出口等信息。

    局部变量表主要存放了编译期可知的各种数据类型(boolean、byte、char、short、int、float、long、double)、对象引用(reference类型,它不同于对象本身,可能是一个指向对象起始地址的引用指针,也可能是指向一个代表对象的句柄或其他与此对象相关的位置)和returnAddress类型(提向了一条字节码指令的地址)。

    每一个方法被调用直至执行完成的过程,就对应着一个栈帧在虚拟机中从入栈到出栈的过程。即每一次方法调用都会有一个对应的栈帧被压入栈,每一个方法调用结束后都会有一个栈帧被弹出。通过return语句返回或抛出异常会导致方法调用结束,栈帧被弹出。

    该区域会产生两种异常:

    • StackOverflowError异常:如果Java虚拟机栈不允许动态扩展,当请求的栈深度大于虚拟机所允许的深度时,抛出StackOverFlowError异常。
    • OutOfMemoryError异常:如果Java虚拟机栈可以动态扩展,当扩展时无法申请到足够的内存时,抛出OutOfMemoryError异常。

    3.本地方法栈

    本地方法栈与虚拟机栈所发挥的作用非常相似,区别不过是虚拟机栈为虚拟机执行Java方法(也就是字节码)服务,本地方法栈为虚拟机使用到的Native方法服务。在HotSpot虚拟机中和Java虚拟机栈合二为一。与虚拟机栈一样,本地方法栈也会抛出StackOverFlowErrorOutOfMemoryError异常。

    4.堆

    对大多数应用来说,Java堆是Java虚拟机所管理的内存中最大的一块,是被所有线程共享的一块内存区域,在虚拟机启动时创建。此内存区域的唯一目的就是存放对象实例,几乎所有的对象实例都在这里分配内存。

    Java几乎所有的对象都在堆中分配,但是,随着JIT编译期的发展与逃逸分析技术逐渐成熟,栈上分配、标量替换优化技术将会导致一些微妙的变化,所有的对象都分配到堆上也渐渐变得不那么“绝对”了。从jdk1.7开始已经默认开启逃逸分析,如果某些方法中的对象引用没有被返回或者未被外面使用(也就是未逃逸出去),那么对象可以直接在栈上分配内存。

    Java堆是垃圾收集器管理的主要区域,因此也被称作GC堆(Garbage Collected Heap)。从垃圾回收的角度,由于现在收集器基本都采用分代垃圾收集算法,所以Java堆可以分为新生代和老年代,新生代可以进一步细分为Eden、From Survivor、To Survivor。进一步划分的目的是更好地回收内存,或者更快地分配内存。
    3
    Java堆可以处于物理上不连续内存空间,只是逻辑连续即可,并可以动态扩展其内存。如果在堆中没有内存完成实例分配,并且堆上也无法再扩展时,将会抛OutOfMemoryError异常。可以通过-Xms和-Xmx这两个虚拟机参数来指定一个程序的堆内存大小,第一个参数设置初始值,第二个参数设置最大值。

    5.方法区

    方法区与Java堆一样,是各个线程共享的内存区域,它用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。方法区是JVM规范中定义的一个概念,不同的实现可以放在不同的地方。在JDK1.8之前的HotSpot中,永久代是对JVM规范中方法区的实现。

    方法区与永久代的关系:方法区只是JVM规范中定义的一个概念,并没有规定如何去实现它。在不同的JVM上方法区的实现也有所不同。而永久代只是HotSpot虚拟机对虚拟机规范中方法区的一种实现方式。也就是说,方法区是Java虚拟机规范中的概念,是一种规范;永久代是HotSpot中的概念,是一种实现。一个是标准一个是实现,其他的虚拟机实现并没有永久代这一说法。

    在JDK1.7的HotSpot中,已经把原本放在方法区中的静态变量、字符串常量池等移到堆内存中。在JDK1.8中,永久代已被彻底移除,取而代之的是元空间(MetaSpace),存储类的元数据信息,元空间并没有处于堆内存上,而是使用的本地内存(NativeMemory)。

    元空间与永久代的关系:元空间的本质和永久代类似,都是对JVM规范中方法区的实现。不过元空间与永久代之间最大的区别在于,元空间并不在虚拟机(运行时数据区)中,而是使用本地内存。因此,默认情况下,元空间的大小仅受本地内存限制。

    元空间常用的配置参数如下

    • -XX:MetaspaceSize:元空间的初始大小,达到该值就会触发垃圾收集进行类型卸载,同时GC会对该值进行调整,如果释放了大量的空间,就适当降低该值,如果释放了很少的空间,那么在不超过MaxMetaspaceSize时,适当提高该值。
    • -XX:MaxMetaspaceSize:元空间的最大大小,默认是没有限制的。
    • -XX:MinMetaspaceFreeRatio:在GC之后,最小的Metaspace剩余空间容量的百分比,减少为分配空间所导致的垃圾收集。
    • -XX:MaxMetaspaceFreeRatio:在GC之后,最大的Metaspace剩余空间容量的百分比,减少为释放空间所导致的垃圾收集。

    将永久代替换为元空间的原因

    • 整个永久代有一个JVM本身设置固定大小上限,无法进行调整,而元空间使用的是本地内存,受本机可用内存的限制,虽然元空间仍旧可能出现内存溢出,但是比永久代出现的几率更小。
    • 元空间里面存放的是类的元数据,这样加载多少类的元数据就不由MaxPermSize控制了,而由系统的实际可用空间来控制,这样能加载的类就更多了。
    • 在 JDK8合并HotSpot和JRockit时,由于JRockit中没有永久代,合并之后就没有必要额外的设置一个永久代。

    6.运行时常量池

    运行时常量池是方法区的一部分。Class文件中除了有类的版本、字段、方法、接口等描述信息外,还有常量池,用于存放编译期生成的各种字面量和符号引用,这部分内容将在类加载后进入方法区的运行时常量池中存放。一般来说,运行时常量池除了保存Class文件中描述的符号引用外,还会存储翻译出来的直接引用。运行时常量池相对于Class文件常量池的一个重要特征是具备动态性,除了在编译期生成的常量,也就是并非预置到Class文件常量池的内容才能进入方法区运行时常量池,运行期间也可能将新的常量放入池中,例如String类的intern()方法。运行时常量池是方法区的一部分,会受到方法区内存的限制,当常量池无法再申请到内存时会抛出OutOfMemoryError异常。

    JDK1.7之前运行时常量池逻辑包含字符串常量池存放在方法区,此时hotspot对方法区的实现为永久代。在JDK1.7的HotSpot中,字符串常量池被移到堆中,此时运行时常量池还在方法区,hotspot对方法区的实现还是永久代。在JDK1.8的HotSpot中,永久代被移除,取而代之的是元空间,此时字符串常量池在堆,运行时常量池还在方法区,只不过方法区的实现从永久代变成了元空间。

    7.直接内存

    直接内存并不是虚拟机运行时数据区的一部分,也不是虚拟机规范中定义的内存区域,但是这部分内存也被频繁地使用。而且也可能导致OutOfMemoryError异常出现。

    JDK1.4中新加入的NIO类,引入了一种基于通道(Channel)与缓冲区(Buffer) 的I/O方式,它可以直接使用Native函数库直接分配堆外内存,然后通过一个存储在Java堆中的DirectByteBuffer对象作为这块内存的引用进行操作。这样就能在一些场景中显著提高性能,因为避免了在Java堆和Native堆之间来回复制数据。

    本机直接内存的分配不会受到Java堆的限制,但是,既然是内存就会受到本机总内存大小以及处理器寻址空间的限制。

    二、HotSpot虚拟机对象探秘

    1.对象的创建

    Java对象的创建过程如下图所示:
    4
    1.类加载检查:虚拟机遇到一条new指令时,首先将去检查这个指令的参数是否能在常量池中定位到一个类的符号引用,并且检查这个符号引用代表的类是否已被加载过、解析和初始化过。如果没有,那必须先执行相应的类加载过程。

    2.分配内存:在类加载检查通过后,接下来虚拟机将为新生对象分配内存。对象所需的内存大小在类加载完成后便可确定,为对象分配空间等同于把一块确定大小的内存从Java堆中划分出来。分配方式有以下两种:

    • 指针碰撞:用一个指针作为分界点指示器,将已分配和未分配堆内存分为两部分。指针向空闲部分移一个对象内存大小的位置即可分配内存。适用于Java堆内存绝对规整的情况。GC收集器Serial、ParNew采用的此分配方式。
    • 空闲列表:虚拟机维护一个列表,该列表记录了可用的内存块,在分配时从列表中找到一块足够大的空间划分给对象实例并更新列表记录。适用于Java堆内存不规整的情况。GC收集器CMS采用的此分配方式。

    选择哪种分配方式由Java堆是否规整决定,而Java堆是否规整又由所采用的垃圾收集器是否带有压缩整理功能决定。分配内存在并发的情况下会产生线程安全问题,虚拟机为了保证线程安全通常采用以下两种方式:

    • CAS加失败重试:CAS属于乐观的并发策略。乐观策略就是借助冲突检查机制来判断在更新过程中是否存在来自其他线程的干扰,如果不存在,直接操作成功,如果存在,这个操作将失败,并且可以重试到成功为止。CAS加失败重试的方式可以保证更新操作的原子性。
    • 本地线程分配缓冲区(Thread Local Allocation Buffer,TLAB):将内存分配按照线程划分在不同的空间中进行,即每个线程在Java堆中预先分配一块内存,JVM在给线程中的对象分配内存时,首先在TLAB分配,当对象大于TLAB中的剩余内存或TLAB已用尽时,再采用CAS进行内存分配。虚拟机是否使用TLAB,可以通过-XX:+/-UseTLAB参数设定。

    3.初始化零值:内存分配完成后,虚拟机需要将分配到的内存空间都初始化为零值(不包括对象头),这一步操作保证了对象的实例域在Java代码中可以不赋初始值就直接使用,程序能访问到这些域的数据类型所对应的零值。

    4.设置对象头:接下来,虚拟机要对对象进行必要的设置,例如这个对象是哪个类的实例、如何才能找到类的元数据信息、对象的哈希码、对象的GC分代年龄等信息。这些信息存放在对象头中。根据虚拟机当前运行状态的不同,如是否启用偏向锁等,对象头会有不同的设置方式。

    5.执行init方法:在上面工作都完成之后,从虚拟机的视角来看,一个新的对象已经产生了,但从 Java 程序的视角来看,对象创建才刚开始,<init>方法还没有执行,所有的字段都还为零。所以一般来说,执行new指令之后会接着执行<init>方法,把对象按照程序员的意愿进行初始化,这样一个真正可用的对象才算完全产生出来。

    2.对象的内存布局

    对象的内存布局以及HotSpot虚拟机对象头Mark Word如下图所示:
    5
    在Hotspot虚拟机中,对象在内存中的布局可以分为3块区域:对象头实例数据对齐填充。Hotspot虚拟机的对象头包括两部分信息,第一部分用于存储对象自身的运行时数据,如哈希码、GC分代年龄、锁状态标志等,这部分数据被官方称为“Mark Word”;另一部分是类型指针,即对象指向它的类元数据的指针,虚拟机通过这个指针来确定这个对象是那个类的实例。并不是所有的虚拟机实现都必须在对象数据上保留类型指针,换句话说,查找对象的元数据信息并不一定要经过对象本身。如果对象是一个Java数组,那在对象头中还必须有一块用于记录数组长度的数据,因为虚拟机可以通过普通Java对象的元数据信息确定Java对象的大小,但是从数组的元数据中却无法确定数组的大小。

    实例数据部分是对象真正存储的有效信息,也是在程序中所定义的各种类型的字段内容。对齐填充部分不是必然存在的,也没有特别的含义,仅仅起占位作用。由于Hotspot虚拟机的自动内存管理系统要求对象起始地址必须是8字节的整数倍,换句话说就是对象的大小必须是8字节的整数倍。而对象头部分正好是8字节的倍数(1倍或2倍),因此,当对象实例数据部分没有对齐时,就需要通过对齐填充来补全。

    3.对象的访问定位

    Java程序需要通过栈上的reference数据来操作堆上的具体对象。由于reference类型在Java虚拟机规范中只规定了一个指向对象的引用,并没有定义这个引用如何去定位、访问堆中的对象的具体位置,所以对象访问方式也是由虚拟机实现而定的。目前主流的访问方式有使用句柄直接指针两种。

    使用句柄:如果使用句柄的话,那么Java堆中将会划分出一块内存来作为句柄池,reference中存储的就是对象的句柄地址,而句柄中包含了对象实例数据与类型数据各自的具体地址信息。如下图所示:
    6
    直接指针:如果使用直接指针访问,那么 Java 堆对象的布局中就必须考虑如何放置访问类型数据的相关信息,而 reference 中存储的直接就是对象的地址。如下图所示:
    7

    cs
    下一篇:没有了