> 文章列表 > 垃圾回收面试总结

垃圾回收面试总结

垃圾回收面试总结

堆空间的基本结构

Java 的自动内存管理主要是针对对象内存的回收和对象内存的分配。同时,Java 自动内存管理最核心的功能是 内存中对象的分配与回收。

Java 堆是垃圾收集器管理的主要区域,因此也被称作 GC 堆(Garbage Collected Heap)

从垃圾回收的角度来说,由于现在收集器基本都采用分代垃圾收集算法,所以 Java 堆被划分为了几个不同的区域,这样我们就可以根据各个区域的特点选择合适的垃圾收集算法。

在 JDK 7 版本及 JDK 7 版本之前,堆内存被通常分为下面三部分:

  1. 新生代内存(Young Generation)
  2. 老年代(Old Generation)
  3. 永久代(Permanent Generation)

下图所示的 Eden 区、两个 Survivor 区 S0 和 S1 都属于新生代,中间一层属于老年代,最下面一层属于永久代。

垃圾回收面试总结

JDK 1.8 及之后 PermGen(永久代) 已被 Metaspace(元空间) 取代,元空间使用的是直接内存 。

关于Java内存区域的详细介绍,请参考这篇文章——JVM面试题详解系列——JVM内存区域详解。

方法区不是不在堆区吗,你为什么说堆内存包括永久代或者元空间

在Java虚拟机规范中,方法区被定义为堆的一个逻辑部分,但是与Java堆的其他部分(如新生代、老年代)不同,方法区是非堆(Non-Heap)内存,因为它不是由Java堆管理的内存区域。而Java堆主要包括新生代和老年代,以及元数据区(在Java 8及以上版本中)。

因此,Java堆内存主要分为以下几个部分:

  1. 新生代(Young Generation):用于存放新创建的对象,分为Eden区和两个Survivor区(S0和S1)。

  2. 老年代(Old Generation):用于存放长期存活的对象,大多数情况下,新生代中的对象经过多次垃圾回收后,如果仍然存活,就会被移到老年代。

  3. 元数据区(Meta Space):在Java 8及以上版本中,用于存放JVM加载的类信息、常量池、方法等,取代了原来的永久代。因此,方法区(或永久代/元数据区)是Java堆的逻辑部分,但是它不是Java堆的实际组成部分,而是Java堆之外的一块非堆内存。

方法区不是不在堆区吗,你为什么说堆内存包括永久代或者元空间

在Java虚拟机规范中,方法区被定义为堆的一个逻辑部分,但是与Java堆的其他部分(如新生代、老年代)不同,方法区是非堆(Non-Heap)内存,因为它不是由Java堆管理的内存区域。而Java堆主要包括新生代和老年代,以及元数据区(在Java 8及以上版本中)。

因此,Java堆内存主要分为以下几个部分:

  1. 新生代(Young Generation):用于存放新创建的对象,分为Eden区和两个Survivor区(S0和S1)。

  2. 老年代(Old Generation):用于存放长期存活的对象,大多数情况下,新生代中的对象经过多次垃圾回收后,如果仍然存活,就会被移到老年代。

  3. 元数据区(Meta Space):在Java 8及以上版本中,用于存放JVM加载的类信息、常量池、方法等,取代了原来的永久代。因此,方法区(或永久代/元数据区)是Java堆的逻辑部分,但是它不是Java堆的实际组成部分,而是Java堆之外的一块非堆内存。

内存分配和回收原则

对象优先在 Eden 区分配

大多数情况下,对象在新生代的 Eden 区分配。当 Eden 区没有足够的空间时,虚拟机将发起一次 Minor GC。

长期存活的对象将进入老年代

既然虚拟机采用了分代回收的思想来管理内存,那么就必须识别哪些对象应该放在新生代,哪些对象应该放在老年代。为了做到这一点,虚拟机给每个对象一个对象年龄(Age)计数器。

大多谁情况下,对象首先在 Eden 区分配。如果对象在 Eden 区出生,并且经历了一次 Minor GC 后仍能够存活,并且能够被 Survivor 区容纳,将被移动到 Survivor 区(S0 或 S1),并将对象年龄设为1(Eden 区 -> Survivor 区后对象的初始年龄变为 1)。

对象在 Survivor 中每熬过一次 Minor GC,年龄就增加 1 岁,当它的年龄增加到一定程度(晋升老年代的年龄阈值—MaxTenuringThreshold),就会被晋升到老年代中。对象晋升到老年代的年龄阈值,可以通过参数 -XX:MaxTenuringThreshold 来设置。

Hotspot 遍历所有对象时,按照年龄从小到大对其所占用的内存大小进行累积, 当累积到某个年龄时,对象所占用的内存大小超过了 
survivor 区的50%时(默认值是 50%, 可以通过 -XX:TargetSurvivorRatio=percent 来设置),
取这个年龄和 MaxTenuringThreshold 中更小的一个值,作为新的晋升老年代的年龄阈值

注意: 默认晋升到老年代的年龄阈值取决于所使用的垃圾回收器,一般是 15,但是 CMS 是 6。

大对象直接进入到老年代

大对象就是指需要大量连续内存空间的对象(比如:字符串、数组)。

大对象直接进入老年代主要是为了避免为大对象分配内存时由于分配担保机制带来的复制而降低效率。

为什么 JVM 垃圾回收时大对象直接进入到老年代

JVM 将内存分为新生代和老年代,垃圾回收时会根据对象的年龄(经过几次垃圾回收)将其放置于相应的区域。因为大对象往往占用较多内存且生命周期较长,所以将它们直接分配到老年代有助于避免频繁进行内存复制和回收,提高性能。 此外,将大对象直接分配到老年代还可以避免由于新生代空间不足而触发的额外垃圾回收,进一步提高了程序的执行效率。

为什么大对象生命周期较长

大对象生命周期较长的原因可能是它们需要存储大量数据,且这些数据在程序执行过程中需要一直存在。例如,一个图片或视频文件在内存中会占据较大的空间,并且通常需要在很长的时间内保持不变。相比之下,一些小型对象可能只是瞬时使用并被很快销毁,因此它们的生命周期较短。

大对象有哪些

大对象通常是指占用较大内存空间的对象,包括但不限于以下类型:

  1. 图像或视频文件:这些文件往往比较大,需要占用较多的内存空间。

  2. 大型数据集合:例如大型数组、列表或哈希表等。

  3. 长字符串:长度较长的字符串也可能占用较多内存空间。

  4. 大型缓存对象:例如在内存中维护的大型缓存等。

总之,大对象的定义可能因程序执行环境和程序本身而异,但其特点通常是占用较大的内存空间,生命周期较长。

GC分类

针对 HotSpot VM 的实现,它里面的 GC 其实准确分类只有两大种:

部分收集 (Partial GC):

  1. 新生代收集(Minor GC / Young GC):只对新生代进行垃圾收集;
  2. 老年代收集(Major GC / Old GC):只对老年代进行垃圾收集。需要注意的是 Major GC 在有的语境中也用于指代整堆收集;
  3. 混合收集(Mixed GC):对整个新生代和部分老年代进行垃圾收集。

整堆收集 (Full GC): 收集整个 Java 堆和方法区。

空间分配担保

空间分配担保是为了确保在 Minor GC 之前老年代本身还有容纳新生代所有对象的剩余空间。

JDK 6 Update 24 之前,在发生 Minor GC 之前,虚拟机必须先检查老年代最大可用的连续空间是否大于新生代所有对象总空间,如果这个条件成立,那这一次 Minor GC 可以确保是安全的。

如果不成立,虚拟机会先查看 -XX:HandlePromotionFailure 参数的设置值是否允许担保失败(Handle Promotion Failure); 如果允许,那会继续检查老年代最大可用的连续空间是否大于历次晋升到老年代对象的平均大小,如果大于,将尝试进行一次 Minor GC,尽管这次 Minor GC 是有风险的; 如果小于,或者 -XX: HandlePromotionFailure 设置不允许冒险,那这时就要改为进行一次 Full GC。

JDK 6 Update 24 之后的规则变为只要老年代的连续空间大于新生代对象总大小或者历次晋升的平均大小,就会进行 Minor GC,否则将进行 Full GC。

为什么会出现空间分配担保机制呢?

因为 Survivor 区的对象每进行一次 Minor GC 后,存活的对象年龄会加 1 ,如果某些对象的年龄增长到晋升老年代的年龄阈值,这些对象就会进入到老年代中。假设一种极端的情况,新生代的所有对象都集中在 Survivor 区,并且经过某次 Minor GC 后所有的对象都还存活,并且都达到了晋升老年代的年龄阈值,那么就意味着所有的新生代对象都将进入老年代,所以此时老年代必须还有容纳新生代所有对象的剩余空间,这次 Minor GC 才能安全进行。

死亡对象判断方法

堆中几乎存放着所有的对象实例,对堆进行垃圾回收的第一步就是要判断哪些对象已经死亡(即不能再被任何途径使用的对象)。

引用计数器法

给对象添加一个引用计数器

  • 每当有一个地方引用对象,计数器就加 1。;
  • 当某个引用失效,计数器就减 1;
  • 任何时候计数器为 0 的对象就是不可能再被使用的。

这个方法实现简单,效率高,但是目前主流的虚拟机中并没有选择这个算法来管理内存,其最主要的原因是它很难解决对象之间相互循环引用的问题。

所谓对象之间的相互引用问题,如下面代码所示:除了对象 objectA 和 objectB 相互引用着对方之外,这两个对象之间再无任何引用。但是他们因为互相引用对方,导致它们的引用计数器都不为 0,于是引用计数算法无法通知 GC 回收器回收他们。

public class TestA {Object instance = null;public static void main(String[] args) {TestA objectA = new TestA();TestA objectB = new TestA();objectA.instance = objectB;objectB.instance = objectA;}

解释: 此时,objectA 被 objectB 引用,objectB 被 objectA 引用。如果想要回收 objectA 就要先回收 objectB,让 objectB 释放对 objectA 的引用,但是 objectB 又被 objectA 引用,如果想要回收 objectB 就要先回收 objectA,让 objectA 释放对 objectB 的引用。二者之间相互循环引用,这样程序运行结束垃圾回收器也无法回收这两个对象。

可达性分析算法

JVM会从一组称为 “GC Roots” 的根对象开始,递归地遍历所有对象的引用链。在这个过程中被发现的对象都被认为是 “可达的”,即仍然被某些代码所引用,因此应该保留在内存中。而未被发现的对象则被认为是 “不可达的”,即没有任何引用指向它们,因此可以被垃圾回收器清理掉。

下图中的 Object5 ~ Object7 之间虽有引用关系,但它们到 GC Roots 不可达,因此为需要被回收的对象。

垃圾回收面试总结

哪些对象可以作为 GC Roots 呢?

可作为GC Roots的节点主要在全局性的引用(例如常量或类静态属性)与执行上下文(例如栈帧中的本地变量表)中。

  • 虚拟机栈(栈帧中的本地变量表)中引用的对象
  • 本地方法栈(Native 方法)中引用的对象
  • 方法区中类静态属性引用的对象
  • 方法区中常量引用的对象
  • 所有被同步锁持有的对象

详细介绍一下这些GC Roots

  1. 虚拟机栈(栈帧中的本地变量表)中引用的对象:每个线程在运行时都有一个虚拟机栈,其中包含了多个栈帧,每个栈帧代表了一次方法调用。栈帧中的本地变量表可以存储基本类型和对象引用,并且在方法执行过程中会动态变化。只要虚拟机栈中的某个栈帧还在执行,那么该栈帧中的本地变量表中引用的对象就是可达的。

  2. 方法区中的类静态属性引用的对象:类的静态属性存放在方法区中,而且它们的生命周期与类的生命周期相同。如果某个类的静态属性引用了某个对象,那么这个对象就是可达的。

  3. 方法区中常量引用的对象:在Java程序中,字符串字面值、final修饰的基本数据类型和字符串类型的值都可以被看作是常量。如果某个常量引用了某个对象,那么这个对象就是可达的。

  4. JNI(Java Native Interface)中引用的对象:JNI允许Java代码调用本地语言(如C或C++)编写的函数库,也允许本地语言编写的函数库调用Java代码。如果本地代码中引用了某个Java对象,那么这个对象就是可达的。因此,JVM需要跟踪JNI中的引用关系,以确保被引用的对象不会在垃圾回收时被误删。

对象可以被回收,就代表一定会被回收吗?

当一个对象在可达性分析时被判定为不可达对象时,不会马上被回收,还需要进行两次标记。
第一次标记:判断当前对象是否有 finalize() 方法并且该方法没有被执行过,若不存在则标记为垃圾对象,等待回收;若有的话,并且该方法没有被执行,则进行第二次标记;
第二次标记将当前对象放入 F-Queue 队列,并生成一个 finalize 线程去执行该方法,虚拟机不保证该方法一定会被执行,这是因为如果线程执行缓慢或进入了死锁,会导致回收系统的崩溃;
如果执行了 finalize() 方法之后仍然没有与 GC Roots 有直接或者间接的引用,则该对象会被回收。

被引用的对象就一定能存活吗?

不一定,看 Reference 类型,弱引用在 GC (不论内存是否充足) 时会被回收,软引用在内存不足的时候,即 OOM 前会被回收。

引用类型总结

强引用(StrongReference)

以前我们使用的大部分引用实际上都是强引用,这是使用最普遍的引用。如果一个对象具有强引用,那就类似于必不可少的生活用品,垃圾回收器绝不会回收它。当内存空间不足,Java 虚拟机宁愿抛出 OutOfMemoryError 错误,使程序异常终止,也不会靠随意回收具有强引用的对象来解决内存不足问题。

软引用(SoftReference)

如果一个对象只具有软引用,那就类似于可有可无的生活用品。如果内存空间足够,垃圾回收器就不会回收它,如果内存空间不足了,就会回收这些对象的内存。只要垃圾回收器没有回收它,该对象就可以被程序使用。

软引用可用来实现内存敏感的高速缓存。

软引用可以和一个引用队列(ReferenceQueue)联合使用,如果软引用所引用的对象被垃圾回收,JAVA 虚拟机就会把这个软引用加入到与之关联的引用队列中。

弱引用(WeakReference)

如果一个对象只具有弱引用,那就类似于可有可无的生活用品。

弱引用与软引用的区别在于:只具有弱引用的对象的生命周期更加短暂。在垃圾回收器线程扫描它所管辖的内存区域的过程中,一旦发现了只具有弱引用的对象,不管当前内存空间足够与否,都会回收它的内存。

不过,由于垃圾回收器是一个优先级很低的线程, 因此不一定会很快发现那些只具有弱引用的对象。、

弱引用可以和一个引用队列(ReferenceQueue)联合使用,如果弱引用所引用的对象被垃圾回收,Java 虚拟机就会把这个弱引用加入到与之关联的引用队列中。

虚引用(PhantomReference)

"虚引用"顾名思义,就是形同虚设,与其他几种引用都不同,虚引用并不会决定对象的生命周期。如果一个对象仅持有虚引用,那么它就和没有任何引用一样,在任何时候都可能被垃圾回收。

虚引用主要用来跟踪对象被垃圾回收的活动。

虚引用与软引用和弱引用的区别

虚引用必须和引用队列(ReferenceQueue)联合使用。 当垃圾回收器准备回收一个对象时,如果发现它还有虚引用,就会在回收对象的内存之前,把这个虚引用加入到与之关联的引用队列中。
程序可以通过判断引用队列中是否已经加入了虚引用,来了解被引用的对象是否将要被垃圾回收。程序如果发现某个虚引用已经被加入到引用队列,那么就可以在所引用的对象的内存被回收之前采取必要的行动。

特别注意,在程序设计中一般很少使用弱引用与虚引用,使用软引用的情况较多,这是因为软引用可以加速 JVM 对垃圾内存的回收速度,可以维护系统的运行安全,防止内存溢出(OutOfMemory)等问题的产生。

举一些例子 强引用、软引用、弱引用、虚引用

Java中的四种引用类型是:

  1. 强引用(Strong Reference):强引用是最常见的引用类型,通过关键字 “new” 创建的对象默认为强引用。只要某个对象存在强引用,垃圾回收器就不会回收它。例如:
Object obj = new Object(); // obj 是强引用
  1. 软引用(Soft Reference):软引用是一种相对弱化的引用方式,如果一个对象只有软引用与之关联,在内存不足时可以被GC回收。在Java中使用 SoftReference 来表示软引用。例如:
SoftReference<Object> softRef = new SoftReference<>(obj); // obj 对象被软引用关联
  1. 弱引用(Weak Reference):弱引用比软引用更弱化,如果一个对象只有弱引用与之关联,在下次垃圾回收时就会被回收。在Java中使用 WeakReference 来表示弱引用。例如:
WeakReference<Object> weakRef = new WeakReference<>(obj); // obj 对象被弱引用关联
  1. 虚引用(Phantom Reference):虚引用是最弱化的引用方式,一个对象如果只有虚引用与之关联,那么它就和没有任何引用一样,在任何时候都可能被回收。在Java中使用 PhantomReference 来表示虚引用。虚引用主要用于在一个对象被GC回收时收到一个系统通知,用来做一些清理工作。例如:
ReferenceQueue<Object> queue = new ReferenceQueue<>();
PhantomReference<Object> phantomRef = new PhantomReference<>(obj, queue); // obj 对象被虚引用关联

如何判断一个常量是废弃常量?

运行时常量池主要需要回收的是废弃的常量。那么,我们如何判断一个常量是废弃常量呢?

JDK1.7 之前运行时常量池逻辑包含字符串常量池,被存放在方法区, 此时 hotspot 虚拟机对方法区的实现为永久代
JDK1.7 字符串常量池被从方法区拿到了堆中, 这里没有提到运行时常量池,也就是说字符串常量池被单独拿到堆,运行时常量池剩下的东西还在方法区, 
也就是 hotspot 中的永久代 。
JDK1.8 hotspot 移除了永久代用元空间(Metaspace)取而代之, 这时候字符串常量池还在堆, 运行时常量池还在方法区, 
只不过方法区的实现从永久代变成了元空间(Metaspace)。

假如在字符串常量池中存在字符串 “abc”,如果当前没有任何 String 对象引用该字符串常量的话,就说明常量 “abc” 就是废弃常量,如果这时发生内存回收的话而且有必要的话,“abc” 就会被系统清理出常量池了。

如何判断一个类是无用的?

方法区主要需要回收的是无用的类,那么如何判断一个类是无用的类的呢?

要判定一个类是“无用的类”,类需要同时满足下面 3 个条件才能算是 “无用的类” :

  • 该类所有的实例都已经被回收,也就是Java堆中不存在该类的任何实例。
  • 加载该类的 ClassLoader已经被回收。
  • 该类对应的 Java.lang.Class对象没有在任何地方被引用,无法在任何地方通过反射访问该类的方法。