深入理解虚拟机 —— 垃圾收集器

Java与C++之间有一堵由内存动态分配和垃圾收集技术所围成的“高墙”,墙外面的人想进去,墙里面的人却想出来。

判断对象死亡

Java虚拟机中如何判断Java对象死亡,需要回收的呢?

引用计数算法

给对象添加一个计数器,当被引用,就加1,当失效就减一,当计数器为零的时候就是对象不再引用。这种算法实现简单,判断效率也高,但是不能解决之间互相循环引用的问题。

可达性分析算法

通过一系列的称为“GC Roots”的对象作为起始点,从这些节点开始往下搜索,搜索所有走过的路径称为引用链,当一个对象到GC Roots没有任何引用的时候,则证明该对象不可用。

引用

  • 强引用:强引用就是指在程序中普遍存在的,类似 Object obj= new Obj 这类引用,只要强引用还在,垃圾回收期永远不会回收被引用的对象。
  • 软引用:用来描述还有用但并非必需的对象。在系统将要发生内存溢出之前,对这些对象进行二次回收。
  • 弱引用:用来描述非必需的对象但是比软引用强度更弱,被弱引用的关联的对象只能生产到下一次垃圾回收之前。
  • 虚引用:虚引用也称为幽灵引用或者幻影引用,它是最弱的一种引用关系。一个对象是否有虚引用的存在,完全不会对其生存时间构成影响;也无法通过虚引用来取得一个对象实例。为一个对象设置虚引用关联的唯一目的就是能在这个对象被收集器回收时收到个系统通知。

引用队列(ReferenceQueue)

引用队列ReferenceQueue是用来配合引用工作的,没有ReferenceQueue一样可以运行。创建引用的时候可以指定关联的队列,当GC释放对象内存的时候,会将引用加入到引用队列,这相当于是一种通知机制。当关联的引用队列中有数据的时候,意味着引用指向的堆内存中的对象被回收。通过这种方式,JVM允许我们在对象被销毁后,做一些我们自己想做的事情。JVM提供了一个ReferenceHandler线程,将引用加入到注册的引用队列中。

生存还是死亡

即使可达性算法中不可达的对象,也并发是”非死不可“,会暂时处于”缓刑“状态,真要宣告一个对象死亡,至少需要经历两次标记过程:如果对象在进行可达性分析后没有和 GC Roots 相连接的引用链,那它会被第一次标记并进行一次筛选,筛选条件是此对象是否有必要执行finalize()方法。

回收方法区

永久代(在Java8中已经被移除)的垃圾回收集主要回收两部分内容:废弃常量和无用的类。

垃圾收集算法

标记-清除算法

首先标记出所有需要回收的对象,在标记完成后统一回收所有被标记的对象,它的标记过程其实在前一节讲述对象标记判定时已经介绍过了。这是基础算法,别的算法都是在这基础上改进的。
这种算法的缺点:效率不高;会产生大量不连续的内存碎片。

复制算法

复制算法将可用内存按容量划分为大小相等的两块,每次只使用其中的一块,当这块的内存用完了,就将还存活着的对象复制到另外块上面,然后再把已使用过的内存空间一次清理掉。

标记整理算法

根据老年代的特点,有人提出了另外一种“标记-整理”算法,标记过程仍然与“标记-清除”算法一样,但后续步骤不是直接对可回收对象进行清理,而是让所有存活的对象都向一端移动,然后直接清理掉端边界以外的内存。

分代收集算法

当前主流的垃圾收集采用的都是”分代收集算法“,新生代使用复制算法,老年代使用标记-整理/清除算法。
根据对象存活周期将内存划分为新生代和老年代。在新生代中,每次垃圾收集都发送大批对象死去,只有少量存活,就选用复制算法;老年代因为对象存活率高、没有额外空间进行分配担保,使用标记-整理/清除算法。

垃圾收集器

Serial收集器

是一个单线程收集器,它进行垃圾收集时,必须暂停其他所有的工作现场,知道它收集结束。

新生代采用复制算法,老年代采用标记-整理算法

ParNew收集器

ParNew收集器是Serial收集器的多线程版本。

新生代采用复制算法,老年代采用标记-整理算法

Parallel Scavenge收集器

Parallel Scavenge 收集器类似于ParNew 收集器。Parallel Scavenge收集器是一个新时代收集器。使用复制算法,并行的多线程收集器。它的吞吐量非常不错。

新生代采用复制算法,老年代采用标记-整理算法

Serial Old收集器

Serial Old收集器是Serial收集器的老年代版本,使用标记-整理算法

Parallel Old收集器

是Parallel Scavenge收集器老年代的收集器,使用多线程和标记-整理算法

CMS收集器

CMS( Concurrent Mark Sweep)收集器是一种以获取最短回收停顿时间为目标的收集器。目前很大一部分的Java应用集中在互联网站或者B/S系统的服务端上,这类应用尤其重视服务的响应速度,希望系统停顿时间最短,以给用户带来较好的体验。CMS收集器就非常符合这类应用需求。

CMS收集器使用标记-清除算法

运作流程:

  • 初始标记
  • 并发标记
  • 重新标记
  • 并发清除

1、初始标记只是标记一下 GC Roots 能直接关联到对象,速度很快。

2、并发标记是对 GC Roots Tracing的过程

3、重新标记是为了修正并发标记期间,因用户程序继续运行而导致标记产生变换的一部分,这个阶段的停顿时间一般比初始标记阶段长。

4、整个 GC 过程中消耗最长的是并发标记和并发清除过程,但是这两个阶段的垃圾回收可以和用户现场一起并发执行。

总体上说,CMS 收集器的内存回收过程式和用户现场一起执行的。

G1收集器

G1 ( garbage-first)收集器是当今收集器技术发展的最前沿成果之一。

G1 将 Java 堆内存分割成若干相同大小的区域,即 region,包括 Eden、Survivor、Old、Humongous 四种类型。其中 Humongous 是特殊的 Old 类型,专门放置大型对象。这样的划分方式意味着不需要一个连续的内存空间管理对象。G1 将空间分为多个区域,优先回收垃圾最多的区域。G1 采用的是复制算法(‘Mark-Copy’),非常好的空间整理能力,不会产生大量的空间碎片。G1 的一大优势在于可预测的停顿时间,能尽可能快速地在指定时间完成垃圾回收任务。

参考

阅读

博主 wechat
钟意作者
客官,赏一杯coffee嘛~~~~
0%