gc root的基本解释

首先我们要理解一下GC root究竟是什么东西。

gc root

堆是被我们垃圾回收所管理的内存空间。如图，存在两种引用，一种是堆外对象对堆内对象的引用，被标注为红色；另外一种是堆内对象之间的引用，被标注为灰色。通常我们说的gc root就可以被认为是红色的那种引用，比如说栈引用堆中对象。为什么我们不认为堆内对象之间的引用是gc root呢？因为我们的对象，最终是要被外部使用的，比如说被栈引用所访问。因此，如果一大堆的堆内对象之间互相引用，但是没有任何堆外部引用，那么这部分对象实际上也是不可达的。HotSpot就是如此的，所有的堆中的对象，最终都是被栈所使用的。因而，U和V就可以看做是不可达的对象了。

分代和跨代引用

解释了gc root的基本概念后，我们要来看看分代理论了。基本上，现代垃圾回收器都是分代垃圾回收器，它建立在两个分代理论之上：

弱分代假说（weak generational hypothesis）：大多数对象在年轻的时候死亡；
强分代假说（strong generational hypothesis）：越老的对象越难死亡；

这个分代假说引申出一种垃圾回收理念：将对象依据“年龄”分配到不同的区域，每次回收只回收其中的一个区域。这也就是分代回收的基础理念。因为很显然的，如果大部分对象都是朝生夕死的，那么将它们放在一起，每次回收都能够回收到很多的空间；剩下的不容易死亡的对象，放在一起，那么可以以一种极为低的频率来回收它们。这就兼顾了垃圾回收的时间开销和内存的空间利用率。

一般的垃圾回收算法至少会划分出两个年代，年轻代和老年代。但是单纯的分代理论在垃圾回收的时候存在一个巨大的缺陷：为了找到年轻代中的存活对象，却不得不遍历整个老年代，反过来也是一样的。

跨代引用引起老年代的遍历

如果我们从年轻代开始遍历，那么可以断定N, S, P, Q都是存活对象。但是，V却不会被认为是存活对象，其占据的内存会被回收了。这就是一个惊天的大漏洞！因为U本身是老年代对象，而且有外部引用指向它，也就是说U是存活对象，而U指向了V，也就是说V也应该是存活对象才是！而这都是因为我们只遍历年轻代对象！

所以，为了解决这种跨代引用的问题，最笨的办法就是遍历老年代的对象，找出这些跨代引用来。这种方案存在极大的性能浪费。因为从两个分代假说里面，其实隐含了一个推论：跨代引用是极少的。也就是为了找出那么一点点跨代引用，我们却得遍历整个老年代！从上图来说，很显然的是，我们根本不必遍历R。

因此，为了避免这种遍历老年代的性能开销，通常的分代垃圾回收器会引入一种称为记忆集的技术。简单来说，记忆集就是用来记录跨代引用的表。