网站开发 小程序开发,长沙服装网站建设,软件商城app下载安装,宁波正规网站建设使用方法之前上学的时候有这个一个梗#xff0c;说在食堂里吃饭#xff0c;吃完把餐盘端走清理的#xff0c;是 C 程序员#xff0c;吃完直接就走的#xff0c;是 Java 程序员。
确实#xff0c;在 Java 的世界里#xff0c;似乎我们不用对垃圾回收那么的专注#xff0c;很多初…
之前上学的时候有这个一个梗说在食堂里吃饭吃完把餐盘端走清理的是 C 程序员吃完直接就走的是 Java 程序员。
确实在 Java 的世界里似乎我们不用对垃圾回收那么的专注很多初学者不懂 GC也依然能写出一个能用甚至还不错的程序或系统。但其实这并不代表 Java 的 GC 就不重要。相反它是那么的重要和复杂以至于出了问题那些初学者除了打开 GC 日志看着一堆0101的天文啥也做不了。
今天我们就从头到尾完整地聊一聊 Java 的垃圾回收。
什么是垃圾回收
垃圾回收Garbage CollectionGC顾名思义就是释放垃圾占用的空间防止内存泄露。有效的使用可以使用的内存对内存堆中已经死亡的或者长时间没有使用的对象进行清除和回收。
Java 语言出来之前大家都在拼命的写 C 或者 C 的程序而此时存在一个很大的矛盾C 等语言创建对象要不断的去开辟空间不用的时候又需要不断的去释放控件既要写构造函数又要写析构函数很多时候都在重复的 allocated然后不停的析构。于是有人就提出能不能写一段程序实现这块功能每次创建释放控件的时候复用这段代码而无需重复的书写呢
1960年基于 MIT 的 Lisp 首先提出了垃圾回收的概念用于处理C语言等不停的析构操作而这时 Java 还没有出世呢所以实际上 GC 并不是Java的专利GC 的历史远远大于 Java 的历史
怎么定义垃圾
既然我们要做垃圾回收首先我们得搞清楚垃圾的定义是什么哪些内存是需要回收的。
引用计数算法 引用计数算法Reachability Counting是通过在对象头中分配一个空间来保存该对象被引用的次数Reference Count。如果该对象被其它对象引用则它的引用计数加1如果删除对该对象的引用那么它的引用计数就减1当该对象的引用计数为0时那么该对象就会被回收。
String m new String(jack);
先创建一个字符串这时候jack有一个引用就是 m。
然后将 m 设置为 null这时候jack的引用次数就等于0了在引用计数算法中意味着这块内容就需要被回收了。
m null; 引用计数算法是将垃圾回收分摊到整个应用程序的运行当中了而不是在进行垃圾收集时要挂起整个应用的运行直到对堆中所有对象的处理都结束。因此采用引用计数的垃圾收集不属于严格意义上的Stop-The-World的垃圾收集机制。
看似很美好但我们知道JVM的垃圾回收就是Stop-The-World的那是什么原因导致我们最终放弃了引用计数算法呢看下面的例子。
public class ReferenceCountingGC {public Object instance;public ReferenceCountingGC(String name){}
}public static void testGC(){ReferenceCountingGC a new ReferenceCountingGC(objA);
ReferenceCountingGC b new ReferenceCountingGC(objB);a.instance b;
b.instance a;a null;
b null;
}1. 定义2个对象2. 相互引用3. 置空各自的声明引用
我们可以看到最后这2个对象已经不可能再被访问了但由于他们相互引用着对方导致它们的引用计数永远都不会为0通过引用计数算法也就永远无法通知GC收集器回收它们。
可达性分析算法
可达性分析算法Reachability Analysis的基本思路是通过一些被称为引用链GC Roots的对象作为起点从这些节点开始向下搜索搜索走过的路径被称为Reference Chain)当一个对象到 GC Roots 没有任何引用链相连时即从 GC Roots 节点到该节点不可达则证明该对象是不可用的。 通过可达性算法成功解决了引用计数所无法解决的问题-“循环依赖”只要你无法与 GC Root 建立直接或间接的连接系统就会判定你为可回收对象。那这样就引申出了另一个问题哪些属于 GC Root。
Java 内存区域
在 Java 语言中可作为 GC Root 的对象包括以下4种
虚拟机栈栈帧中的本地变量表中引用的对象方法区中类静态属性引用的对象方法区中常量引用的对象本地方法栈中 JNI即一般说的 Native 方法引用的对象1、虚拟机栈栈帧中的本地变量表中引用的对象 此时的 s即为 GC Root当s置空时localParameter 对象也断掉了与 GC Root 的引用链将被回收。
public class StackLocalParameter {
public StackLocalParameter(String name){}
}public static void testGC(){
StackLocalParameter s new StackLocalParameter(localParameter);
s null;
}2、方法区中类静态属性引用的对象 s 为 GC Roots 置为 null经过 GC 后s 所指向的 properties 对象由于无法与 GC Root 建立关系被回收。
而 m 作为类的静态属性也属于 GC Rootparameter 对象依然与 GC root 建立着连接所以此时 parameter 对象并不会被回收。
public class MethodAreaStaicProperties {
public static MethodAreaStaicProperties m;
public MethodAreaStaicProperties(String name){}
}public static void testGC(){
MethodAreaStaicProperties s new MethodAreaStaicProperties(properties);
s.m new MethodAreaStaicProperties(parameter);
s null;
}3、方法区中常量引用的对象 m 即为方法区中的常量引用也为 GC Roots 置为 null 后final 对象也不会因没有与 GC Root 建立联系而被回收。
public class MethodAreaStaicProperties {
public static final MethodAreaStaicProperties m MethodAreaStaicProperties(final);
public MethodAreaStaicProperties(String name){}
}public static void testGC(){
MethodAreaStaicProperties s new MethodAreaStaicProperties(staticProperties);
s null;
}4、本地方法栈中引用的对象 任何 native 接口都会使用某种本地方法栈实现的本地方法接口是使用 C 连接模型的话那么它的本地方法栈就是 C 栈。当线程调用 Java 方法时虚拟机会创建一个新的栈帧并压入 Java 栈。然而当它调用的是本地方法时虚拟机会保持 Java 栈不变不再在线程的 Java 栈中压入新的帧虚拟机只是简单地动态连接并直接调用指定的本地方法。 怎么回收垃圾
在确定了哪些垃圾可以被回收后垃圾收集器要做的事情就是开始进行垃圾回收但是这里面涉及到一个问题是如何高效地进行垃圾回收。由于Java虚拟机规范并没有对如何实现垃圾收集器做出明确的规定因此各个厂商的虚拟机可以采用不同的方式来实现垃圾收集器这里我们讨论几种常见的垃圾收集算法的核心思想。
标记 --- 清除算法 标记清除算法Mark-Sweep是最基础的一种垃圾回收算法它分为2部分先把内存区域中的这些对象进行标记哪些属于可回收标记出来然后把这些垃圾拎出来清理掉。就像上图一样清理掉的垃圾就变成未使用的内存区域等待被再次使用。
这逻辑再清晰不过了并且也很好操作但它存在一个很大的问题那就是内存碎片。
上图中等方块的假设是 2M小一些的是 1M大一些的是 4M。等我们回收完内存就会切成了很多段。我们知道开辟内存空间时需要的是连续的内存区域这时候我们需要一个 2M的内存区域其中有2个 1M 是没法用的。这样就导致其实我们本身还有这么多的内存的但却用不了。
复制算法 复制算法Copying是在标记清除算法上演化而来解决标记清除算法的内存碎片问题。它将可用内存按容量划分为大小相等的两块每次只使用其中的一块。当这一块的内存用完了就将还存活着的对象复制到另外一块上面然后再把已使用过的内存空间一次清理掉。保证了内存的连续可用内存分配时也就不用考虑内存碎片等复杂情况逻辑清晰运行高效。
上面的图很清楚也很明显的暴露了另一个问题合着我这140平的大三房只能当70平米的小两房来使代价实在太高。
标记整理算法 标记整理算法Mark-Compact标记过程仍然与标记 --- 清除算法一样但后续步骤不是直接对可回收对象进行清理而是让所有存活的对象都向一端移动再清理掉端边界以外的内存区域。
标记整理算法一方面在标记-清除算法上做了升级解决了内存碎片的问题也规避了复制算法只能利用一半内存区域的弊端。看起来很美好但从上图可以看到它对内存变动更频繁需要整理所有存活对象的引用地址在效率上比复制算法要差很多。
分代收集算法分代收集算法Generational Collection严格来说并不是一种思想或理论而是融合上述3种基础的算法思想而产生的针对不同情况所采用不同算法的一套组合拳。对象存活周期的不同将内存划分为几块。一般是把 Java 堆分为新生代和老年代这样就可以根据各个年代的特点采用最适当的收集算法。在新生代中每次垃圾收集时都发现有大批对象死去只有少量存活那就选用复制算法只需要付出少量存活对象的复制成本就可以完成收集。而老年代中因为对象存活率高、没有额外空间对它进行分配担保就必须使用标记-清理或者标记 --- 整理算法来进行回收。so另一个问题来了那内存区域到底被分为哪几块每一块又有什么特别适合什么算法呢
内存模型与回收策略 Java 堆Java Heap是JVM所管理的内存中最大的一块堆又是垃圾收集器管理的主要区域这里我们主要分析一下 Java 堆的结构。
Java 堆主要分为2个区域-年轻代与老年代其中年轻代又分 Eden 区和 Survivor 区其中 Survivor 区又分 From 和 To 2个区。可能这时候大家会有疑问为什么需要 Survivor 区为什么Survivor 还要分2个区。不着急我们从头到尾看看对象到底是怎么来的而它又是怎么没的。
Eden 区
IBM 公司的专业研究表明有将近98%的对象是朝生夕死所以针对这一现状大多数情况下对象会在新生代 Eden 区中进行分配当 Eden 区没有足够空间进行分配时虚拟机会发起一次 Minor GCMinor GC 相比 Major GC 更频繁回收速度也更快。
通过 Minor GC 之后Eden 会被清空Eden 区中绝大部分对象会被回收而那些无需回收的存活对象将会进到 Survivor 的 From 区若 From 区不够则直接进入 Old 区。
Survivor 区
Survivor 区相当于是 Eden 区和 Old 区的一个缓冲类似于我们交通灯中的黄灯。Survivor 又分为2个区一个是 From 区一个是 To 区。每次执行 Minor GC会将 Eden 区和 From 存活的对象放到 Survivor 的 To 区如果 To 区不够则直接进入 Old 区。
1、为啥需要
不就是新生代到老年代么直接 Eden 到 Old 不好了吗为啥要这么复杂。想想如果没有 Survivor 区Eden 区每进行一次 Minor GC存活的对象就会被送到老年代老年代很快就会被填满。而有很多对象虽然一次 Minor GC 没有消灭但其实也并不会蹦跶多久或许第二次第三次就需要被清除。这时候移入老年区很明显不是一个明智的决定。
所以Survivor 的存在意义就是减少被送到老年代的对象进而减少 Major GC 的发生。Survivor 的预筛选保证只有经历16次 Minor GC 还能在新生代中存活的对象才会被送到老年代。
2、为啥需要俩
设置两个 Survivor 区最大的好处就是解决内存碎片化。
我们先假设一下Survivor 如果只有一个区域会怎样。Minor GC 执行后Eden 区被清空了存活的对象放到了 Survivor 区而之前 Survivor 区中的对象可能也有一些是需要被清除的。问题来了这时候我们怎么清除它们在这种场景下我们只能标记清除而我们知道标记清除最大的问题就是内存碎片在新生代这种经常会消亡的区域采用标记清除必然会让内存产生严重的碎片化。因为 Survivor 有2个区域所以每次 Minor GC会将之前 Eden 区和 From 区中的存活对象复制到 To 区域。第二次 Minor GC 时From 与 To 职责兑换这时候会将 Eden 区和 To 区中的存活对象再复制到 From 区域以此反复。
这种机制最大的好处就是整个过程中永远有一个 Survivor space 是空的另一个非空的 Survivor space 是无碎片的。那么Survivor 为什么不分更多块呢比方说分成三个、四个、五个?显然如果 Survivor 区再细分下去每一块的空间就会比较小容易导致 Survivor 区满两块 Survivor 区可能是经过权衡之后的最佳方案。
Old 区
老年代占据着2/3的堆内存空间只有在 Major GC 的时候才会进行清理每次 GC 都会触发“Stop-The-World”。内存越大STW 的时间也越长所以内存也不仅仅是越大就越好。由于复制算法在对象存活率较高的老年代会进行很多次的复制操作效率很低所以老年代这里采用的是标记 --- 整理算法。
除了上述所说在内存担保机制下无法安置的对象会直接进到老年代以下几种情况也会进入老年代。
1、大对象
大对象指需要大量连续内存空间的对象这部分对象不管是不是“朝生夕死”都会直接进到老年代。这样做主要是为了避免在 Eden 区及2个 Survivor 区之间发生大量的内存复制。当你的系统有非常多“朝生夕死”的大对象时得注意了。
2、长期存活对象
虚拟机给每个对象定义了一个对象年龄Age计数器。正常情况下对象会不断的在 Survivor 的 From 区与 To 区之间移动对象在 Survivor 区中没经历一次 Minor GC年龄就增加1岁。当年龄增加到15岁时这时候就会被转移到老年代。当然这里的15JVM 也支持进行特殊设置。
3、动态对象年龄
虚拟机并不重视要求对象年龄必须到15岁才会放入老年区如果 Survivor 空间中相同年龄所有对象大小的综合大于 Survivor 空间的一般年龄大于等于该年龄的对象就可以直接进去老年区无需等你“成年”。
这其实有点类似于负载均衡轮询是负载均衡的一种保证每台机器都分得同样的请求。看似很均衡但每台机的硬件不通健康状况不同我们还可以基于每台机接受的请求数或每台机的响应时间等来调整我们的负载均衡算法。
原文链接 本文为云栖社区原创内容未经允许不得转载。