当前位置: 首页 > 面试题库 >

可选的GC开销 在Java中

长孙德惠
2023-03-14
问题内容

我们都知道,用Java分配的每个对象都增加了以后的垃圾回收周期的权重,并且Optional<T>对象没有什么不同。我们经常使用这些对象来包装可为空的对象,这将导致代码更安全,但是要花多少钱呢?

是否有人知道可选对象添加了什么样的附加GC压力与仅返回空值以及这对高通量系统的性能有什么样的影响?


问题答案:

我们都知道,用Java分配的每个对象都会在未来的垃圾回收周期中增加权重,…

这听起来像是一条没人能否认的声明,但是让我们看一下垃圾收集器的实际工作,考虑现代JVM的常见实现以及分配的对象对其的影响,尤其是像Optional实例之类的对象,这些对象通常是临时性的。

垃圾收集器的首要任务是识别仍然存在的对象。“垃圾收集器”这个名称着重于识别垃圾,但是垃圾被定义为无法访问的对象,而找出哪些对象无法访问的唯一方法是通过消除过程。因此,第一个任务是通过遍历和标记所有可到达的对象来解决。因此,此过程的成本不取决于分配的对象的总数,而仅取决于仍可实现的对象。

第二项任务是使垃圾内存可用于新分配。所有现代垃圾收集器都通过撤离完整区域,将带有该内存的所有活动对象转移到新位置并调整引用来工作,而不是困扰仍然可以访问的对象之间的内存缺口。在此过程之后,整个块可将内存用于新分配。因此,这又是一个过程,其成本不取决于分配的对象的总量,而仅取决于仍然存在的对象(的一部分)。

因此,Optional如果在两个垃圾回收周期之间分配和放弃该对象,那么临时对象之类的对象可能根本不会对实际垃圾回收过程造成任何费用。

一口气,当然。每次分配都会减少可用于后续分配的内存,直到没有剩余空间并且必须进行垃圾回收为止。因此,可以说,每次分配都会减少两次垃圾回收运行之间的时间,方法是分配空间的大小除以对象大小。这不仅很小,而且还仅适用于单线程方案。

在像Hotspot
JVM这样的实现中,每个线程都为新对象使用线程本地分配缓冲区(TLAB)。一旦TLAB装满,它将从分配空间(又名Eden空间)中获取一个新的。如果没有可用的,将触发垃圾回收。现在,不太可能所有线程同时到达其TLAB的末端。因此,对于此时仍在其TLAB中剩余空间的其他线程,如果它们分配了更多仍适合该剩余空间的对象,则不会有任何区别。

可能令人惊讶的结论是, 并非每个 分配的对象 都会 对垃圾回收产生影响,即由线程分配的不触发下一个gc的纯本地对象可能是完全空闲的。

当然,这不适用于分配大量对象。大量分配它们会导致线程分配更多的TLAB,并最终比没有时更早触发垃圾回收。这就是为什么我们有这样的类,如IntStream允许处理大量元素而无需分配对象的原因(如会发生这种情况)Stream<Integer>,而将结果作为单个OptionalInt实例提供则没有问题。众所周知,单个临时对象对gc的影响很小(如果有的话)。

如果Escape Analysis已证明对象纯粹是本地的,那么这甚至没有触及JVM的优化器,后者可以消除热点中的对象分配。



 类似资料:
  • 我正在尝试预处理一个大的txt文件(10G),并将其存储在二进制文件中以备将来使用。当代码运行时,速度会减慢,并以 异常线程"main"java.lang.OutOfMemoryError: GC开销限制超过 输入文件具有以下结构 这是我正在使用的代码: 基本上,它通过in文件并将数据存储到对象HMbicnt(这是一个哈希映射)。一旦在第二列中遇到新值,它应该将对象写入输出文件,释放内存并继续。

  • 我建立了一个neo4j图。大小约为5 GB。当我想通过使用类似这样的密码查询向每个节点添加一个关系时,我会得到错误。我不想为Neo4J增加内存。有什么方法可以一步一步地更新节点吗?比如,先有5000个节点,然后再有5000个节点...或者你对此有什么其他建议?

  • 我试图用火花处理10GB的数据,它给了我这个错误, Java语言lang.OutOfMemoryError:超出GC开销限制 笔记本电脑配置为:4CPU,8个逻辑内核,8GB RAM 提交Spark作业时进行Spark配置。 在网上搜索了这个错误后,我有几个问题 如果回答,那将是一个很大的帮助。 1) Spark是内存计算引擎,用于处理10 gb的数据,系统应具有10 gb的RAM。Spark将1

  • 在Android Studio的一些更新之后,我无法构建签名的APK,因为它失败了,“超出了GC开销限制”。我试图补充 dexOptions{javaMaxHeapsize"4g"} 但这没用。还有其他解决方法吗?

  • 当我执行我的测试时,我得到了这个错误消息: 我知道什么是,但GC开销限制意味着什么?我怎样才能解决这个问题?