问题：

Parquet write OutOfMemorySpark 上的异常

长孙燕七

2023-03-14

我有大约800万行500列的数据。当我试图用spark将它作为一个文件< code>coalesce(1)编写时，它失败了，并出现< code > out of memory exception 。

我知道这是一个执行器上的大量数据，但就我理解parquet的写入过程而言，它只在内存中保存一个行组的数据，然后将其刷新到磁盘，然后继续下一个。

我的执行器有16gb的内存，不能再增加了。数据包含很多字符串。

所以我感兴趣的是，我可以调整为宽桌子编写大拼花文件的过程的一些设置。

我知道我可以启用/禁用字典，增加/减少块和页面大小。

但是对于我的需求来说，什么是好的配置呢？

共有1个答案

余弘新

2023-03-14

我不认为拼花地板是真正导致失败的原因，调整它的配置可能不会有帮助。

coalesce（1）是一个影响所有上游代码的激烈操作。结果，所有的处理都在一个节点上完成，按照你自己的话说，你的资源已经非常有限了。

您没有提供有关管道其余部分的任何信息，但如果您想继续使用Spark，您最大的希望是将coalesce替换为re

类似资料：

docx4j上的jaxp_feature_not_supported异常

我正在尝试在我的项目中使用docx4j。（我在这方面还是个新手。）我只是尝试从这个链接运行示例代码。 http://www.smartjava.org/content/create-complex-word-docx-documents-programatically-docx4j 输入是。docx文件，输出也是一个. docx文件。这是控制台在尝试读取我的模板文件时给我的信息：此处的环境列
net.sf.jasperreports.engine.util.JRStyledTextParser上的JasperReports NoClassDefFoundError异常

问题内容：尝试在WebLogic 11g上导出时，它将引发NoClassDefFound异常。我检查了应用程序WAR，并将jasperreports-3.7.4.jar包含在WEB-INF / lib文件夹中。有什么错误？堆栈跟踪 java.lang.NoClassDefFoundError：net / sf.jasperreports.engine.fill.JRBaseFiller。（JR
简单HelloWorld上的异常

我写了一个简单的Hello World程序：名为“HelloWorld.java”。然后我使用“javac HelloWorld.java”从cmd编译它，并获得类文件。运行命令“java-Xdiag HelloWorld”后，出现以下错误：有人知道为什么会这样吗？操作系统是W10，我安装了jdk 11.0.1版<谢谢。
.setOnClickListener上的空指针异常

问题内容：我在登录模式提交按钮的单击侦听器中遇到问题。这是错误。我对什么是空指针异常有一个合理的了解，并且已经彻底搜索了一个类似于我的问题。我试图以几种方式重新格式化点击侦听器，确保我具有正确的视图ID等。显然，还有更多但与我认为无关的话题。这是带有按钮的对话框的XML文件。任何帮助将不胜感激。问题答案：是因为它不属于当你调用内部的，它要寻找一个你的活动的布局中。试试这个代替：
JMS ConnectionFactory上的WebLogic NameNotFound异常

我正在使用WebLogic服务器：12.1.1.0，Spring 3.2.11。2.13.4。我的WebLogic上有一个ConnectionFactory。JNDI名称是：。我使用servlet打印服务器中的所有JNDI名称，并在子上下文中找到它。 Spring配置为：我得到了一个错误： GRAVE：无法刷新目的地CamelTest的JMS Connection-在5000毫秒内重试。原因：
同步方法上的异常

我正在处理来自TCP套接字的大量事件（每秒10个套接字），因此我使用多线程来处理这些事件。大多数情况下，这是正确的，但有时会出现这些事件的雪崩，有时我会得到一个ConcurrentModificationException： 12-10 14:08:42.071：E/AndreidRuntime（28135）：致命例外：线程-369 12-10 14:08:42.071：E/AndreidRun

Parquet write OutOfMemorySpark 上的异常

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档