当前位置: 首页 > 面试题库 >

Spark:如何保存带有标题的数据框?

彭修筠
2023-03-14
问题内容

dataframe.saveasTextFile,仅以定界格式保存数据。如何在JAVA中保存带有标题的数据框。

sourceRufFrame.toJavaRDD().map(new TildaDelimiter()).coalesce(1, true).saveAsTextFile(targetSrcFilePath);

问题答案:

如果您想另存为csv文件,我建议使用spark-csv软件包。您可以使用spark-csv以下带有标头的格式保存数据框。

dataFrame.write
  .format("com.databricks.spark.csv")
  .option("header", "true")
  .option("delimiter",<your delimiter>)
  .save(output)

您可以参考下面的链接,以获取更多信息:https :
//github.com/databricks/spark-csv

Spark-csv 具有Maven依赖性。



 类似资料:
  • 我有以下代码。当我保存它的时候。列的标题不保存。你能给我指路吗?

  • 我正在本地机器中将spark数据集保存为拼花文件。我想知道是否有任何方法可以使用某种加密算法对数据进行加密。我用来将数据保存为拼花文件的代码如下所示。 <代码>数据集。写入()。模式(“覆盖”)。拼花地板 我看到了一个类似的问题,但我的查询不同,因为我正在写入本地磁盘。

  • 我尝试从Socket TCP获取数据以附加到数据帧我收到数据并将它们执行到Seq(),但当我使用foreach将它们附加到数据帧时出现问题这是我的代码: 这是我跑步时的问题 Java语言组织中的lang.NullPointerException。阿帕奇。火花sql。SQLImplicits。localSeqToDatasetHolder(SQLImplicits.scala:231),位于Cl.C

  • 我正在处理一个包含uni_key和createdDate两列的数据帧。我运行一个SQL查询并将结果保存到中,现在我想将这些结果保存到csv文件中。有什么方法可以做到这一点吗?这是一个代码片段: 此代码当前出现以下错误: AttributeError:“DataFrameWriter”对象没有属性“csv”

  • 本文向大家介绍partition 的数据如何保存到硬盘?相关面试题,主要包含被问及partition 的数据如何保存到硬盘?时的应答技巧和注意事项,需要的朋友参考一下 topic 中的多个 partition 以文件夹的形式保存到 broker,每个分区序号从 0 递增, 且消息有序 Partition 文件下有多个 segment(xxx.index,xxx.log) segment 文件里的

  • 问题内容: 我目前正在使用javax.imageio.ImageIO编写PNG文件。我想包括一个tEXt块(以及这里列出的任何块),但是看不到这样做的任何方法。 通过com.sun.imageio.plugins.png.PNGMetadata的外观,这应该是可能的。 对于任何线索或答案,我将不胜感激。 M. 问题答案: 经过一些反编译后我遇到的解决方案如下…