当前位置: 首页 > 知识库问答 >
问题:

如何让Spark output在单独的新行上打印?

周弘盛
2023-03-14

目前,我的spark console打印如下,可读性不强:

我希望它在新行上打印每个结构字段项目,以便更容易阅读。我该怎么办?谢谢。

更新:我实际上在学习本教程(http://www.nodalpoint.com/spark-data-frames-from-csv-files-handling-headers-column-types/),作者可以逐行打印,无需pprint。我想知道他/她是怎么做到的。

共有2个答案

沃念
2023-03-14

我通常使用:

fields.foreach(println)

当您从rdd或数据帧检索数据时,它也可以工作:

myDf.collect().foreach(println)
管和志
2023-03-14

您始终可以像这样使用pprint

import pprint
pprint(fields)

但是如果您尝试打印模式,最好使用DataFrame.printSchema

 类似资料:
  • 问题内容: 结果显示 该代码打印所有单词并计数频率单词的使用。 我想在单独的行中打印字典。 有任何可行的方法吗? 问题答案:

  • 我已经编写了代码来在单独的行上打印整数的数字,但我没有得到预期的输出。相反,代码的输出是相反的顺序。如何在不使用 方法的情况下使输出正确? n = 234 输出为4,3,2 预期输出为2,3,4

  • 问题内容: 如何格式化列表以在单独的行上打印每个元素?例如,我有: 我希望格式化列表,以便它像这样打印: 因此\ n,方括号,逗号和’‘被删除,每个元素都打印在单独的行上,谢谢 问题答案: 您可以使用一个简单的循环:-

  • 问题内容: 我有一个清单清单: 我想要以下格式的输出: 我已经按照以下方式尝试过,但是输出的方式不是理想的: 输出: 在更改打印调用以代替使用时: 输出: 有任何想法吗? 问题答案: 遍历原始列表中的每个子列表,并在打印调用中使用以下命令将其解压缩: 默认情况下,分隔设置为,因此无需显式提供分隔。打印: 在您的方法中,您要遍历每个子列表中的每个元素,并分别进行打印。通过使用您在打印调用中 解压缩

  • 正在尝试使用“main”函数变量更新线程上运行的tkinter“textvariable”。我实现了一个基于线程的解决方案,因此tkinter mainloop后面的代码可以运行:https://stackoverflow.com/a/1835036/15409926. 请分享我如何解决此错误。如果这不是更新“textvariable”的最简单方法,请分享其他方法。 代码: 窗口不更新:Tkint

  • null 大多数文档描述了如何在Kubernetes上运行Spark集群。在Kubernetes上独立运行Spark的方法是什么?