当前位置: 首页 > 知识库问答 >
问题:

改进PySpark DataFrame.show输出以适合Jupyter笔记本

白晋鹏
2023-03-14

在Jupyter笔记本中使用PySpark,Spark的数据帧的输出。与熊猫数据帧的显示方式相比,show的技术含量较低。我想“好吧,它很管用”,直到我得到这个:

输出未根据笔记本的宽度进行调整,因此线条以难看的方式缠绕。有没有办法定制这个?更好的是,有没有一种方法可以获得输出Pandas样式(显然不转换为Pandas.DataFrame)?

共有3个答案

东门航
2023-03-14

你可以使用一个html魔法命令。通过检查输出单元来检查CSS选择器是否正确。然后相应地在下面编辑并在单元格中运行它。

%%html
<style>
div.output_area pre {
    white-space: pre;
}
</style>
陈增
2023-03-14

在摆弄了我的表(表中有很多列)之后,我决定最好使用:

df.show(n=5, truncate=False, vertical=True)

它垂直显示,没有截断,是我能想到的最干净的视图。

单于庆
2023-03-14

现在,通过将spark.sql.repl.eagerEval.enabled设置为True,可以在Spark 2.4.0中实现这一点:

 类似资料:
  • 我正在使用jupyter笔记本编写代码,但我面临一个问题,每次运行程序时都必须运行所有代码。 有没有办法从我停止跑步的地方开始节省时间?尤其是因为我的代码需要大约4个小时才能运行。

  • 问题内容: 我想为Jupyter笔记本中的班级写一份报告。我想计算一些东西,生成一些结果,并将它们包括在markdown中。我可以将单元格的输出设置为降价吗? 我想要这样的命令:生成phi符号,就像在markdown中一样。 换句话说,我想在markdown中制作一个模板,并插入由笔记本中编写的程序生成的值。重新计算笔记本应生成新结果,并插入新值并进行新的减价。使用此软件是否可能,或者我需要自己替

  • 问题内容: 我正在研究Jupyter Notebook,并希望通过使用Google GPU使其运行更快。我已经进行了一些研究并找到了解决方案,但是它对我没有用。 解决方案是: “最简单的方法是使用Connect to Local Runtime, 然后选择硬件加速器作为GPU,如Google Colab Free GPU Tutorial中所示 。” 我确实设法将googe colab连接到jup

  • 问题内容: 我正在尝试在Jupyter笔记本中使用进度条。这是一台新计算机,我通常无法正常工作: 产生以下文本输出,并且不显示任何进度条 同样,此代码: 产生以下文本输出: 我缺少让Jupyter显示这些进度条的设置吗? 问题答案: 答案在GitHub问题中。 关键是要确保使用以下命令启用笔记本扩展: 您还需要安装JupyterLab扩展: 编辑: 作为中提到的文档以及一些下面的意见,安装Jupy

  • 当我打开Jupyter笔记本(以前是IPython)时,它默认为。 我如何将此更改为其他位置?

  • 我使用的Macbook与OS Sierra,并运行Python 3.6.1和Jupyter笔记本服务器5.0.0我安装了Jupyter笔记本扩展,按照说明https://github.com/ipython-contrib/jupyter_contrib_nbextensions 虽然笔记本在我的系统上工作正常,但我无法查看nbextensions选项卡。下面是我在terminal中运行jupyt