当前位置: 首页 > 知识库问答 >
问题:

如何从jupyter笔记本中访问pyspark

澹台俊晖
2023-03-14

我在Ubuntu14.04上的ipython笔记本上成功地使用了pyspark[与python 2.7],为spark创建了一个特殊的配置文件,并通过调用$ipython笔记本--profile spark启动了笔记本。创建spark配置文件的机制在许多网站上都给出了,但我使用了这里给出的一个。

$home/.ipython/profile_spark/startup/00-pyspark-setup.py包含以下代码

import os
import sys
# Configure the environment
if 'SPARK_HOME' not in os.environ:
    os.environ['SPARK_HOME'] = '/home/osboxes/spark16'
# Create a variable for our root path
SPARK_HOME = os.environ['SPARK_HOME']
# Add the PySpark/py4j to the Python Path
sys.path.insert(0, os.path.join(SPARK_HOME, "python", "build"))
sys.path.insert(0, os.path.join(SPARK_HOME, "python"))

有人能帮我处理我需要放入这个文件的配置参数吗?还是有替代的解决方案?我尝试了这里解释的findshark(),但无法使其工作。安装了Findspark,但Findspark.init()失败,可能是因为它是为python 3编写的。

我面临的挑战是,在我的机器上旧的ipython安装上一切都很好,但我的学生从零开始安装一切,他们无法在他们的VM上运行pyspark。

共有1个答案

壤驷子安
2023-03-14

我在~/apps/spark-1.6.2-bin-hadoop2.6/bin/pyspark本地使用spark只是为了测试目的

PYSPARK_DRIVER_PYTHON=jupyter PYSPARK_DRIVER_PYTHON_OPTS="notebook"   ~/apps/spark-1.6.2-bin-hadoop2.6/bin/pyspark
 类似资料:
  • 我通常访问Jupyter笔记本运行在Linux从Mac OS X通过端口转发如下: https://coderwall.com/p/ohk6cg/remote-access-to-ipython-notebooks-via-ssh 有没有可能在Windows10而不是Mac OS上做类似的事情?我猜油灰或WSL提供一个。 https://www.akadia.com/services/ssh_pu

  • 因此,我试图从远程pc连接到我的jupyter笔记本,因为我自己的pc没有全局IP,我必须首先连接到本地网络(服务器1)中的另一台pc,然后通过ssh连接到我自己的pc,并在其上运行jupyter(服务器2),所以类似这样: 我的笔记本电脑- 我曾经这样做,当两个服务器Linux这样: 在我的笔记本电脑上: 在服务器1上: 在服务器2上: 但是现在我的服务器2是一台windows pc,我的jup

  • 问题内容: 我正在研究Jupyter Notebook,并希望通过使用Google GPU使其运行更快。我已经进行了一些研究并找到了解决方案,但是它对我没有用。 解决方案是: “最简单的方法是使用Connect to Local Runtime, 然后选择硬件加速器作为GPU,如Google Colab Free GPU Tutorial中所示 。” 我确实设法将googe colab连接到jup

  • 我一直试图在Jupyter笔记本上显示gif,但遇到了一些麻烦。我一直得到一个空白的图像文件。 我已经尝试使用这个GitHub存储库中的html。 而且 以上这些到目前为止都没有奏效。 谢谢

  • 我在Microsoft Azure上部署了一个HDInsight 3.6 Spark(2.3)集群,使用标准配置(位置=美国中部,头节点=D12 v2(x2)-8个核心,工作节点=D13 v2(x4))-32个核心)。 在这方面有什么帮助吗

  • 我正在使用Jupyter笔记本编写Python 2代码。我将其调用为: 同时,我使用IPython控制台,启动时使用: 我的问题是,Jupyter历史被保存,并且与IPython历史混合在一起。我根本不想要Jupyter笔记本的历史记录-有没有办法禁用它,同时保留IPython**历史记录? 平台:win32 更新: 我尝试过使用建议的设置摘要方法。但是,当我在配置中输入“c.Session.di