当前位置: 首页 > 知识库问答 >
问题:

在带有Apache Beam的GCP DataflowRunner上没有名为“IPython”的模块

蔚和风
2023-03-14

我在Jupyter笔记本中设置了一个相当简单的Python Apache Beam管道,并希望将其部署到Dataflow Runner中。我对这三个都很熟悉!我使用的是Python 3和Apache Beam2.27.0内核。

我的管道选项如下所示:

options.view_as(GoogleCloudOptions).project = 'inspired-studio-11111'
options.view_as(GoogleCloudOptions).job_name = 'Dataflow Test Job2' + jobid
options.view_as(GoogleCloudOptions).region = 'us-central1'
options.view_as(GoogleCloudOptions).staging_location = 'gs://bucket/staging'
options.view_as(GoogleCloudOptions).temp_location = 'gs://bucket/temp'
options.view_as(SetupOptions).save_main_session = True

来自worker的错误消息:Traceback(最近的调用为last):文件“/usr/local/lib/python3.7/site-packages/dataflow_worker/batchworker.py”,第771行,在run self._load_main_session(self.local_staging_directory)文件“/usr/local/lib/python3.7/site-packages/dataflow_worker/batchworker.py”中,第512行,在_load_main_session.load_session(file_path)文件“/usr/local/lib/python3.7/site-packages/dill/_dill.py”,第368行,在load_session module=unpickler.load()文件“/usr/local/lib/python3.7/site-packages/dill/_dill.py”中,第472行,在load obj=stockunpickler.load(self)文件“/usr/local/lib/python3.7/site-packages/dill/_dill.py”中,在find_class

在我的笔记本中安装和导入ipython没有帮助。这是否需要在GCP VM上进行配置

共有1个答案

姬雪松
2023-03-14

该错误通常是由使用save_main_session=true选项引起的。请参见使用Apache Beam笔记本启动数据流作业时处理名称错误,以讨论确保工作人员在运行时有正确代码的其他方法。

 类似资料:
  • 嗨,我正在学习线性代数与python的Edx课程。(http://nbviewer.ipython.org/github/ULAFF/notebooks/tree/may-14-2014/). 在第一个框中的“02.4.2.10矩阵向量乘法练习”中,代码为: 生成问题是Edx教授创建的一个模块。但是,我在导入Symphy时出错。 我得到的错误如下: 我下载并安装了症状,如果我导入,它可以在终端(苹

  • 问题内容: 我正在将Django应用程序部署到开发服务器,并且在运行时遇到此错误: 似乎与一起分发。最初,我认为这可能不会安装到virtualenv中的Python,所以我使用以下命令将了(与Python相同的版本)安装到virtualenv 中的Python站点软件包: 编辑:这只发生在virtualenv内部。如果我在virtualenv外部打开控制台,则该控制台存在,但仍然出现相同的错误。

  • 问题内容: 我有这个问题: 我已经安装了PIL,但仍然无法正常工作。我使用OSX。 我正在尝试为Django Simple Captcha安装此模块。 问题答案: 克里斯托弗的建议对我来说非常有效。 详细信息如下:1.卸载现有的Python Imaging Library 下载并解压缩源版本(从此处 http://effbot.org/downloads/Imaging-1.1.6.tar.gz)

  • 问题内容: 卸载旧的Django版本后,我已经更新到最新的Django版本1.0.2。但是现在当我运行django-admin.py时,出现以下错误。我该如何解决? 问题答案: 你必须确保django在你的PYTHONPATH中。 要进行测试,只需在python shell中执行即可。应该没有输出: 如果你安装的Django通过(或与附带的),然后在你检查site-packages,如果文件(.)

  • 问题内容: 我正在使用Python 2.5.4版并安装MySQL 5.0版和Django。Django在Python上运行良好,但在MySQL上运行良好。我在Windows Vista中使用它。 问题答案: 你需要使用以下命令之一。哪一个取决于你拥有和使用的操作系统和软件。 easy_install mysql-python(混合OS) pip安装mysql-python(mix os / pyt

  • 问题内容: 在尝试验证tensorflow-gpu的安装时,尝试执行“将tensorflow作为tf导入”时出现了ImportError。我在Windows 7上使用Quadro K620。Tensorflow使用pip安装。 以下是堆栈跟踪: 我看过其他多个堆栈溢出帖子,例如纠正路径之类的内容,但我无法解决此问题。 问题答案: 我今天遇到了同一问题,请改用Windows的cuDNN v5.1库,