当前位置: 首页 > 知识库问答 >
问题:

停止群集后,无法在Google Cloud Dataproc群集上重新打开Jupyter笔记本电脑

管峻
2023-03-14

我使用Google Cloud Dataproc运行Jupyter笔记本(按照以下说明:https://cloud.google.com/dataproc/docs/tutorials/jupyter-notebook).

我运行了一个笔记本,保存了它,然后在稍后的某个时候,停止了集群(使用图形用户界面)。然后后来我重新启动集群,并试图运行Jupyter笔记本再次与相同的说明,但在最后一步,当我试图打开Jupyter在Chrome我得到:

"This site can't be reached. The webpage at http://<my-cluster-name>:8123/ might be temporarily down or it may have moved permanently to a new web address. ERR_SOCKS_CONNECTION_FAILED." 

此外(我不知道这是否有帮助)在我配置浏览器的终端窗口中,我有一条消息:

ERROR:child_thread_impl.cc(762)] Request for unknown Channel-associated interface: ui::mojom::GpuMain  
Google Chrome[695:8548] NSWindow warning: adding an unknown subview: <FullSizeContentView: 0x7fdfd3e291e0>. Break on NSLog to debug.  
Google Chrome[695:8548] Call stack:
(
"+callStackSymbols disabled for performance reasons"
)

在通过ssh连接到集群的终端窗口中,我有以下消息:

channel 3: open failed: connect failed: Connection refused  
channel 4: open failed: connect failed: Connection refused  
channel 5: open failed: connect failed: Connection refused    
channel 6: open failed: connect failed: Connection refused   
channel 12: open failed: connect failed: Connection refused   
channel 12: open failed: administratively prohibited: open failed  
channel 13: open failed: administratively prohibited: open failed  
channel 14: open failed: administratively prohibited: open failed  
channel 14: open failed: connect failed: Connection refused  
channel 8: open failed: connect failed: Connection refused  

此外,在我停止集群之前,我可以关闭jupyter笔记本,断开与集群的连接,并重新打开jupyter笔记本。我只是在停止集群后才遇到这个问题。知道会发生什么吗?

共有2个答案

蓬宾白
2023-03-14

我通过使用ssh连接到主机修复了这个问题,并创建了一个systemd服务(遵循dennis Hou的上述评论)。

>

[Unit]
Description=Start Jupyter Notebook Server at reboot

[Service]
Type=simple
ExecStart=/opt/conda/bin/jupyter notebook --allow-root  --no-browser

[Install]
WantedBy=multi-user.target

System ctl守护程序-重装

下一步是将上述代码包含到dataproc初始化操作中。希望有帮助。

阎卓
2023-03-14

这是因为当前的初始化操作显式启动jupyter笔记本服务调用launch-jupyter-kernel.sh.初始化操作与GCE启动脚本不同,因为它们不会在启动时重新运行;通常的意图是初始化操作不需要幂等,而是如果他们想在启动时重新启动,需要添加一些init. d/system d配置来显式地这样做。

对于一次性情况,您只需SSH连接到主机,然后执行以下操作:

sudo su
source /etc/profile.d/conda.sh
nohup jupyter notebook --allow-root --no-browser >> /var/log/jupyter_notebook.log 2>&1 &

如果您希望这在启动时自动发生,您可以尝试通过GCE元数据将其放在启动脚本中,尽管如果您在集群创建时这样做,您需要确保它不会与Dataproc初始化操作冲突(此外,启动脚本可能会在dataproc初始化操作之前运行,因此您可能只想允许第一次尝试静静地失败)。

从长远来看,我们应该更新初始化操作,将条目添加到init. d/system d中,以便init操作本身在重新启动时配置自动重启。目前还没有人致力于此,但是如果你或你认识的任何人能够胜任这项任务,贡献总是很受欢迎的;我提交了https://github.com/GoogleCloudPlatform/dataproc-initialization-actions/issues/108来跟踪这个功能。

 类似资料:
  • 问题内容: 管理员版本, 工人版本。 创建了Swarm管理器: 然后创建工人 我已经检查了工人的日志 在中,我看到了“虫群:待定” 我也做到了!尽管如此,该工作人员仍无法加入集群。所以,我该怎么爱 更新1 卸载并删除配置文件,然后再次安装docker 1.12版本。 仍然面临着相同的问题(无法加入和中的“ Swarm:Pending” ),其中存在DIFFERENT错误 谢谢。 问题答案: 问题是

  • 问题内容: 我对SQL(Server2008)的较低层次的了解是有限的,现在我们的DBA对此提出了挑战。让我解释一下这种情况:(我已经提到一些明显的陈述,希望我是对的,但是如果您发现有问题,请告诉我)。 我们有一张桌子,上面放着人们的“法院命令”。创建表(名称:CourtOrder)时,我的创建方式如下: 然后,我将非聚集索引应用于主键(以提高效率)。我的理由是,这是一个唯一字段(主键),应该像我

  • 我有一个3节点Hadoop集群(Apache Hadoop-2.8.0)设置。我已经部署了2个使用QJM在HA模式下配置的名称代码。在安装namenode的同一台计算机上配置了2个数据阳极。第三个节点仅用于仲裁目的。 需要帮助..

  • 我已经从Kaggle(视频游戏与评级)下载了一个数据库,但我不能用我的木星笔记本打开它。 我从这两行代码开始,但它给了我一个错误。。。 ()1中的UnicodeDecodeError回溯(最后一次调用)作为pd导入---- ~\Anaconda3\lib\site-包\熊猫\io\parsers.pyparser_f(filepath_or_buffer,sep,分隔符,标头,名称,index_c

  • 我正在虚拟盒中运行Ubuntu14.04,最近安装了anaconda。我用conda安装了jupyter笔记本电脑。我已经按照我可以在网上找到的所有文档安装了笔记本电脑扩展,但它们无法加载,错误消息如下所示。第一个错误来自终端中运行的jupyter笔记本应用程序,第二个错误来自chrome java控制台。注意,我不能用这么多的超链接发布这个问题,所以我在错误消息中删除了“http”中的“p”。

  • 我用kafka broker和zookeeper创建了docker,以运行脚本开始。如果我做了fresh start,它将正常启动并且运行正常(Windows->WSL->两个tmux窗口,一个会话)。如果我关闭kafka或zookeeper并重新启动它,它将正常连接。 当我停止docker容器时(docker stop my_kafka_container)出现问题。然后从脚本开始。/run_d