当前位置: 首页 > 知识库问答 >
问题:

H20 - 已超出 ncpus

杜良骏
2023-03-14

我正在尝试运行 h2o.automl() 但它一直失败,因为我用完了 ncpus。

我通过请求47个线程来启动我的h20会话:h2o.init(n线程=47)

我在开始时提供足够数量的ncpu和内存:

R连接H2O集群:H2O集群正常运行时间:2秒286毫秒H2O集群时区:欧洲/伦敦H2O数据解析时区:UTC H2O集群版本:3.18.0.4H2O集群版本年龄:18天H2O集群名称:H2O_started_from_R_cmorgan1_gvi181H2O集群总节点:1 H2O集群总内存:26.67 GB H2O集群总核心:40 H2O集群允许核心:40 H2O集群健康:TRUE H2O连接ip:localhostH2O连接端口:54321 H2O连接代理:NA H2O内部安全:FALSE H2O API扩展:XGBoost、Algos、AutoML、Core V3、Core V4 R版本:R版本3.4.1(2017-06-30)

然而,过了一段时间(38%的完成率),它停止了,告诉我没有足够的ncpus。

| = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = 100% | = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = br > = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = 38% < br >。

============================================

    Job resource usage summary

             Memory (GB)    NCPUs  Requested  :        45            48  Used       :        12 (peak)  36.00 (ave)

以前有没有人遇到过这种情况,你有工作吗?我不相信我的数据大小异常,它有29个缩放参数和94,000行数据。

谢谢,

共有1个答案

厍兴腾
2023-03-14

这与H2O无关。

这里的线索是消息“PBS:工作被杀”。

这里的少量互联网搜索表明您正在以某种方式使用PBS调度程序(https://en.wikipedia.org/wiki/Portable_Batch_System),这正在扼杀您的工作。(我以前从未见过任何人使用PBS,但根据上面的信息,这一切似乎都很有可能。

因为PBS告诉您您的限制是32核,所以我建议您尝试指定一个小于此值的值。也许用h2o。init(nthreads=30)PBS不会再杀死您的进程。

 类似资料:
  • 我的代码中的什么给了我这个错误?< br > jquery-2.1.3.min.js:3 Uncaught RangeError:超出最大调用堆栈大小 超文本标记语言 JS 我该如何解决这个错误?< br >单击表单时,我正试图打开文件对话框。 更新我试过:

  • 我在服务器上托管了一个spring应用程序(Tomcat 8.5)。如果没有人使用它,它就会闲置。我已经知道,如果数据库处于空闲状态8小时(MySQL的默认超时),就会发生超时。正如在Spring Autoreconnect and Connection lost过夜帖子中提到的,我已经尝试了这里提供的解决方案。我尝试过配置应用程序。但这并不能解决问题。 (PS:除了Spring应用程序中的app

  • 给致命的内存分配错误查询读取超过20000记录从数据库,而且它需要太多的时间来加载 因此,请帮助我们出口20000多张唱片。

  • 当我运行代码时,Node。js抛出由过多递归调用引起的异常。我试图增加Node。js-stack-size-by,但是node。js崩溃,没有任何错误消息。当我在没有sudo的情况下再次运行时,请选择Node。js打印。有没有可能在不删除递归调用的情况下解决这个问题?

  • 我有一个设置屏幕,我从用户那里获得一些信息,例如年龄、体重和性别,在这些信息之后,我正在计算用户每天应该喝多少水。 我想自动计算这个金额,而不需要任何计算按钮。 不变冲突:超过了最大更新深度。当组件重复调用componentWillUpdate或componentDidUpdate内部的setState时,会发生这种情况。React限制嵌套更新的数量,以防止无限循环。 我现在计算水量的代码 这就是

  • 问题内容: 我正在使用Hibernate,试图模拟2个并发更新到数据库中的同一行。 编辑:我将em1.getTransaction()。commit移到em1.flush()之后;我没有收到任何StaleObjectException,两个事务已成功提交。 我在上遇到以下异常。为什么? 问题答案: 好吧,您正试图陷入僵局,并且成功了:-) Transaction1开始,与您的实体更新(和锁定)行。