当前位置: 首页 > 知识库问答 >
问题:

当运行的任务过多时,气流运行状况检查失败?

贲宏硕
2023-03-14

我有一个容器Airflow安装程序,使用LocalExector在马拉松上运行。我运行了一个运行状况检查,可以ping Airflow网络服务器上的/Healthendpoint。它目前有5个cpu分配给它,网络服务器正在运行4个Gunicorn。昨晚我有大约25个任务同时运行。这导致健康检查失败,没有一条有用的错误消息。容器刚刚收到一个SIGTERM。我想知道是否有人可以提出导致健康检查失败的可能罪魁祸首?是CPU争用吗?我没有创建足够的gunicorn工作人员来响应健康检查请求吗?我有一些想法,但我不确定原因。

以下是Marathon中的健康检查配置:

[
  {
    "gracePeriodSeconds": 300,
    "intervalSeconds": 60,
    "timeoutSeconds": 20,
    "maxConsecutiveFailures": 3,
    "portIndex": 0,
    "path": "/admin/",
    "protocol": "HTTP",
    "ignoreHttp1xx": false
  }
]

共有1个答案

谭成业
2023-03-14

是的,我以前见过类似的问题,有没有可能从LocalExecutor和单节点气流服务中迁移出来。

如果没有,这是垂直扩展实例的情况,以便能够在任务//调度程序的大量计算需求期间处理Web请求

 类似资料:
  • 我有一个与这里类似的情况:Spring Cloud Stream和RabbitMQ健康检查 错误信息 环境: Java 8 Grails 3.3.8 弹簧-拉比-1.7.9.释放 弹簧引导致动器-1.5.15.释放 KeyCloak服务器4.6.0.final 知道怎么能让兔子在这里停用吗?

  • 我正在使用Java传输客户端库在Spring boot 1.5.8.RELEASE上使用Elastic Search 5.5.0。 弹性搜索与docker一起部署在一个容器中。它工作得很好。来自java应用程序的查询也运行良好。 问题是,Elasticsearch运行状况检查几乎每次从我的本地机器启动Spring时都会失败,如下异常所示。我没有在我的应用程序中明确调用任何健康检查。 如何在每次启动

  • 我已经配置了一个网络负载平衡器,通过端口80将TCP流量路由到ECS群集 ECS群集正在运行ASP。Fargate配置中的NET Core 2.2 API任务。API的基本路径是<代码>http://ip_address:80/api/v1/ 首先,一切正常,我可以点击负载平衡器的DNS并将请求路由到适当的服务器。NET API路由 然而,最终NLB的健康检查失败,容器被排空,新的容器被替换。 有

  • 我正在使用云形成模板来构建基础设施(ECS fargate集群)。模板已成功执行,堆栈已成功创建。但是,任务失败,出现以下错误: 我没有得到什么和在哪里寻找这个问题的疑难解答。由于它是fargate集群,我不知道如何登录到容器并执行一些健康检查查询来进一步调试。 如果你觉得,我也可以粘贴整个模板。 请帮忙

  • 问题内容: 在我当前的项目中,我正在使用junit测试。在本地PC上运行我的ant文件会生成预期的测试报告,但是当Bamboo尝试运行我的测试时,它将生成以下输出。 我怎么了 SimplerTest.java 本地输出: 服务器输出: build.xml ant -v输出: http://nopaste.info/1abdd27a8e.html 问题答案: 感谢详细的Ant输出。 看来您正在Bam