当前位置: 首页 > 软件库 > 管理和监控 > 系统监控 >

Job Monarch

Ganglia的批量作业监控插件
授权协议 GPLv2
开发语言 PHP Python
所属分类 管理和监控、 系统监控
软件类型 开源软件
地区 不详
投 递 者 韩良策
操作系统 Linux
开源组织
适用人群 未知
 软件概览

Job Monarch 是 Ganglia 监控系统的插件,提供了批量作业监控。支持 Torque, PBS, 和 SLURM, 对 LSF 和 SGE 的支持还处于体验阶段。

 相关资料
  • 我知道spring-batch-admin是不推荐的。但是,我们现在不能使用spring-cloud-data-flow。是否有其他替代方案来监控和按需重启作业?

  • 我有一个报告生成应用程序。由于这类报告的准备是重量级的,因此它们是用Spring Batch异步准备的。对此类报告的请求是通过使用HTTP的REST接口创建的。 目标是REST资源只需对报告执行进行排队并完成(如文档中所述)。因此,为JobLauncher提供了一个TaskExecutor: 由于报告确实是重量级的,在给定的时间内只能生成特定数量的报告。为了能够将Spring Batch配置为一次

  • 我们的几个应用程序具有每天晚上聚合数据的批处理作业。这些批处理作业是Python脚本,使用Prometheus Pushgateway将度量值推送到Prometheus,我们有一些规则,当这些度量值变得无效(例如,超过某个阈值)时,会触发警报(在Alertmanager中)。 我们现在还想使用Prometheus指标来仔细检查批处理作业本身是否正确运行:例如,作业是否按时开始?有任何错误发生吗?这

  • 我怎样才能停止一个工作在Spring批次?我尝试使用下面的代码来使用这个方法: 我尝试也完成了,失败了,但这个方法不工作,作业继续执行。有解决办法吗?

  • 在产品发布的最后一分钟,我发现Java Spring批处理有一个奇怪的问题。它进入无限循环。 这是我的配置: 记录总数为10条。因此,提交是在处理每一条记录之后进行的。我正在将结果写入Writer中的数据库。 我从阅读器中一个接一个地获取项目,处理并写入数据库。 它一直在运行,并将数据无限地插入表中。 观察结果是:提交间隔 如果有人提出一些解决方案/解决方法,在因为这个问题而举行生产发布时,这将对

  • 我们当前的代码库具有以下重要特征: 一个代码库-但是很多批处理(我们在批处理之间重用代码) 目前,我们在代码库中有多个main()方法,并且只有不同的shell脚本来调用正确的main类。 我希望在Spring Batch中解决以下问题: null 提前谢了。

  • 我很难找到这个问题的正确答案。当使用Spring批处理框架时,是否可以尝试在一个通用作业中解决所有的批处理?

  • 我正在为我们的文件上传过程执行一个spring批处理工作。我的要求是读取平面文件,应用业务逻辑,然后将其存储在DB中,然后发布一个Kafka消息。 我有一个基于块的步骤,它使用自定义的读取器、处理器和写入器。这个过程工作得很好,但是处理一个大文件需要很多时间。 处理一个有60k条记录的文件需要15分钟。我需要减少到5分钟以下,因为我们将消耗比这更大的文件。 根据https://docs.sprin