当前位置: 首页 > 知识库问答 >
问题:

应用程序崩溃时Flink Task Manager状态

湛安宁
2023-03-14

处理事件时,如果jar应用程序向任务管理器抛出异常,会发生什么情况?

a) Flink作业管理器将杀死现有的任务管理器并创建新的任务管理器?

b) 任务管理器本身使用RocksDB中保存的本地状态从失败的执行和重启过程中恢复?

java.lang.IllegalArgumentException: "Application error-stack trace"

我有一个疑问,如果相同类型的错误事件被每个可用的任务管理器处理,因此它们都被杀死,整个flink工作被关闭。

我注意到,如果出现一些应用程序错误,那么最终整个工作都会失败。

目前还没有弄清楚确切的原因。

共有1个答案

彭涵衍
2023-03-14

一般来说,作业中的异常不应该导致整个任务管理器瘫痪。我们在这里谈论的是“正常”异常。在这种情况下,作业本身将失败,任务管理器将根据提供的重启策略尝试重新启动它或不重新启动它。

显然,如果由于某种原因,您的任务经理将死亡,例如由于超时或其他原因。如果您不使用某些资源管理器或编排工具(如Thread或Kubernetes),它将不会自动重新启动。这种情况下的作业应在有可用插槽后启动。

至于您描述的作业本身正在“下降”的行为,我在这里假设作业只是进入失败状态。这是因为不同的重新启动策略具有不同的最大重试次数阈值,如果作业在指定的重新启动次数后不工作,它将进入失败状态。

 类似资料:
  • 问题内容: 当我尝试访问Flask应用程序时,该应用程序崩溃了。 这类似于this或this。但是,我的设置似乎正确。 flask.cli.NoAppException:提供的文件/路径(服务器)似乎不存在。请确认路径正确。如果应用不在PYTHONPATH上,请确保扩展名为.py 我的环境变量设置正确。 我的服务器文件是y目录中没有任何文件。 我不记得对代码进行任何特殊更改。该错误可能来自哪里?

  • 在以前的代码上,谁医生帮了我 现在,android应用程序在我的手机上运行时崩溃了,这是错误日志 第一个问题是在我用相机扫描二维码后,它不能显示在二维码的结果进入 第二个问题是,我从存储器中选择了一个QRcode图像,然后点击确认,它崩溃了 下面是我认为的问题 类型不匹配:推断的类型是Uri?但乌里是意料之中的 冗余SAM构造函数 'onRequestPermissionsResult(Int,数

  • 我尝试了太多东西,但每次按下“计算”(hesapla)按钮后,应用程序都会崩溃。 例如: 我应该写什么/做什么? 有一只原木猫; 通用域名格式。ertugrulguleryuzgmail。sdunothesaplama E/AndroidRuntime:致命异常:主java。lang.NumberFormatException:无效的int:“”在java上。整型。java上的invalidit(

  • 问题是,当我在Google中使用授权运行此代码时,它会立即崩溃: 但是日志中的错误: 2019-06-22 17:55:42.652 29327-23222/?E/AudioSource:在已关闭的AudioSource 2019-06-22 17:55:43.240 2093-2616/?E/TouchFilter:setTouchFilter日志启用参数:0 2019-06-22 17:55:

  • 当我尝试在Android Studio3中添加图像时,应用程序就会崩溃。请帮帮忙。 logcat: activity_main.xml 主要活动.java 当我删除ImageView时,应用程序就可以正常工作了。我已经尝试了一切,调整图像大小,重新安装android Studio。 有人能把问题弄清楚吗?

  • 问题内容: 这是启动桌面版本时得到的: 我都试过这个政党成员和这一个,我也得到了同样的错误在同一直线上。 编辑: 我只是注意到我的.tmx文件的数据是由Tiled Map Editor自动编码的,所以我只是停用了它,但仍然遇到相同的错误。 如果我复制/粘贴该项目(我的意思是整个项目,不仅是render()方法),它会工作,但是当我尝试在自己的项目中加载自己的地图时,它只会崩溃… 因此,在那之后,我