问题：

Spark Streaming应用程序在连续批处理失败后应停止

西门梓

2023-03-14

我有一个带有Spark2.3.1的DStream流应用程序。

其中我正在从Kafka读取数据并写入Kerberized HDFS,但在写入HDFS时,我的批处理随机开始失败,异常显示与kerberos相关的错误,但我的spark应用程序仍在运行,因此除非检查日志,否则我不知道批处理正在失败。

我的问题是，有没有什么方法让我可以限制连续批处理故障转移的数量？建议是否存在某些属性，在这些属性中，我们可以设置批处理失败的数量，在此之后，应用程序将导致失败。例如spark.streaming.xyz=3，则应用程序应在连续3次微批处理失败后停止。

共有1个答案

斜宁

2023-03-14

您可以维护某种类型的变量（驱动级的静态变量），并在获得异常时不断增加它，一旦达到特定阈值（假设3）您就可以关闭spark streaming上下文来终止作业

try{
.
.
}catch(Exception e){
   count++;
   if(count>threshold)
    streamingContext.close();
}

类似资料：

AppEngine WordPress教程应用程序在wp-admin处理程序上失败

我在学校里复习了教程https://developers.google.com/appengine/articles/wordpress 我有一个网站和运行，但我不能达到任何网址，包括wp-admin。下面的处理程序是按照本教程设置的。日志显示此错误： 2013-11-16 17:03:26.656/wp admin/500 41ms 0kb Mozilla/5.0（X11；Linux x86
Azure批处理应用程序洞察

在运行.NET Core3.1控制台应用程序时，我正在尝试获取应用程序的见解，以便在azure批处理作业/任务中工作。 https://docs.microsoft.com/en-us/Azure/Batch/Monitor-Application-Insights https://docs.microsoft.com/en-us/Azure/Azure-monitor/app/worker-se
在Kubernetes上的Spark独立--在连续的主程序和驱动程序失败后，应用程序完成

尝试使用ZooKeeper和SparkDriver弹性实现SparkMaster的高可用性，使用GlusterFS中的元数据检查点。 null 驾驶员保持在停车状态。驱动程序错误日志- 我是否为Spark选择了正确的资源控制器，即Statefulsets of kubernetes？我对这个环境是新的，任何帮助都是非常值得赞赏的。
部署 heroku 应用程序时应用程序失败

我运行< code>heroku open时出现应用程序错误。我查了日志，这是: 2016-06-19T05:22:44.640391 00:00 heroku[路由器]：at=错误代码=H10 desc=“应用程序崩溃”方法=获取路径=“/”主机=drawparty-.herokuapp。com request_id=6712804b-95f9-49ce-92a5-7f45df7bb79e fw
glewInit（）失败，OpenGL应用程序

我正在尝试用glew/glfw构建一个OpenGL应用程序。我下载了二进制文件，将它们放在文件夹的根目录中，将路径添加到include和lib目录，并告诉我的项目需要glew32。lib，GLFW。lib和opengl32。lib。我甚至复制了glew32。因为我的项目看不到，所以将lib添加到根目录。我必须保留项目目录中的所有依赖项，因为我将分发它。我不知所措。现在，当我运行我的程序时，它
处理清单失败。任务执行失败：应用程序：进程调试资源

当我构建我的项目时，我遇到了这个错误；建立“，”sources:“[{”file:“…\app\build\intermediates\manifests\full\debug\AndroidManifest.xml”，“position:{“startine”：146}]，”original:“，”tool:“：”AAPT“}错误：处理清单失败。任务：应用程序：processDebugRes

Spark Streaming应用程序在连续批处理失败后应停止

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档