当前位置: 首页 > 知识库问答 >
问题:

Spark Streaming应用程序在连续批处理失败后应停止

西门梓
2023-03-14

我有一个带有Spark2.3.1的DStream流应用程序

其中我正在从Kafka读取数据并写入Kerberized HDFS,但在写入HDFS时,我的批处理随机开始失败,异常显示与kerberos相关的错误,但我的spark应用程序仍在运行,因此除非检查日志,否则我不知道批处理正在失败。

我的问题是,有没有什么方法让我可以限制连续批处理故障转移的数量?建议是否存在某些属性,在这些属性中,我们可以设置批处理失败的数量,在此之后,应用程序将导致失败。例如spark.streaming.xyz=3,则应用程序应在连续3次微批处理失败后停止。

共有1个答案

斜宁
2023-03-14

您可以维护某种类型的变量(驱动级的静态变量),并在获得异常时不断增加它,一旦达到特定阈值(假设3)您就可以关闭spark streaming上下文来终止作业

try{
.
.
}catch(Exception e){
   count++;
   if(count>threshold)
    streamingContext.close();
}
 类似资料:
  • 我在学校里复习了教程https://developers.google.com/appengine/articles/wordpress 我有一个网站和运行,但我不能达到任何网址,包括wp-admin。 下面的处理程序是按照本教程设置的。 日志显示此错误: 2013-11-16 17:03:26.656/wp admin/500 41ms 0kb Mozilla/5.0(X11;Linux x86

  • 在运行.NET Core3.1控制台应用程序时,我正在尝试获取应用程序的见解,以便在azure批处理作业/任务中工作。 https://docs.microsoft.com/en-us/Azure/Batch/Monitor-Application-Insights https://docs.microsoft.com/en-us/Azure/Azure-monitor/app/worker-se

  • 尝试使用ZooKeeper和SparkDriver弹性实现SparkMaster的高可用性,使用GlusterFS中的元数据检查点。 null 驾驶员保持在停车状态。驱动程序错误日志- 我是否为Spark选择了正确的资源控制器,即Statefulsets of kubernetes?我对这个环境是新的,任何帮助都是非常值得赞赏的。

  • 我运行< code>heroku open时出现应用程序错误。我查了日志,这是: 2016-06-19T05:22:44.640391 00:00 heroku[路由器]:at=错误代码=H10 desc=“应用程序崩溃”方法=获取路径=“/”主机=drawparty-.herokuapp。com request_id=6712804b-95f9-49ce-92a5-7f45df7bb79e fw

  • 我正在尝试用glew/glfw构建一个OpenGL应用程序。我下载了二进制文件,将它们放在文件夹的根目录中,将路径添加到include和lib目录,并告诉我的项目需要glew32。lib,GLFW。lib和opengl32。lib。 我甚至复制了glew32。因为我的项目看不到,所以将lib添加到根目录。 我必须保留项目目录中的所有依赖项,因为我将分发它。我不知所措。 现在,当我运行我的程序时,它

  • 当我构建我的项目时,我遇到了这个错误; 建立“,”sources:“[{”file:“…\app\build\intermediates\manifests\full\debug\AndroidManifest.xml”,“position:{“startine”:146}],”original:“,”tool:“:”AAPT“}错误:处理清单失败。 任务:应用程序:processDebugRes