我们有一个第三方jar文件,Spark应用程序依赖于该文件。此jar文件大小约为15MB。由于我们希望将Spark应用程序部署在大规模集群(约500个工作人员)上,因此我们需要考虑分发第三方jar文件。根据apachespark文档(https://spark.apache.org/docs/latest/submitting-applications.html#advanced-依赖关系管理),我们可以选择使用HDFS、HTTP服务器、驱动程序HTTP服务器和本地路径来分发文件。
我们不喜欢使用local-path,因为它需要复制所有工作人员的火花库目录上的jar文件。另一方面,如果我们在Spark工作人员尝试获取jar文件时使用HDFS或HTTP服务器,他们可能会对我们的Spark驱动程序服务器发起DoS攻击。那么,应对这一挑战的最佳方式是什么?
在研究了不同的方法之后,我们发现分发jar文件的最佳方法是复制所有节点(正如@egor所提到的)基于我们的部署工具,我们发布了一个支持外部JAR的新spark ansible角色。目前,ApacheSpark没有提供任何优化的解决方案。如果您提供一个远程URL(HTTP、HTTPS、HDFS、FTP)作为外部jar路径,spark workers将在每次提交新作业时获取jar文件。因此,从网络的角度来看,它不是一个优化的解决方案。
另一方面,如果我们在Spark工作人员尝试获取jar文件时使用HDFS或HTTP服务器,他们可能会对我们的Spark驱动程序服务器发起DoS攻击。那么,应对这一挑战的最佳方式是什么?
如果你把第三个jar放在HDFS中,为什么会影响spark驱动服务器?!每个节点都应该直接从hdfs而不是spark服务器获取addintiol jar。
null lib-ThirdPartyProject1.jar-ThirdPartyProject2.jar-ThirdPartyProject3.jar wrapperproject.jar-project1.jar-project2.jar-project3.jar
Apache ShardingSphere 在数据库治理模块使用 SPI 方式载入数据到配置中心和注册中心,进行实例熔断和数据库禁用。 目前,Apache ShardingSphere 内部支持 ZooKeeper,Etcd等常用的配置中心/注册中心。 此外,开发者可以使用其他第三方组件,并通过 SPI 的方式注入到 Apache ShardingSphere,从而使用该配置中心和注册中心,实现数
我是OSGI开发的新手,很难理解如何最好地处理依赖的JAR。 也就是说,如果我要创建一个bundle,我可能需要使用几个第三方jar。当我创建bundle JAR以部署到OSGI时,显然这些第三方JAR不包括在内,因此bundle将无法运行。
我是一个使用java的Android应用程序开发人员,我开始了解Flutter使用谷歌创建的飞镖语言。我发现它非常有趣,因为它为Android和iOS构建了应用程序。我已经为Android创建了一个简单的TabLayout应用程序,应用程序的大小为27MB,请看看简单的TabLayout Flutter App的屏幕截图。 > 我已经看到Flitter应用程序的大小超过了25MB,那么为什么Fli
我下载了一个Maven项目,可以运行来构建目标helloworld。jar,它依赖于多个第三方运行时jar。但是,我不知道如何使用Maven将这些第三方JAR自动复制到特定目录中。查看pom。xml,我发现了以下语句。因此,基本上我希望将第三方JAR复制到。要做到这一点,我应该使用哪个maven插件/短语/目标?有人能给我看一个可运行的maven语法吗?谢谢
问题内容: 我正在开发一个 Java Web应用程序 ,其中包括 一个applet 。该小程序依赖于两个jar文件: JFreeChart(用于在客户端绘制图) -1.7 mb(jar文件的大小) MySqlJdbcConnector(用于将在客户端捕获的数据存储到远程数据库)-. 7 mb(JAR文件的大小) 现在,问题是上述两个jar文件的大小。我的小应用程序jar (myApplet.jar
本文向大家介绍详解springboot解决第三方依赖jar包的问题,包括了详解springboot解决第三方依赖jar包的问题的使用技巧和注意事项,需要的朋友参考一下 公司现在用的是springboot+maven,想要把一些老的项目都改成这种框架。但是一些老的项目中有好多第三方的jar包或者是自己的jar包,maven库上没有。最初的解决方案是一个个的deploy到maven库上,但是遇到太多的
Hibernate web 应用程序使用 Session 和 Transaction 的方式几乎和独立应用程序是一样的。但是,有一些常见的模式(pattern)非常有用。现在我们编写一个 EventManagerServlet。这个 servlet 可以列出数据库中保存的所有的 events,还提供一个 HTML 表单来增加新的 events。 1.3.1. 编写基本的 servlet 这个 se