当前位置: 首页 > 知识库问答 >
问题:

在Spark集群模式下设置环境变量

汪博达
2023-03-14

共有1个答案

戚哲
2023-03-14

为了将来的参考,您可以在创建EMR集群时使用Configurations参数直接传递环境变量,如这里的文档中所述。

具体来说,可以通过传递配置JSON来修改spark-defaults文件,如下所示:

{
    'Classification': 'spark-defaults',
    'Properties': {
        'spark.yarn.appMasterEnv.[EnvironmentVariableName]' = 'some_value',
        'spark.executorEnv.[EnvironmentVariableName]': 'some_other_value'
    }
},

其中spark.YARN.appmasterenv.[EnvironmentVariableName]将用于在集群模式下使用YARN传递变量(此处)。和spark.executorenv.[EnvironmentVariableName]将一个变量传递给executor进程。

 类似资料:
  • 本文向大家介绍Hadoop平台集群配置、环境变量设置?相关面试题,主要包含被问及Hadoop平台集群配置、环境变量设置?时的应答技巧和注意事项,需要的朋友参考一下 zookeeper:修改zoo.cfg文件,配置dataDir,和各个zk节点的server地址端口,tickTime心跳时间默认是2000ms,其他超时的时间都是以这个为基础的整数倍,之后再dataDir对应目录下写入myid文件和z

  • 我使用spark-defaults分类[http://docs.aws.amazon.com/emr/latest/releaseGuide/emr-spark-configure.html]并提供以下属性:-来设置yarn主目录中的环境变量。

  • 我试图设置一个火花3光泽使用两个系统运行Windows10。我可以开始用master ,它在启动主程序

  • 问题内容: 我试图访问Accumulo 1.6 从Apache的星火使用的作业(Java编写的)用。为了做到这一点,我必须通过调用该方法来告知在哪里定位ZooKeeper 。此方法采用一个对象,该对象指定各种相关属性。 我通过调用静态方法来创建对象。该方法应该在各个位置查找文件以从中加载其默认值。它应该看的地方之一是。 因此,我试图以这样的方式设置环境变量,使其在Spark运行作业时可见(作为参考

  • 问题内容: 有没有一种方法可以在Linux中使用C设置环境变量? 我尝试了和,但是它们似乎并没有为我工作。 问题答案: 我将在这里做出一个疯狂的猜测,但是这些功能似乎不起作用的正常原因不是因为它们不起作用,而是因为用户并不真正了解环境变量的工作原理。例如,如果我有此程序: 然后我从外壳程序运行它,它不会修改外壳程序的环境- 子进程无法做到这一点。这就是为什么内置可修改环境的shell命令的原因,以

  • 我尝试为将在Windows子系统Linux中运行的Visual Studio Code任务设置环境变量。然而,它似乎不起作用。这是我的tasks.json: 输出为: 请注意,默认情况下,shell已被手动修改为WSL的,正如这里和这里推荐的那样。