我想用AWS CLI添加一个步骤作为spark应用程序,但我找不到一个工作命令,从AWS官方文档:https://docs.AWS.amazon.com/CLI/latest/reference/emr/add-steps.html中,他们列出了6个示例,没有一个是针对spark的。但我可以通过AWS控制台UI配置它,它运行良好,但为了效率,我希望能够通过AWS CLI这样做。
aws emr add-steps --cluster-id j-cluster-id --steps Type=SPARK,Name='SPARK APP',ActionOnFailure=CONTINUE,Jar=s3://my-test/RandomJava-1.0-SNAPSHOT.jar,MainClass=JavaParquetExample1,Args=s3://my-test/my-file_0000_part_00.parquet,my-test --profile my-test --region us-west-2
JAR location : command-runner.jar
Main class : None
Arguments : spark-submit s3://my-test/my-file_0000_part_00.parquet my-test
Action on failure: Continue
正确的(已成功完成,通过AWS控制台UI配置)如下所示:
JAR location : command-runner.jar
Main class : None
Arguments : spark-submit --deploy-mode cluster --class sparkExamples.JavaParquetExample1 s3://my-test/RandomJava-1.0-SNAPSHOT.jar --s3://my-test/my-file_0000_part_00.parquet --my-test
Action on failure: Continue
如有任何帮助,不胜感激!
这似乎对我管用。我将使用步骤名我的步骤名
向集群添加一个spark应用程序。假设您将文件命名为step-addition.sh
。其内容如下:
#!/bin/bash
set -x
#cluster id
clusterId=$1
startDate=$2
endDate=$3
aws emr add-steps --cluster-id $clusterId --steps Type=Spark,Name='My step name',\
ActionOnFailure=TERMINATE_CLUSTER,Args=[\
"--deploy-mode","cluster","--executor-cores","1","--num-executors","20","--driver-memory","10g","--executor-memory","3g",\
"--class","your-package-structure-like-com.a.b.c.JavaParquetExample1",\
"--master","yarn",\
"--conf","spark.driver.my.custom.config1=my-value-1",\
"--conf","spark.driver.my.custom.config2=my-value-2",\
"--conf","spark.driver.my.custom.config.startDate=${startDate}",\
"--conf","spark.driver.my.custom.config.endDate=${endDate}",\
"s3://my-bucket/my-prefix/path-to-your-actual-application.jar"]
您可以像这样简单地执行上面的脚本:
bash $WORK_DIR/step-addition.sh $clusterId $startDate $endDate
我是Spark的新手。我有一个应用程序,通过调用spark shell来运行每个spark sql查询。因此,它将生成一组如下所示的查询,并调用spark shell命令逐个处理这些查询。 Val Query=spark.sql(""SELECT userid as userid,评级为评级,电影为电影从default.movie表""); 现在我想用spark submit而不是spark sh
问题内容: 我确信你们中有人注意到,如果您有Acrobat Reader(或其他PDF阅读器),并在Firefox中打开一个PDF,您会看到它嵌入在您的标签中。有什么方法可以将应用程序嵌入JFrame中? 问题答案: 这是一个相当棘手的问题。通常,诸如Adobe Reader之类的本机应用程序不提供可以嵌入到swing应用程序中的组件。但是在Windows中,有COM / OLE方法可以将应用程序
我正在使用Spring Boot实现一个spark应用程序。我构建了一个uber jar,并使用spark-submit来执行应用程序。但我得到了以下例外情况: 18/06/05 15:32:37错误SpringApplication:应用程序运行失败org.SpringFramework.Beans.factory.BeanCreationException:创建类路径资源[org/Spring
null 这是我第一次尝试将Firebase集成到我的一个项目中,因此一些关于实现这项任务的指导将是非常有用的。 谢了!
要创建一个简单的JSF应用程序,我们将使用maven-archetype-webapp插件。 在下面的示例中,我们将在C:\JSF文件夹中创建基于maven的Web应用程序项目。 创建项目 让我们打开命令控制台,转到C:\ 》 JSF目录并执行以下mvn命令。 C:\JSF>mvn archetype:create -DgroupId = com.wenjiangs.test -Darti
在创建实际的Hello World !之前Hello World ! 使用AngularJS的应用程序,让我们看看AngularJS应用程序的各个部分。 AngularJS应用程序包含以下三个重要部分 - ng-app - 该指令定义AngularJS应用程序并将其链接到HTML。 ng-model - 该指令将AngularJS应用程序数据的值绑定到HTML输入控件。 ng-bind - 该指令
让我们创建一个基于控制台的示例应用程序,其目的是根据所使用的选项获取传递数字的总和或传递数字的乘法。 创建一个名为CLITester的java类。 例子 (Example) CLITester.java import org.apache.commons.cli.CommandLine; import org.apache.commons.cli.CommandLineParser; import
本章提供了如何使用DBUtils库创建简单JDBC应用程序的示例。 这将向您展示如何打开数据库连接,执行SQL查询以及显示结果。 此模板示例中提到的所有步骤将在本教程的后续章节中进行说明。 创建JDBC应用程序 构建JDBC应用程序涉及以下六个步骤 - Import the packages - 要求包含包含数据库编程所需的JDBC类的包。 通常,使用import java.sql.*就足够了。