当前位置: 首页 > 知识库问答 >
问题:

如何使aws弹性mapreduce配置单元命令并行运行

夏季萌
2023-03-14

我在这里复习,

cat hive_script.hql | parallel --gnu hive -e '{}' 

共有1个答案

盖锐
2023-03-14

我的问题是如何在启动时在Amazon EMR集群中设置这个“hive.exec.parallel.thread.number”选项?

将配置添加hive-site.xml(在本例中,文件路径为./.versions/hive-0.11.0/conf/hive-site.xml)

<property>
  <name>hive.exec.parallel</name>
  <value>true</value>
  <description>Whether to execute jobs in parallel</description>
</property>

如果它们在我的例子中不相等,这些策略中的一个会产生更好的性能吗?

那是不同的.此属性控制一个配置单元作业中的不同阶段视差,因此性能取决于特定的配置单元查询。

 类似资料:
  • 我在elastic mapreduce上以交互模式运行了Hive: null 有人对我如何做到这一点有什么建议吗?

  • 我正在尝试在EMR集群的S3上运行一个配置单元脚本。 通过SSH连接到EMR集群时,键入 作品但是,我希望这是自动完成的,所以我创建了一个python脚本,并试图向集群添加一个步骤。但是,我无法运行此步骤,即使是通过AWS控制台手动添加此步骤。对于jar文件,我指定了“command runner.jar”,但无论我随后使用什么参数(我用另一个线程建议的“hive-f s3://…”尝试了它,但不

  • 我想我应该做的是,为“website.com”创建一个SSL证书,并将该SSL证书应用到AWS EB负载均衡器。然后,我需要为“website.com”创建一个子域,将流量重定向到“something.elasticbeanstalk.com”。客户端应用程序连接到“website.com”的子域,该子域现在是HTTPS,并重定向到“something.elsastic.beanstalk.com

  • ./gradlew test 执行gradle测试任务后所有的测试用例都会被运行,然后会产出测试报告. 测试报告存放在址: app\/build\/reports\/debug\/index.html 通过gradle工具栏执行的效果同命令行.

  • Amazon Elastic MapReduce (EMR)是一种Web服务,它提供了一个托管框架,以简单,经济高效且安全的方式运行Apache Hadoop,Apache Spark和Presto等数据处理框架。 它用于数据分析,Web索引,数据仓库,财务分析,科学模拟等。 如何设置Amazon EMR? 请按照以下步骤设置Amazon EMR - Step 1 - 登录AWS账户并在管理控制台