当前位置: 首页 > 知识库问答 >
问题:

我能让flex模板作业在开始处理数据之前不到10分钟吗?

游勇军
2023-03-14
resource "google_dataflow_flex_template_job" "streaming_beam" {
  provider                = google-beta
  name                    = "streaming-beam"
  container_spec_gcs_path = module.streaming_beam_flex_template_file[0].fully_qualified_path
  parameters = {
    "input_subscription"    = google_pubsub_subscription.ratings[0].id
    "output_table"          = "${var.project}:beam_samples.streaming_beam_sql"
    "service_account_email" = data.terraform_remote_state.state.outputs.sa.email
    "network"               = google_compute_network.network.name
    "subnetwork"            = "regions/${google_compute_subnetwork.subnet.region}/subnetworks/${google_compute_subnetwork.subnet.name}"
  }
}

resource "google_dataflow_flex_template_job" "streaming_beam" {
  provider                = google-beta
  name                    = "streaming-beam"
  container_spec_gcs_path = module.streaming_beam_flex_template_file[0].fully_qualified_path
  parameters = {
    "input_subscription"    = google_pubsub_subscription.ratings[0].id
    "output_table"          = "${var.project}:beam_samples.streaming_beam_sql"
    "service_account_email" = data.terraform_remote_state.state.outputs.sa.email
    "network"               = google_compute_network.network.name
    "subnetwork"            = "regions/${google_compute_subnetwork.subnet.region}/subnetworks/${google_compute_subnetwork.subnet.name}"
    "flexrs_goal"           = "SPEED_OPTIMIZED" 
  }
}

2021-01-17 19:49:19.021 GMTStarting GCE实例,启动器-2021011711491611239867327455334861,以启动模板。
...
...
2021-01-17 19:59:05.381 GMTStarting 1欧洲工人-West1-d...
2021-01-17 19:59:12.256 GMTVM,启动器-2021011711491611239867327455334861,停止。

然后,我尝试明确地设置flexrs_goal=cost_optimized,看看它是否有什么不同,但这只导致了一个错误:

“无法创建工作流。原因:由于配置错误,无法创建工作流。流作业不支持实验功能flexible_resource_scheduling。有关进一步帮助,请与Google云支持部门联系。”

    null

2021-01-17 19:51:03.381 GMT“info:apache_beam.runners.portability.stager:正在执行命令:['/usr/local/bin/python'、'-m'、'pip'、'download'、'--dest'、'/tmp/dataflow-requirements-cache'、'-r'、'/dataflow/template/requirements.txt'、'--exists-action'、'i'、'--no-binary'、':all:']”
2021-01-17来自PYPI“

无论这两个日志记录之间发生了什么,都是在state=queued中花费很长时间的主要原因。有人知道原因是什么吗?

共有1个答案

朱华皓
2023-03-14
RUN pip install -U apache-beam==<version>
RUN pip install -U -r ./requirements.txt
 类似资料:
  • 我尝试使用简单的select查询读取数据,并使用resultset数据创建csv文件。 到目前为止,在application.properties文件中已经有了select查询,并且能够生成csv文件。 现在,我希望将查询移动到一个静态表中,并在批处理作业开始之前(类似于before作业)将其作为初始化步骤获取。 你能告诉我做这件事最好的策略是什么吗。在读取数据和创建CSV文件的实际批处理作业开始

  • 问题内容: MySQL数据库什么时候开始失去性能? 物理数据库的大小重要吗? 记录数量重要吗? 性能下降是线性的还是指数的? 我拥有一个大型数据库,大约有1500万条记录,几乎占用2GB。基于这些数字,是否有激励我清理数据,还是我可以放心地继续扩展几年? 问题答案: 物理数据库的大小无关紧要。记录的数量无关紧要。 根据我的经验,您遇到的最大问题不是大小,而是一次可以处理的查询数。最有可能的是,您将

  • 问题内容: 我的问题如标题中所述。我正在尝试做类似的事情: 我得到错误: 是否有其他方法可以在模板中进行模量计算? 问题答案: 添加具有所需逻辑的模板功能。例如: 游乐场的例子

  •        随着数据获取的便捷,GIS数据已不再成为GIS分析的瓶颈,但对海量数据的加载却又成了GIS相关软件的难题。LocaSpaceViewer对数据的加载进行了大量的优化,极大的加快了数据的加载速度。同时经过各种摸索,不断的改进算法与数据的存储和读取方式,研究出了能够加载速度更快的数据结构。        LocaSpaceViewer提供了数据影像处理功能,可以把多个影像或者地形数据进行

  • 主要内容:2021一分钟自我介绍一,2021一分钟自我介绍二,2021一分钟自我介绍三,2021一分钟自我介绍四,2021一分钟自我介绍五,2021一分钟自我介绍六,2021一分钟自我介绍七,2021一分钟自我介绍八,2021一分钟自我介绍九,2021一分钟自我介绍十,一分钟自我介绍模板相关文章:2021一分钟自我介绍模板 通过自我介绍得到对方的认识甚至认可,是一种非常重要的社交技能。如果让你在一分钟内做自我介绍,你打算说些什么?下面就是小编给大家带来的2021一分钟自我介绍模板,希望能帮助到大

  • 主要内容:毕业生一分钟自我介绍【篇1】,毕业生一分钟自我介绍【篇2】,毕业生一分钟自我介绍【篇3】,毕业生一分钟自我介绍【篇4】,毕业生一分钟自我介绍【篇5】,毕业生一分钟自我介绍【篇6】,毕业生一分钟自我介绍【篇7】,毕业生一分钟自我介绍【篇8】,毕业生一分钟自我介绍【篇9】,毕业生一分钟自我介绍【篇10】,毕业生一分钟自我介绍10篇范文 毕业生一分钟自我介绍的怎么写?有哪些?在面试过程中,有些面试官问一个问题,那就是你有什么优点?但是作为求职者的回答上,要尽量轻描淡写、语气平静,只谈事实,别