当前位置: 首页 > 知识库问答 >
问题:

Google Cloud Dataflow ETL(Datastore->Transform->BigQuery)

酆勇
2023-03-14
    null
  1. 云数据流是否适合实现此管道?
  2. 我们是否能够推送现有数据?有些类型有数百万个对象
  3. 正确的实施方法应该是什么?我们正在考虑两种方法。第一种方法是通过pub/sub,即对于现有数据,创建一个cron作业并将所有数据推送到pub/sub。对于任何新的更新,在DataStore中更新数据的同时,将数据推送到pub/sub。数据流管道将从pub/sub中挑选它并将其推送到BigQuery。第二种方法是在Dataflow中创建一个批处理管道,它将查询DataStore并将任何新数据推送到BigQuery。

问题是这两种方法可行吗?哪一个成本更合理?还有比以上两种更好的方法吗?

谢谢,

里兹塔克

共有1个答案

萧永望
2023-03-14

数据流绝对可以用于此目的。事实上,Dataflow的可伸缩性应该使过程快速且相对容易。

这两种方法都应该奏效--我倾向于使用第二种方法,即使用批处理管道移动现有数据,然后使用流式管道通过Cloud Pub/Sub处理新数据。除了数据移动之外,Dataflow还允许对数据本身执行任意的分析/操作。

也就是说,BigQuery和Datastore可以直接连接。例如,请参见BigQuery文档中的从Cloud Datastore加载数据。

 类似资料:
  • 执行各种数学计算、按位运算以及类似 ASCII/Unicode 转换的任务。 Transform, OutputVar, Cmd, Value1 [, Value2] 参数 OutputVar 用来保存 Cmd 结果的变量名. SetFormat 决定了整数结果是保存为十六进制还是十进制. Cmd, Value1/2 请参阅后面的列表. Cmd, Value1, Value2 Cmd, Value

  • Transform 是 Facebook 开源的一个视频过滤器,可以把 360 度全景视频转换成“立方体贴图”,可以有效的降低文件大小,最多可以降低 25%。

  • 描述 (Description) text-transform属性更改元素中文本的大小写,或者指示用户代理“按原样”保留大小写。 可能的值 (Possible Values) capitalize - 元素文本中每个单词的第一个字母应该大写。 uppercase - 元素文本中的所有字符都应为大写(大写字母)。 lowercase - 元素文本中的所有字符都应为小写。 none - 不应更改元素文

  • Transform SWF 提供一套完整的,面向对象的 API 来分析、操作和生成 Flash 文件。 Transform SWF 是一个简单易用的用户库,用来读写 Flash 的swf 和 Flash 视频文件。它包含对应每种tag和数据结构的类。提供 C 语言和 Java 语言两种版本。 Java 的示例代码: import java.awt.Font; import java.io.IOEx

  • The Transform plugin enables users to easily make cross-browser XML transformations with XSL. The plugin does not rely on additional libraries and utilizes all ajax options. Very flexible and easy to

  • 以单文件方式,智能自动批量将 babeljs,coffeescript,typescript 转换为 es5 兼容的 javascript,可选支持混淆与压缩. 使用说明 安装 npm i smart-transform -g 使用示例 smart-transform --project="./" 项目根目录需要有一个 smart-transform.json 文件来配置转换细节 {  "in":