当前位置: 首页 > 知识库问答 >
问题:

使用AWS Datapipeline将DynamoDB导出到S3数据

司空福
2023-03-14

我有一个DynamoDB表,存储1Gb的数据。RCU和WCU各为1000。我设置了一个数据管道,将这1GB的数据导出到s3。整个1GB的数据在分区中导出到s3。我的问题是什么决定了这些分区的数量和大小?

共有1个答案

焦宏硕
2023-03-14

非常有用,

在最近的视频“AWS Re:发明Amazon DynamoDB高级设计模式-第1部分”中,Rick Houlihan演示了在创建表时设置100k WCU配置容量,并提到每额外配置1000个WCU将添加1个分区,因此他的表从大约100个分区开始。分区在内部被限制为10gb,如果一个分区达到这个限制,就分成两个分区,否则它们将保持在一个分区内。这表明,所有数据可能仍位于一个分区内。

所有这些似乎都是抽象的/隐藏的,不让用户知道,但一般来说,您应该能够计算分区的估计数量。

AWS表示,在按需模式下,他们会自动将表的吞吐量增加一倍,超过之前的限制。措辞有点奇怪,但我相信最终他们会为您创建更多的分区,因为一个分区被查询或写入的速度比它能处理的快。

需要注意的是,许多人已经提到,一旦配置了分区,您可以将WCU的数量降低到您实际需要的数量,并且仍然保留配置的分区。

 类似资料:
  • 在DynamoDB上有映射数据类型的记录,我想在EMR上使用HiveQL以JSON数据格式将这些记录导出到S3。这个怎么做?有可能吗? 我读了下面的文件,但我想要的信息是什么。 DynamoDB数据格式文档:https://docs.aws.amazon.com/amazondynamodb/latest/developerguide/DataFormat.html 用于导出的配置单元命令示例。。

  • 问题内容: 如何使用Logstash将数据从Elasticsearch导出到CSV?我只需要包括特定的列。 问题答案: 安装2个插件:elasticsearch输入插件和csv输出插件。然后创建一个配置文件。这是这种情况的一个很好的例子。 您现在就可以开始了,只需运行: 并检查中指定的文件。

  • 问题内容: 我有SSIS包,可以将数据从表导出到Excel文件 这是我的步骤: 删除Excel表 创建具有我选择查询格式的Excel表格,该表格用于从数据库中检索数据 将数据从数据库插入Excel文件 我用过像查询 我从10000行中检索出3000行,并将这3000行放入我的Excel工作表中。 但是,当打开我的Excel工作表时,我看到滚动条一直延伸到第10000行并结束,因此我的Excel工作

  • 问题内容: 我正在尝试将MySQL数据保存到Excel文件,但是Excel单元格出现问题。我所有的文本都放在一个单元格中,我希望每个行值都在单独的Excel单元格中。这是我的代码: 问题答案: 尝试以下方法: PHP部分: 我认为这可以帮助您解决问题。

  • 我需要生成一个DOCX从网页(与图像)。DOCX4J是否可以将HTML内容导出为DOCX格式? 还有其他库可以将HTML内容导出到DOCX吗?

  • 通过itertuples,我需要将位于excel列(“G7”、“G8”)两行中的两个数据导出到google工作表的两列中。我该怎么做? 最后一行不会更新google表单的第3列