当前位置: 首页 > 知识库问答 >
问题:

我们可以使用boto3 Python在aws s3 buckets之间递归复制文件和文件夹吗?

缑兴贤
2023-03-14

是否可以使用boto3将一个源桶中的所有文件复制到其他目标桶中。并且源桶没有常规的文件夹结构。

Source bucket: SRC
Source Path: A/B/C/D/E/F..
where in D folder it has some files,
E folder has some files

Target bucket: TGT
Target path: L/M/N/

我需要复制所有的文件和文件夹从上面的SRC桶从文件夹C到TGT桶下的N文件夹下使用boto3。

任何一个人都可以知道任何API,或者我们需要编写新的python脚本来完成这项任务。

共有1个答案

农波涛
2023-03-14

S3存储对象,它不存储文件夹,甚至'/'或'\'是对象键名的一部分。您只需要操作键名并复制数据。

import boto3
old_bucket_name = 'SRC'
old_prefix = 'A/B/C/'
new_bucket_name = 'TGT'
new_prefix = 'L/M/N/'
s3 = boto3.resource('s3')
old_bucket = s3.Bucket(old_bucket_name)
new_bucket = s3.Bucket(new_bucket_name)

for obj in old_bucket.objects.filter(Prefix=old_prefix):
    old_source = { 'Bucket': old_bucket_name,
                   'Key': obj.key}
    # replace the prefix
    new_key = obj.key.replace(old_prefix, new_prefix, 1)
    new_obj = new_bucket.Object(new_key)
    new_obj.copy(old_source)

Zvikico提出的定义new_key的优化技术:

new_key = new_prefix + obj.key[len(old_prefix):]
 类似资料:
  • 问题内容: 是否可以使用boto3将一个源存储桶中的所有文件复制到另一目标存储桶中。而且源存储桶没有常规的文件夹结构。 我需要使用boto3将SRC存储桶上方的所有文件和文件夹从文件夹C复制到N文件夹下的TGT存储桶。 任何人都可以知道任何API还是我们需要编写新的python脚本来完成此任务。 问题答案: S3存储对象,它不存储文件夹,即使’/’或’'是对象键名的一部分。您只需要操纵键名并复制数

  • 本文向大家介绍Java使用递归复制文件夹及文件夹,包括了Java使用递归复制文件夹及文件夹的使用技巧和注意事项,需要的朋友参考一下 递归调用copyDir方法实现,查询源文件目录使用字节输入流写入字节数组,如果目标文件目录没有就创建目录,如果迭代出是文件夹使用字节输出流对拷文件,直至源文件目录没有内容。 以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持呐喊教程。

  • 本文向大家介绍linux 下python多线程递归复制文件夹及文件夹中的文件,包括了linux 下python多线程递归复制文件夹及文件夹中的文件的使用技巧和注意事项,需要的朋友参考一下 本文是利用python 复制文件夹 刚开始写了一个普通的递归复制文件夹    然后想了想 觉得对io频繁的程序 threading 线程还比较友好  就写了个多线程版本的  最恶心人的地方就是路径  其他都还好吧

  • 本文向大家介绍文件和文件夹之间的区别,包括了文件和文件夹之间的区别的使用技巧和注意事项,需要的朋友参考一下 文件 文件可以描述为一组相关的数据/信息,并存储在辅助存储设备上。文件可以是数据/信息文件或程序文件,并且可以包含任何格式的数据。例如,文本文件,音频文件,可执行程序文件等。 文件夹 文件夹是用来存放文件的容器。文件夹也可以具有子文件夹。 以下是文件和文件夹之间的重要区别。 序号 键 文件

  • 问题内容: Python似乎具有复制文件的功能(例如)和复制目录的功能(例如),但是我还没有找到能够同时处理两者的函数。当然,检查要复制文件还是目录很简单,但这似乎很奇怪。 确实没有像unix命令那样工作的标准函数,即同时支持目录和文件以及递归复制吗?在Python中解决此问题的最优雅方法是什么? 问题答案: 建议您先致电,如果引发异常,请重试。

  • 我正在尝试将外部JSON文件从Azure Blob存储加载到Snowflake。我创建了表LOCATION_DETAILS,所有列都作为variant。当我试图加载到表中时,我得到以下错误: 有人能帮我吗?