问题：

使用python从s3 bucket内部文件夹下载最新文件，而不是从内部文件夹--folder下载

孙绍辉

2023-03-14

我只想从s3 bucket inside文件夹下载最新文件。实际上，文件夹中有多个文件夹和文件。但我只需要下载最新日期的文件，并通过从多个文件夹中选择将其上载到一个文件夹中。我指的是stackoverflow源代码中的代码。

下面是s3桶的结构：

  S3-Bucket : --folder_1
                  --abc2022.01.29.csv
                  --bsv2022.02.18.csv
                  --test2022.03.04.csv
                  --Folder_12
                  --Folder_13
                  --folder_14

所以基本上，我想从文件夹（文件夹_1）内的s3 bucket下载最新文件，而不是从文件夹（文件夹_12、文件夹_13、文件夹_14）内下载最新文件。

我得到以下错误：

TypeError: 'NoneType' object is not subscriptable

以下是用于下载最新文件的代码片段：

  def get_most_recent_s3_object(bucket_name, prefix)

       s3 = session.client('s3')
       paginator = s3.get_paginator( "list_objects_v2" )
       page_iterator = paginator.paginate(Bucket=bucket_name, Prefix=prefix, Delimiter="/")
       latest = None
       for page in page_iterator:
           if "Contents" in page:
               latest2 = max(page['Contents'], key=lambda x: x['LastModified'])
               if latest is None or latest2['LastModified'] > latest['LastModified']:
                    latest = latest2
                    with open(latest, 'wb') as f:
                         s3.download_fileobj(bucket_name, latest, 'C:\\Users\xxxx\\)
      return latest
      

  latest = get_most_recent_s3_object(bucket_name='bucket_name_1', prefix='folder_1')
  print(latest['Key'])

但我无法下载到我的本地路径。代码是从文件夹中的文件夹中获取最新文件，而不是从文件夹中的s3 bucket（文件夹_1）获取最新文件。

共有1个答案

朱锦

2023-03-14

我已经修改了下面的代码来下载文件夹内s3-桶中的最新文件，它工作正常。请找到下面的工作代码片段。

def get_most_recent_s3_object(bucket_name, prefix)

   s3 = session.client('s3')
   paginator = s3.get_paginator( "list_objects_v2" )
   page_iterator = paginator.paginate(Bucket=bucket_name, Prefix=prefix, Delimiter="/")
   latest = None
   for page in page_iterator:
       if "Contents" in page:
           latest2 = max(page['Contents'], key=lambda x: x['LastModified'])
           if latest is None or latest2['LastModified'] > latest['LastModified']:
                latest = latest2.get('Key')
                with open(C:\\Users\xxxx\\dummy.csv', 'wb') as f:
                     s3.download_fileobj(bucket_name, latest, f)
                print('Latest file downloaded successfully....!!!')
  
  

  latest = get_most_recent_s3_object(bucket_name='bucket_name_1', prefix='folder_1/')

类似资料：

从python中S3 bucket内的文件夹下载文件

我将一个bucket名称存储为string 我想从这个s3桶下载文件，并作为附件结束一封电子邮件。这个文件夹中只有一个文件，但要得到这个文件，我们需要在文件夹上迭代，因为我不知道文件的名称。这是我正在做的，但这个代码给我错误。 str对象没有属性这是我的python代码我是python新手
从google drive从与我共享文件夹下载zip文件夹/文件

我如何下载到我的笔记本电脑通过终端使用“wget”或python或任何相关的东西。
从ssh下载整个文件夹的文件

我需要选择和下载存储在计算机上的许多文件夹，我只能通过远程ssh连接访问这些文件夹。我创建了一个列表（“list.txt”）来只下载我感兴趣的文件夹，我尝试使用一个“for”循环但是不要阅读我的列表并卸载所有文件夹，我也尝试过我能做什么？谢了！
如何将下载的文件从S3桶复制/移动到同一桶下的不同文件夹，而不下载加载最新文件

我正在使用python 2.7. x和Boto API 2. X连接到AWS S3桶。我有一个独特的情况，我想从S3桶下载文件，从一个特定的目录/文件夹说。但问题是我想在S3文件夹中留下一个最新的文件，而不是下载它。一旦，我在我的本地框中下载这些文件，我想将这些文件移动到同一个桶下的不同文件夹说。以前有人处理过类似的情况吗？以下是一些解释：将下载的文件从S3存储桶移动到同一存储桶下的不同文件夹
从不同文件夹加载Jar文件

我目前正在制作一个Minecraft Mod Loader。正如您在上面看到的，我有一个名为Client的类。当Minecraft游戏启动时，启动被调用。现在我有一个名为Mods的文件夹，在调用startup时，我需要将Mods从Mods文件夹加载到ArrayList命名模块中。更深入地说，每个Mod将有一个继承这个模块类的主类因此，在调用startup时，我需要遍历mods文件夹中的每个Mo
SVN检出文件夹的内容，而不是文件夹本身

问题内容：我对linux和svn相当陌生。我正在尝试使用此命令（在public_html中）将项目的主干文件夹检出到我的public_html目录中： waterproject目录包含解开基本安装的drupal的文件。除了所有文件都位于而不是仅位于中，它可以很好地进行检出。我不知道将主干的所有内容上移到public_html和rm trunk的命令，但是我认为我可以相对容易地解决这一问题。我

使用python从s3 bucket内部文件夹下载最新文件，而不是从内部文件夹--folder下载

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档