当前位置: 首页 > 知识库问答 >
问题:

数据砖dbfs是否支持文件元数据,如文件/文件夹创建日期或修改日期

计泉
2023-03-14

我正试图在databricks笔记本的目录中查找最新的拼花文件。dbfsutils.fs.ls似乎不支持任何有关文件或文件夹的元数据。python中有没有其他方法可以做到这一点?数据存储在azure数据湖中,该数据湖安装在“/mnt/foo”下的DBFS上。感谢任何帮助或指点。

共有1个答案

冷涵忍
2023-03-14

据我所知,在Azure Databricks上,dbfs路径< code>dbfs:/mnt/foo与Linux路径< code>/dbfs/mnt/foo相同,因此您可以简单地使用Python中的< code>os.stat(path)来获取文件元数据,如创建日期或修改日期。

这是我的示例代码。

import os
from datetime import datetime
path = '/dbfs/mnt/test'
fdpaths = [path+"/"+fd for fd in os.listdir(path)]
for fdpath in fdpaths:
    statinfo = os.stat(fdpath)
    create_date = datetime.fromtimestamp(statinfo.st_ctime)
    modified_date = datetime.fromtimestamp(statinfo.st_mtime)
    print("The statinfo of path %s is %s, \n\twhich create date and modified date are %s and %s" % (fdpath, statinfo, create_date, modified_date))

结果如下图。

 类似资料:
  • 我在databricks中安装了一个s3 bucket,我可以看到文件列表,也可以使用python读取文件 我想找出我正在阅读的文件的上次修改日期,我找不到太多,但java选项数据砖读取Azure blob的上次修改日期为azure blob,数据砖中有一个python本机选项来读取文件元数据。

  • 问题内容: 如何通过Python更改Windows文件的文件创建日期? 问题答案: the牛为胜利而刮胡子。

  • 我正在使用的当前appender如下所示(它根据大小对日志文件进行归档)。

  • 我有以下代码,它基于今天的日期创建一个文件夹,并将文件从一个文件夹移动到新的文件夹。我有以下代码: 此代码创建一个文件夹,但不将任何文件复制到新创建的文件夹。正在将文件从FTP服务器复制到新文件夹。请建议一些复制这些文件的更改。 谢谢!

  • 我需要获取Azure Databricks下DBFS装载点(ADLS Gen1)中所有文件夹和文件的最后修改日期。文件夹结构如下: 使用以下Python代码获取最后修改日期: 从上面的代码中,我得到了所有包含文件的文件夹的正确修改日期。 但对于空文件夹,它会给出当前日期。不是上次修改日期。 然而,当我硬编码空文件夹的路径时,它会给出正确的修改日期: 打印(datetime.fromtimestam

  • 问题内容: 在我当前的项目中,我想按日期创建日志文件,即日志文件应驻留在 名称为date的文件夹中。归档也应在该特定文件夹中进行。 我正在使用的当前Appender看起来像这样(它会根据大小对日志文件进行归档)。 问题答案: 如fileNamePattern的文档中所述,您可以指定多个%d标记,以便将日期放入归档文件名的文件夹名称中: 请注意,只有一个%d令牌可以是主令牌,所有其他令牌必须通过传递