当前位置: 首页 > 知识库问答 >
问题:

Azure Databricks -导出和导入DBFS文件系统

周宏胜
2023-03-14

我们刚刚在资源组中创建了一个新的 Azure 数据砖资源。在同一资源组中,有一个 Azure 数据砖的旧实例。从这个旧的数据砖实例开始,我将数据存储在dbfs中的数据复制到最新的数据砖实例中。我该怎么做?我的想法是使用FS命令将数据从一个dbfs复制或移动到另一个数据库,可能是装入卷,但我不明白我该怎么做。你有什么迹象吗?

谢谢,弗朗西斯科

共有1个答案

宇文念
2023-03-14

不幸的是,没有直接的方法可以将文件/文件夹从一个工作区导出和导入到另一个工作区。

注意:强烈建议:不要在默认的DBFS文件夹中存储任何生产数据

如何将文件/文件夹从一个工作空间复制到另一个工作区?

您需要从一个工作区手动下载文件/文件夹,并将文件/文件夹上载到另一个工作空间。

最简单的方法是使用DBFS资源管理器:

点击此链接查看:https://imgur.com/aUUGPXR

将文件/文件夹从 DBFS 下载到本地计算机

方法1:使用Databricks CLI

DBFS命令行界面(CLI)使用DBFS API向DBFS公开易于使用的命令行界面。使用此客户端,您可以使用与Unix命令行上使用的命令类似的命令与DBFS交互。例如:

# List files in DBFS
dbfs ls
# Put local file ./apple.txt to dbfs:/apple.txt
dbfs cp ./apple.txt dbfs:/apple.txt
# Get dbfs:/apple.txt and save to local file ./apple.txt
dbfs cp dbfs:/apple.txt ./apple.txt
# Recursively put local dir ./banana to dbfs:/banana
dbfs cp -r ./banana dbfs:/banana

参考:安装和配置Azure Databricks CLI和Azure Databricks–访问DBFS

方法2:使用名为DBFS资源管理器的第三方工具

DBFS资源管理器是作为上传和下载文件到Databricks文件系统(DBFS)的一种快捷方式而创建的。这将适用于AWS和Azure databrick实例。为了进行连接,您需要在web界面中创建一个不记名令牌。

将文件/文件夹从本地机器上传到DBFS:

有多种方法可以将文件从本地计算机上传到 Azure 数据砖 DBFS 文件夹。

方法1:使用Azure Databricks门户。

方法 2: 使用数据砖 CLI

DBFS命令行界面(CLI)使用DBFS API向DBFS公开易于使用的命令行界面。使用此客户端,您可以使用与Unix命令行上使用的命令类似的命令与DBFS交互。例如:

# List files in DBFS
dbfs ls
# Put local file ./apple.txt to dbfs:/apple.txt
dbfs cp ./apple.txt dbfs:/apple.txt
# Get dbfs:/apple.txt and save to local file ./apple.txt
dbfs cp dbfs:/apple.txt ./apple.txt
# Recursively put local dir ./banana to dbfs:/banana
dbfs cp -r ./banana dbfs:/banana

方法3:使用名为DBFS资源管理器的第三方工具

DBFS资源管理器是作为上传和下载文件到Databricks文件系统(DBFS)的一种快捷方式而创建的。这将适用于AWS和Azure databrick实例。为了进行连接,您需要在web界面中创建一个不记名令牌。

步骤1:下载并安装DBFS Explorer并安装它。

步骤2:打开DBFS浏览器,输入:数据块URL和个人访问令牌

Step3:选择要从本地计算机上传文件的文件夹,只需拖放到要上传的文件夹中,然后单击上传即可。

 类似资料:
  • 本文向大家介绍php实现CSV文件导入和导出,包括了php实现CSV文件导入和导出的使用技巧和注意事项,需要的朋友参考一下 项目开发中,很多时候要将外部CSV文件导入到数据库中或者将数据导出为CSV文件,那么具体该如何实现呢?本文将使用PHP并结合mysql,实现了CSV格式数据的导入和导出功能。 我们先准备mysql数据表,假设项目中有一张记录学生信息的表student,并有id,name,se

  • 1 引言 上一讲的确很长,但如果看代码你会发现,代码主要在 model 的调整中,urls.py 的工作不多,而连一行 view 的代码都没有写。是不是非常方便呢! 那么让我们来继续完善这个通讯录吧。 现在我想完成的是: 增加批量导入和导出功能 为什么要批量导入呢?因为一般情况下,我一定是已经有了一个通讯录文件(象以前我说过的Excel文件),那么现在需要转到 web 上来,难道要我一条条全部手工

  • 导出(export)和导入(import)指令有几种语法变体。 在上一节,我们看到了一个简单的用法,现在让我们来探索更多示例吧。 在声明前导出 我们可以通过在声明之前放置 export 来标记任意声明为导出,无论声明的是变量,函数还是类都可以。 例如,这里的所有导出均有效: // 导出数组 export let months = ['Jan', 'Feb', 'Mar','Apr', 'Aug',

  • 导出和导入容器 导出容器 如果要导出本地某个容器,可以使用 docker export 命令。 $ docker container ls -aCONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NA

  • 我已在我的AWS Database ricks集群上成功安装了两个h2o,然后成功启动了h2o服务器: 当我尝试导入存储在Database ricks DBFS中的iris CSV文件时: 我得到一个H2OResponseError:服务器错误water . exceptions . h2onotfoundargumentexception CSV文件绝对在那里;在同一个Databricks笔记本

  • 本文向大家介绍PHP实现CSV文件的导入和导出类,包括了PHP实现CSV文件的导入和导出类的使用技巧和注意事项,需要的朋友参考一下 本文实例讲述了PHP实现CSV文件的导入和导出类。分享给大家供大家参考。具体如下: 希望本文所述对大家的php程序设计有所帮助。