当前位置: 首页 > 知识库问答 >
问题:

Database ricks将Rdata文件保存到AWS S3存储桶

彭存
2023-03-14

我使用数据砖在R中开发了一个模型。我想将输出数据文件保存在 AWS S3 存储桶上,但当我保存文件如下时,它不会保存到挂载的驱动器。

doc <- save(data, file=paste0(getwd(), "/datafile.RData"))

使用R将数据挂载到S3的最佳方法是什么?

我已经尝试了下面的示例代码,它可以工作,所以我知道我在AWS和Database ricks之间的连接可以工作。

%python
display(dbutils.fs.ls("/"))

共有1个答案

巫马承德
2023-03-14

来自Databricks文件系统(DBFS)文档:

您可以使用本地文件API来读写DBFS路径。Database ricks使用FUSE挂载 /dbfs配置每个集群节点,允许在集群节点上运行的进程使用本地文件API读写底层集中式存储层。使用本地文件API时,您必须提供 /dbfs.下的路径

例如:

save(data, file="/dbfs/datafile.RData")
 类似资料:
  • 我最近在学习如何阅读

  • 我尝试用以下代码保存从internet下载的文件 但在运行时,我得到的错误如下 03-04 20:42:51.080 8972-8972/com.example.me.demo2 E/BitmapFactory:无法解码流:java.io.FileNotFoundExcoop: /storage/emulated/0/.tanks/4a100abb-0e55-4062-8c37-f11f4189e

  • 我正在制作一个soundboard应用程序,当长按按钮1时,我需要共享sound1。我可以用以下代码创建共享菜单: 我可以与whatsapp和Google Drive完美共享音频文件,但其他应用程序不起作用。我听说您必须将文件复制到外部存储,并从那里共享它们。我已经搜索了将近两天,但我找不到这样做的方法。Stack上的其他文章也帮不了我:/ 如何在外部存储器中创建目录,将文件(sound1.ogg

  • 我相当愚蠢地上传了一个vhd到Azure文件存储,以为我可以从它创建一个虚拟机,却发现它真的需要在Blob存储中。 我知道我可以再上传一次,但它非常大,我的上传速度非常慢。 我的问题是-我可以将文件从文件存储移动到blob存储,而无需再次下载/上传吗?也就是说,Azure门户UI中是否有任何东西可以执行此操作,甚至是PowerShell命令?