当前位置: 首页 > 知识库问答 >
问题:

如何将RDD数据保存到json文件而不是文件夹中

司徒志
2023-03-14

我收到的流数据mydstream(dstream[String])希望保存在S3中(基本上,对于这个问题,我希望将输出保存在哪里并不重要,但我只是为了以防万一而提到它)。

是否可以将每个rdd[String](这些是JSON字符串)数据保存到JSON文件中,而不是文件夹中?我以为repartition(1)必须使用这个技巧,但它没有。

    myDStream.foreachRDD { rdd => 
       // datetimeString = ....
       rdd.repartition(1).saveAsTextFile("s3n://mybucket/keys/jsonFile-"+datetimeString+".json")
    }

共有1个答案

吴浩博
2023-03-14

AFAIK没有将其保存为文件的选项。因为它是一个分布式处理框架,而且不适合在单个文件上写,而不是每个分区在指定的路径上写它自己的文件

我们只能传递要保存数据的输出目录。OutputWriter将在指定路径内创建文件(取决于分区),文件名前缀为part-

 类似资料:
  • 我的应用程序将一些文件保存到设备上的数据/数据文件夹中。保存远程文件后,我会处理这些文件,并将它们复制到其他文件夹中。在之前测试过的所有设备上,All都能正常工作,但在galaxy s3上会生成空指针异常。似乎我不被允许在那个文件夹上写或处理文件!但只有新的星系s3!我也无法使用EclipseDDMS文件浏览器在数据文件夹中找到任何文件,而在模拟器(相同的android版本)中,我可以正确查看所有

  • 问题内容: 我有两个网站,一个是TLS,一个不是,这两个都是针对同一客户端的,但是我需要这些网站彼此(并且只能彼此)共享 用户 , 订单 , 帐户 等的通用数据。 通常可以使用数据完成此操作,但是我显然不能在其他站点上使用它们,而且我发现我可以将会话数据存储在数据库(MySQL)中,而不是文件系统中。 我已经四处搜寻,发现此有用的指南以及此较旧但 有用的指南。我还发现了该指南,该指南具有最新的My

  • 我有一个类似tmp的RDD。 其值如下所示。

  • 问题内容: 是否可以将JSON数据保存到本地文本文件中?因此,稍后我可以通过加载该文件再次使用它,并取回存储的JSON数据。其实我真正想做的是在文本文件中导出JSON数据,以便以后可以用作import.Any的建议或解决方案? 这是我要用于导出到文本的一些示例。 http://jsfiddle.net/k56eezxp/ 问题答案: 是否可以将JSON数据保存到本地文本文件中? 是。当前,链接的j

  • 问题内容: 假设我有一个如下所示的javascript对象: 我将其字符串化以转换为JSON。如何将此JSON保存到本地文本文件,以便可以在记事本等中打开它。 问题答案: Node.js: 浏览器(webapi):

  • 问题内容: 在我的Web应用程序中,我成功使用mybatis在html表中显示了数据。现在,我想将Mysql表的记录保存在一个json文件中并创建一个用户数组,我使用了Gson,问题是文件中只保存了一条记录。谢谢。 结果如下: servlet.java 问题答案: 您将所有用户写入同一文件,因此只保存了循环的最后一次迭代。 您可以将对象转换为json并写入一次(无需循环) 例: