当前位置: 首页 > 知识库问答 >
问题:

如何将数据从大型机拉到Hadoop

许琛
2023-03-14

我在主机里有文件。我希望将这些数据推送到Hadoop(HDFS)/hive。

我可以将Sqoop用于大型机DB2数据库,并将其导入配置单元,但对于文件(如COBOLVASM等)呢

共有1个答案

顾宣
2023-03-14

COBOL是一种编程语言,而不是一种文件格式。如果您需要导出由COBOL程序生成的文件,您可以使用与这些文件由C、C++、Java、Perl、PL/I、Rexx等生成相同的技术。

通常,您将有三种不同的数据源:平面文件、VSAM文件和DBMS(如DB2或IMS)。

DMBSs有导出实用工具将数据复制到平面文件中。请记住,DB2中的数据很可能是规范化的,因此您可能需要相关表的内容才能理解这些数据。

VSAM文件可以通过IDCAMS实用工具导出到平面文件。

我强烈建议您先将文件转换成文本格式,然后再将它们转移到另一个带有不同代码页的框中。试图处理混合文本(必须转换其代码页)和二进制文件(必须不转换其代码页,但可能必须从大endpoint转换为小endpoint)比预先进行转换更难。

转换可能通过大型机上的SORT实用程序完成。大型机排序实用程序往往具有广泛的数据操作功能。您可以使用其他机制(其他实用工具、用您选择的语言编写的html" target="_blank">自定义代码、购买的包),但在这些情况下,我们倾向于这样做。

这并不是该主题的详尽报道,但它将使您开始。

 类似资料:
  • 是否有一种方法可以使用SQOOP将数据从hadoop导出到大型机。我对大型机很陌生。我明白我们可以在从大型机到Hadoop的数据中进行sqoop。我浏览了一下sqoop文档,但没有提到任何关于导出的内容 感谢你的帮助。

  • 我发现SQOOP1.4.6可以连接到大型机,它可以从大型机PDS中提取数据,并将其放入hdfs/hive/hbase或accolumo中。 我想知道它是支持打包的十进制数据类型还是只支持简单的数据类型?有人能帮我了解一下SQOOP1.4.6支持什么大型机文件格式吗? 提前致谢 参考https://sqoop.apache.org/docs/1.4.6/sqoopuserguide.html

  • 问题内容: 我不需要丢失Redis上的任何数据,并且它具有较高的写入请求,因此我不能使用AOF持久性。RDB可以帮到您,但也许有可能丢失上次备份中的某些数据。 现在,我将复制视为备份,因此当主服务器崩溃,重新启动或发生其他任何事情时,我已经同步了从属服务器中的数据并可以再次还原它。 现在有什么办法可以将master设置为slave,并在崩溃时自动将slave设置为master,然后将它们同步? 问

  • 我的数据来自名为Menu的模态类,通过创建其对象菜单。现在我如何将菜单名称发送到tableview以在特定单元格中显示 在这里,所有数据都通过menus对象保存在Menu类中。我添加了向tableview显示数据的代码。在这里,我创建了自定义tableview并尝试填充它 它不起作用。如何实施? 它显示了项目ame.classname

  • 我正在尝试从jenkins master中的git存储库中提取数据(文件),然后将这些文件推送到多个从机。我正在使用复制工件到从机插件(https://wiki.jenkins-ci.org/display/jenkins/Copy+to+Slave+plugin)将数据从主机复制到从机。但是我无法找到如何指定要复制文件的从机的名称。请帮助

  • 原因是: 这是在主服务器上设置的,由于最大内存不可用,它会中断新从服务器的复制。我看到这个问题Redis复制和客户机输出缓冲区限制,类似的问题正在讨论,但我有一个更广泛的问题范围。 我们不能用很多内存。那么,在这种情况下,有什么可能的方法来进行复制,以防止主服务器上的任何失败(WRT.内存和延迟影响)