当前位置: 首页 > 知识库问答 >
问题:

如何从平面文件中删除列名并替换为“头记录信息”..(文件名、时间戳等)

陶博赡
2023-03-14

共有1个答案

昝欣可
2023-03-14

我可以想出两种方法来做这件事,但这真的是你选择的偏好问题。

>

  • 执行已完成的操作(使用数据流任务填充标头信息)。接下来,为定义了所有列信息的文件创建另一个连接管理器。在常规选项卡上,指示有一个标头行要跳过,并取消选中第一个数据行中列名的复选框。然后,创建一个数据流任务,用数据填充文件,并使用此连接管理器。因此,当您的包运行时,第一个数据流任务需要首先运行并写入标题行。完成后,第二个程序将运行并用数据填充文件

    使用数据流任务将数据写入文件,然后使用脚本任务将列名替换为头行(或者如果没有列名,只需在文件的开头插入头行)。

  •  类似资料:
    • 我已经为我的应用程序配置了水槽代理,其中源是Spooldir,接收器是HDFS 我能够在hdfs中收集文件。 代理配置为: 我有以下格式的hdfs文件: /flume/events/file1.txt。1411543838171/水槽/事件/文件2.txt.1411544272696 我想知道我可以删除时间戳(1411543838171) /唯一号码,这是自动生成的每个事件的文件名?

    • 问题内容: 我正在使用HTML5构建拖放式Web应用程序,并将文件拖放到div上,当然要获取dataTransfer对象,这给了我FileList。 现在,我想删除一些文件,但是我不知道怎么办,或者甚至可能。 最好是我只想从FileList中删除它们;我没有用。但是,如果那不可能,我是否应该在与FileList交互的代码中编写检查代码?那看起来很麻烦。 问题答案: 如果只想删除几个选定的文件,则不

    • 我正在寻找一个简单的批处理脚本,它将允许我删除旧文件并记录它是否删除了旧文件。搜索完网站后,我发现“forfiles”非常有用: 来自:批处理文件以删除超过N天的文件 正如我所说,我关心的是记录已删除的内容。我尝试了很多东西,但仍然不起作用。这是我的实际代码: 日志文件已创建,但为空,旧文件不会被删除。(它应该删除我2016年的8个文件)当我使用原始代码时,它会删除文件。我可能读过关于逃离 目标是

    • 我的本地文件夹中有一个csv文件。我想阅读它,删除一列,并替换同一文件夹中的文件。 实际样本数据: 样本数据中的预期数据: 在这种情况下,我想删除列LASTNAME。在Java中可以有效地完成吗?

    • 我正在处理的数据集的列中有空格,我在尝试重命名spark dataframe列名时遇到了问题。尝试了StackOverflow中几乎所有可用的解决方案。好像什么都不管用。 注意:文件必须是拼花文件。 已尝试: 然后是df.printschema root 工作良好,但当我使用df.show()时,它会抛出相同的错误。 警告:停用警告1次;使用-deprecation重新运行详细信息 org.apa

    • 问题内容: 我想用当前时间戳命名由Java应用程序创建的新文件。 我需要这方面的帮助。如何命名使用当前时间戳创建的新文件?我应该包括哪些课程? 问题答案: 无需太复杂,请尝试以下一种衬垫: