问题：

将CSV文件合并到一个没有重复标题的文件中

越新霁

2023-03-14

我有一些具有相同列标题的CSV文件。例如

文件A

header1,header2,header3
one,two,three
four,five,six

文件B

header1,header2,header3
seven,eight,nine
ten,eleven,twelve

我想合并它，以便将数据合并到一个文件中，标题在顶部，但其他地方没有标题。

header1,header2,header3
one,two,three
four,five,six
seven,eight,nine
ten,eleven,twelve

实现这一目标的好方法是什么？

共有3个答案

薛宜

2023-03-14

在Java中这样做似乎有点重。它在Linux shell中非常简单：

(cat FileA ; tail --lines=+2 FileB) > FileC

夹谷星河

2023-03-14

下面是一个例子：

public static void main(String[] args) throws IOException {
    List<Path> paths = Arrays.asList(Paths.get("c:/temp/file1.csv"), Paths.get("c:/temp/file2.csv"));
    List<String> mergedLines = getMergedLines(paths);
    Path target = Paths.get("c:/temp/merged.csv");
    Files.write(target, mergedLines, Charset.forName("UTF-8"));
}

private static List<String> getMergedLines(List<Path> paths) throws IOException {
    List<String> mergedLines = new ArrayList<> ();
    for (Path p : paths){
        List<String> lines = Files.readAllLines(p, Charset.forName("UTF-8"));
        if (!lines.isEmpty()) {
            if (mergedLines.isEmpty()) {
                mergedLines.add(lines.get(0)); //add header only once
            }
            mergedLines.addAll(lines.subList(1, lines.size()));
        }
    }
    return mergedLines;
}

奚修伟

2023-03-14

这应该行得通。它检查正在合并的文件是否有匹配的头。否则会抛出异常。异常处理（关闭流等）已留作练习。

String[] headers = null;
String firstFile = "/path/to/firstFile.dat";
Scanner scanner = new Scanner(new File(firstFile));

if (scanner.hasNextLine())
    headers[] = scanner.nextLine().split(",");

scanner.close();

Iterator<File> iterFiles = listOfFilesToBeMerged.iterator();
BufferedWriter writer = new BufferedWriter(new FileWriter(firstFile, true));

while (iterFiles.hasNext()) {
  File nextFile = iterFiles.next();
  BufferedReader reader = new BufferedReader(new FileReader(nextFile));

  String line = null;
  String[] firstLine = null;
  if ((line = reader.readLine()) != null)
    firstLine = line.split(",");

  if (!Arrays.equals (headers, firstLine))
    throw new FileMergeException("Header mis-match between CSV files: '" +
              firstFile + "' and '" + nextFile.getAbsolutePath());

  while ((line = reader.readLine()) != null) {
    writer.write(line);
    writer.newLine();
  }

  reader.close();
}
writer.close();

类似资料：

将CSV文件合并为一个文件，没有重复的标题

问题内容：我有一些具有相同列标题的CSV文件。例如文件A 文件B 我想将其合并，以便将数据合并到一个文件中，文件头位于顶部，但其他任何地方都没有文件头。什么是实现此目标的好方法？问题答案：这应该工作。它检查要合并的文件是否具有匹配的头。否则将引发异常。异常处理（关闭流等）已作为练习。
将具有相同标题的多个CSV文件合并到不同的组文件中

嗨，我正在寻找一个最快的解决方案来处理csv文件的负载。情况：我在一个文件夹中有多个csv文件，它们的标题不同我已经对它们进行了预处理，以删除顶部的垃圾行，因此所有这些都有一个标准标头。我想将一组CSV文件与完全相同的侦听器合并到一个新文件夹中示例文件-1。csv 示例文件-2。csv 样本文件-3。csv 样本文件-4。csv 样本文件-5。csv 样品File-6.csv 样本文件-7
如何合并一个文件夹中的所有csv文件到单个csv列？

给定一个文件夹，其中包含多个具有不同列长度的csv文件必须使用python将它们合并到单个csv文件中，并将文件名打印为一列。输入：https://www.dropbox.com/sh/1mbgjtrr6t069w1/AADC3ZrRZf33QBil63m1mxz_a?dl=0 输出：
合并多个CSV文件而无需重复标题（使用Python）

问题内容：我是Python的初学者。我有多个CSV文件（超过10个），并且它们的列数均相同。我想将所有这些文件合并到一个CSV文件中，在该文件中不再重复标题。因此，从本质上讲，我只需要具有所有标题的第一行，然后就需要合并所有CSV文件中的所有行。我该怎么做呢？到目前为止，这是我尝试过的。问题答案：虽然我认为最好的答案是来自@valentin的答案，但您可以完全不用模块就可以做到这一点：
在python中合并CSV文件[重复]

我一直试图将几个csv文件合并成一个，但它显示出一些错误。我是python新手，非常感谢您的帮助。以下是我的代码：错误显示为：
合并数百万个具有不同标题的csv文件

我有数百万个不同标题的csv文件，我想把它们合并到一个大数据框中。我的问题是我尝试过的解决方案有效，但太慢了！顺便说一句，我可以访问Sparklyr在我的实验室中处理多节点集群，这个大数据工具会有帮助吗？文件如下所示：文件1 校长1，校长3，校长5 a、 b，c 文件2 校长4，校长2 e、 f 文件3 校长2，校长6 a， c 我想把它们合并成：校长1，校长2，校长3，校长4，校长5，校

将CSV文件合并到一个没有重复标题的文件中

共有3个答案

相关问答

相关文章

相关阅读

相关工具

相关文档