当前位置：首页 > 面试题库 >

Java读取具有7000万行文本的大文本文件

贺浩壤

2023-03-14

问题内容：

我有一个包含7000万行文本的大型测试文件。我必须逐行阅读文件。

我使用了两种不同的方法：

InputStreamReader isr = new InputStreamReader(new FileInputStream(FilePath),"unicode");
BufferedReader br = new BufferedReader(isr);
while((cur=br.readLine()) != null);

和

LineIterator it = FileUtils.lineIterator(new File(FilePath), "unicode");
while(it.hasNext()) cur=it.nextLine();

是否有另一种方法可以使此任务更快？

最好的祝福，

问题答案：

1）我确定速度没有差异，两者都在内部使用FileInputStream和缓冲

2）您可以进行测量并亲自查看

3）虽然没有性能优势，但我喜欢1.7方法

try (BufferedReader br = Files.newBufferedReader(Paths.get("test.txt"), StandardCharsets.UTF_8)) {
    for (String line = null; (line = br.readLine()) != null;) {
        //
    }
}

4）基于扫描仪的版本

    try (Scanner sc = new Scanner(new File("test.txt"), "UTF-8")) {
        while (sc.hasNextLine()) {
            String line = sc.nextLine();
        }
        // note that Scanner suppresses exceptions
        if (sc.ioException() != null) {
            throw sc.ioException();
        }
    }

5）这可能比其余的更快

try (SeekableByteChannel ch = Files.newByteChannel(Paths.get("test.txt"))) {
    ByteBuffer bb = ByteBuffer.allocateDirect(1000);
    for(;;) {
        StringBuilder line = new StringBuilder();
        int n = ch.read(bb);
        // add chars to line
        // ...
    }
}

它需要一些编码，但是由于，它确实可以更快ByteBuffer.allocateDirect。它允许操作系统从文件ByteBuffer直接读取字节，而无需复制

6）并行处理肯定会提高速度。创建一个大字节缓冲区，运行多个任务，将文件中的字节并行读取到该缓冲区中，当准备好找到行的第一行时，创建一个String，然后查找下一个…

类似资料：

Java读取200万行文本文件的最快方法

问题内容：目前，我正在使用扫描仪/文件阅读器，同时使用hasnextline。我认为这种方法效率不高。还有其他方法可以读取与此功能类似的文件吗？问题答案：您会发现这是所需的速度：您可以每秒读取数百万行。字符串拆分和处理很可能导致遇到的任何性能问题。
如何使用Java逐行读取大文本文件？

问题内容：我需要使用Java逐行读取大约5-6 GB的大型文本文件。我如何快速做到这一点？问题答案：常见的模式是使用如果你假设没有字符编码，则可以更快地读取数据。例如ASCII-7，但差别不大。你处理数据的时间很可能会花费更长的时间。一种不太常用的模式，可以避免line泄漏的范围。在Java 8中，你可以执行
读取Java中的文本文件

问题内容：我有一个文本文件。我想从一行到另一行检索内容。例如，文件可以是200K行。我想从第78行到第2735行读取内容。由于文件可能很大，所以我不想将整个内容读取到内存中。问题答案：这是一个可能的解决方案的开始：
用JAVA读取文本文件

可以使用FileReader直接读取文本文件我们为什么需要使用InputStream方法
Java最快的阅读200万行文本文件的方法

目前我正在使用扫描器/文件读取器，并使用while HasNextLine。我认为这种方法效率不高。有没有其他方法读取文件与此类似的功能？
Java用分隔符读取大文本文件

问题内容：我正在尝试读取以下形式的大文本文件：我想在文本文件中将此字符串作为一个大的Java字符串读取。这可能吗？我知道使用split方法。它可以逐行读取它，但我真正需要的是在“ +”号处分割此长文本字符串。之后，我想将其存储为数组，arraylist，列表，… 谁能帮我这个？因为互联网上的所有信息都只是逐行读取文件。提前致谢！问题答案：您可以使用或任何IO类读取文件。假设文件中包含该字

相关阅读

Java-按块读取文本文件 Java：如何读取文本文件从Java中的文本文件读取特定行 Python：循环读取所有文本文件行从文本文件中读取巨大的字符串行

相关文章

Python Pandas读取文件 PDFBox读取文档与文本文件的数据连接 Jsoup 读取文件获取HTML Java15 文本块

相关问答

具有文本限制的多行编辑文本在Swift？中逐行读取文本文件？BufferedReader和FileReader读取（）性能-大型文本文件如何从命令行读取文本文件 Java-Scanner类-读取文本文件时跳过第一行

相关工具

Marlin 中文版本 LCD JOE文本编辑器 Sphinx 文档工具 WEB FTP文件管理工具使用Shell脚本批量打包生成可配置的.ipa文件

相关文档

Python 文本处理 Axis2/Java 中文文档 JAVA AWT 中文文档 Java RMI 中文文档 Java XML 中文文档