当前位置：首页 > 面试题库 >

用Java读取相对较大的字节文件的最快方法

蓝慈

2023-03-14

问题内容：

用Java的I / O方法读取相对较大的文件的最快方法可能是什么？我当前的解决方案使用BufferedInputStream保存到分配有1024个字节的字节数组。然后将每个缓冲区保存在中，以ArrayList备后用。整个过程是通过单独的线程（可调用接口）调用的。

虽然不是很快。

    ArrayList<byte[]> outputArr = new ArrayList<byte[]>();      
    try {
        BufferedInputStream reader = new BufferedInputStream(new FileInputStream (dir+filename));

        byte[] buffer = new byte[LIMIT]; // == 1024 
            int i = 0;
            while (reader.available() != 0) {
                reader.read(buffer);
                i++;
                if (i <= LIMIT){
                    outputArr.add(buffer);
                    i = 0;
                    buffer = null;
                    buffer = new byte[LIMIT];
                }
                else continue;              
            }

         System.out.println("FileReader-Elements: "+outputArr.size()+" w. "+buffer.length+" byte each.");

问题答案：

我将使用足够快的内存映射文件来在同一线程中执行。

final FileChannel channel = new FileInputStream(fileName).getChannel();
MappedByteBuffer buffer = channel.map(FileChannel.MapMode.READ_ONLY, 0, channel.size());

// when finished
channel.close();

这假定文件小于2 GB，并且将花费10毫秒或更短的时间。

类似资料：

增量读取大文件的最快方法

问题内容：当给定一个MAX_BUFFER_SIZE的缓冲区以及一个远远超过该缓冲区的文件时，怎么办：以MAX_BUFFER_SIZE的块读取文件？尽快完成我尝试使用NIO 和常规IO 事实证明，常规IO在执行与NIO相同的操作时快约100倍。我想念什么吗？这是预期的吗？有没有更快的方法来读取缓冲区块中的文件？最终，我正在处理一个大文件，但我没有足够的内存来一次读取所有文件。相反，我想
用Java逐行读取和写入大文件的最快方法

问题内容：我一直在寻找最快的方法来用有限的内存（大约64MB）在Java中再次读写大文件（0.5-1 GB），这是最快的方法。文件中的每一行代表一条记录，因此我需要逐行获取它们。该文件是普通文本文件。我尝试了BufferedReader和BufferedWriter，但这似乎不是最好的选择。读写大小为0.5 GB的文件大约需要35秒钟，仅进行读写操作而不进行任何处理。我认为这里是写作的瓶颈，因
Java读取200万行文本文件的最快方法

问题内容：目前，我正在使用扫描仪/文件阅读器，同时使用hasnextline。我认为这种方法效率不高。还有其他方法可以读取与此功能类似的文件吗？问题答案：您会发现这是所需的速度：您可以每秒读取数百万行。字符串拆分和处理很可能导致遇到的任何性能问题。
从二进制文件读取大量int的最快方法

问题内容：我在嵌入式Linux设备上使用Java 1.5，并且希望读取具有2MB int值的二进制文件。（现在是4字节的Big Endian，但我可以决定格式）使用via 使用），这500 000个调用需要17秒才能读取，但是读入一个大字节缓冲区的文件需要5秒。我如何更快地将该文件读入一个巨大的int []？读取过程不应使用额外的512 kb。下面使用的这段代码并不比java io中的r
Java最快的阅读200万行文本文件的方法

目前我正在使用扫描器/文件读取器，并使用while HasNextLine。我认为这种方法效率不高。有没有其他方法读取文件与此类似的功能？
处理大文件的最快方法？

问题内容：我有多个3 GB的制表符分隔文件。每个文件中有2000万行。所有行都必须独立处理，任何两行之间都没有关系。我的问题是，什么会更快A.使用以下命令逐行阅读：还是B.将文件分块读取到内存中并进行处理，例如一次250 MB？处理不是很复杂，我只是在column1到column2的值中抓取值，等等。可能需要将一些列值加在一起。我在具有30GB内存的Linux机器上使用python 2.7

相关阅读

处理大文件的最快方法？Java：读取巨大文件的最后n行读取/存储大量多维数据的最快方法？（Java）读取Java中的大文件 C#中winform使用相对路径读取文件的方法

相关文章

Go语言使用buffer读取文件以字符串的形式读写文件 C++ getline()：从文件中读取一行字符串字节电商对话大模型一面字节后端hr面最舔的一集

相关问答

为什么使用BufferedInputStream逐字节读取文件比使用FileInputStream快？正在读取a。csv文件比读取压缩为的相同文件更快。广州 GraphX不适用于相对较大的图使用Java查找文件中的最大和最小数字使用vertx读取大文件

相关工具

我的快递快逸报表软件解压TexturePacker生成的文件 UIWebview字体变大变小利用QuickLook查看文件

相关文档

更好的 Java 中英文对照快学 Scala 读书笔记 Java 快速教程 Java 语言快速入门 Java 相关知识点汇总