问题：

在Java中读取大文件，速度太慢，超出了gc开销限制[duplicate]

乐正光誉

2023-03-14

当我运行下面的代码时，我有一个大文件（大约3GB）并读入ArrayList，几分钟后代码运行非常慢，CPU使用率很高。几分钟后，eclipse控制台显示错误java。lang.OutOfMemoryError:超出GC开销限制。

操作系统：windows2008R2，

日食伊尼

-startup
plugins/org.eclipse.equinox.launcher_1.3.0.v20130327-1440.jar
--launcher.library
plugins/org.eclipse.equinox.launcher.win32.win32.x86_64_1.1.200.v20140116-2212
-product
org.eclipse.epp.package.standard.product
--launcher.defaultAction
openFile
#--launcher.XXMaxPermSize
#256M
-showsplash
org.eclipse.platform
#--launcher.XXMaxPermSize
#256m
--launcher.defaultAction
openFile
--launcher.appendVmargs
-vmargs
-Dosgi.requiredJavaVersion=1.6
-Xms10G
-Xmx10G
-XX:+UseParallelGC
-XX:ParallelGCThreads=24
-XX:MaxGCPauseMillis=1000
-XX:+UseAdaptiveSizePolicy

java代码：

BufferedInputStream bis = new BufferedInputStream(new FileInputStream(new File("/words/wordlist.dat")));        
            InputStreamReader isr = new InputStreamReader(bis,"utf-8");
            BufferedReader in = new BufferedReader(isr,1024*1024*512);

            String strTemp = null;
            long ind = 0;

            while (((strTemp = in.readLine()) != null)) 
            {
                matcher.reset(strTemp);

                if(strTemp.contains("$"))
                {
                    al.add(strTemp);
                    strTemp = null;
                }
                ind = ind + 1;
                if(ind%100000==0)
                {
                    System.out.println(ind+"    100,000 +");
                }

            }
            in.close();

我的用例：

neural network
java
oracle
solaris
quick sort
apple
green fluorescent protein
acm
trs

共有1个答案

柳弘方

2023-03-14

用java编写一个程序来统计在搜索词日志列表中找到关键字的次数

我建议你就这么做。创建一个地图，统计关键字的出现次数，或者重要的所有单词。

使用Java8流，您可以在一行或两行中完成这项工作，而无需立即将整个文件加载到内存中。

try (Stream<String> s = Files.lines(Paths.get("filename"))) {
    Map<String, Long> count = s.flatMap(line -> Stream.of(line.trim().split(" +")))
            .collect(Collectors.groupingBy(w -> w, Collectors.counting()));
}

类似资料：

获取java。lang.OutOfMemoryError：读取excel文件时超出了GC开销限制

我正在尝试使用Apache POI读取一个具有2G堆内存的简单8MB文件。但我正在摆脱记忆错误。以下是生成问题的代码：我不认为这个操作需要这么多内存，我知道有很多问题要问，但我尝试了很多事情？
Gridgain：java.lang.OutOfMemoryError：超出了GC开销限制

问题内容：我正在尝试建立一个包含2台服务器的Gridgain集群。使用 GridDataLoader 将.csv文件中的数据（100万至5000万个数据）加载到Gridgain 。从加载的数据中找到最小值，最大值，平均值等，当在Eclipse中作为独立应用程序运行时，我得到正确的输出。但是，在建立集群（eclipse环境中的2个服务器中的2个节点+我的Eclipse环境中的1个节点）的同
java.lang.OutOfMemoryError：超出了GC开销限制

问题内容：我在一个程序中创建了这个错误，该程序创建了几个（数十万）HashMap对象，每个对象都有几个（15-20）文本条目。这些字符串必须全部收集（不分解成较小的数量），然后再提交给数据库。根据Sun的说法，该错误发生“如果在垃圾回收上花费了太多时间：如果在垃圾回收上花费了总时间的98％以上，而回收不到2％的堆，则将引发OutOfMemoryError。 ”。显然，可以使用命令行将参数传递
超出Java GC开销限制

我正在尝试预处理一个大的txt文件（10G），并将其存储在二进制文件中以备将来使用。当代码运行时，速度会减慢，并以异常线程"main"java.lang.OutOfMemoryError： GC开销限制超过输入文件具有以下结构这是我正在使用的代码：基本上，它通过in文件并将数据存储到对象HMbicnt（这是一个哈希映射）。一旦在第二列中遇到新值，它应该将对象写入输出文件，释放内存并继续。
java.lang.OutOfMemoryError：Android 1.4超出了GC开销限制

问题内容：我收到 java.lang.OutOfMemoryError：在Android 1.4上运行gradle时，超出了GC开销限制 …这是我的依赖：如何解决？问题答案：将此添加到您的android闭包（构建gradle）：这样可以解决您的问题。不过，如果您遇到问题，请参见以下链接 GC开销限制超出错误
java错误java.lang.OutOfMemoryError：超出了GC开销限制？

问题内容：我执行JUnit测试时收到以下错误消息：我知道是什么OutOfMemoryError，但是GC开销限制是什么意思？我该如何解决？问题答案：该消息表示由于某种原因，垃圾收集器占用了过多的时间（默认情况下为该进程所有CPU时间的98％），并且每次运行时恢复的内存很少（默认为堆的2％）。这实际上意味着你的程序停止任何进展，并且一直在忙于仅运行垃圾回收。为了防止你的应用程序浪费CPU

在Java中读取大文件，速度太慢，超出了gc开销限制[duplicate]

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档