当前位置: 首页 > 面试题库 >

使用ServletOutputStream在Java Servlet中写入非常大的文件而不会出现内存问题

郭翰翮
2023-03-14
问题内容

我正在使用IBM Websphere Application Server v6和Java
1.4,并试图将CSV大文件写入ServletOutputStream以便用户下载。目前文件大小为50-750MB。

较小的文件并不会引起太大的问题,但是对于较大的文件,似乎是将其写入堆中,这随后导致OutOfMemory错误并导致整个服务器停机。

这些文件只能通过HTTPS提供给经过身份验证的用户,这就是为什么我通过Servlet而不是仅仅将它们粘贴在Apache中为它们提供服务的原因。

我正在使用的代码是(消除了一些绒毛):

    resp.setHeader("Content-length", "" + fileLength);
    resp.setContentType("application/vnd.ms-excel");
    resp.setHeader("Content-Disposition","attachment; filename=\"export.csv\"");

    FileInputStream inputStream = null;

    try
    {
        inputStream = new FileInputStream(path);
        byte[] buffer = new byte[1024];
        int bytesRead = 0;

        do
        {
            bytesRead = inputStream.read(buffer, offset, buffer.length);
            resp.getOutputStream().write(buffer, 0, bytesRead);
        }
        while (bytesRead == buffer.length);

        resp.getOutputStream().flush();
    }
    finally
    {
        if(inputStream != null)
            inputStream.close();
    }

FileInputStream似乎没有,如果我写到另一个文件或只是删除完全写入内存使用情况似乎并不成为一个问题而导致问题。

我在想的是将resp.getOutputStream().write其存储在内存中,直到可以将数据发送到客户端为止。因此,可能会读取整个文件并将其存储在resp.getOutputStream()导致我的内存问题并崩溃的地方!

我已经尝试过缓冲这些流,还尝试过使用from的Channels
java.nio,这些似乎都没有对我的内存问题产生任何影响。我还刷新了OutputStream循环的每个迭代一次,并在循环之后刷新了一次,但这没有帮助。


问题答案:

默认情况下,平均体面的servlet容器本身每2KB刷新一次流。你真的应该没有需要再调用flush()OutputStreamHttpServletResponse间隔顺序时,从一个相同的源流数据。例如,在Tomcat(和Websphere!)中,可以将其配置bufferSizeHTTP连接器的属性。

如果内容长度是事先未知的(按照Servlet
API规范
!),并且客户端支持HTTP
1.1,那么普通的体面servlet容器也只会分块传输数据。

问题症状至少表明servlet容器在刷新之前正在缓冲整个流在html" target="_blank">内存中。这可能意味着未设置内容长度标头和/或servlet容器不支持分块编码和/或客户端不支持分块编码(即,它正在使用HTTP
1.0)。

要解决一个或另一个问题,只需预先设置内容长度:

response.setHeader("Content-Length", String.valueOf(new File(path).length()));


 类似资料:
  • 我用SXSSF写了100万条记录(最坏的情况)。 以下是我编码的方式。我必须将记录写入已经存在的excel模板。此模板在类路径中可用。我将此模板复制到公共位置。使用 XSSFWorkBook 加载此文件。SXSSFWorkbook 使用 XSSFWorkBook 和 window size(-1) 作为参数进行初始化。 当记录计数达到100的倍数时,我将冲洗工作表。 但是在执行这个过程中,堆内存逐

  • 我们在项目中使用Apache POI(3.9版)来创建PowerPoint (pptx)文件。但是,其中一些变得非常大(2000张幻灯片,每张幻灯片上有许多形状),因此生成会产生< code>GC开销限制超出错误。 堆空间大小不在我们的控制范围内,因为我们只为 RCP“父”应用程序开发一个插件。 有没有办法写(和读)这么大的文件?我们对Excel文档使用了流式API,并取得了巨大的成功,但是没有针

  • 问题内容: 为什么行得通? 而这不是吗? 我在带有MS VS 2008的Win XP上尝试了这两个程序,均已编译且没有错误,并且第一个程序运行无任何错误。第二个弹出一些错误窗口,但是我不记得它并且无法复制(此刻无法访问Windows)。 我还在具有g ++的Linux(Kubuntu 10.10,预编译的内核软件包版本2.6.35.23.25)上进行了尝试,并且可以编译并运行而没有任何错误。 为什

  • 如何将内存中的zipfile写入文件?

  • 问题内容: 将File写入javax.servlet.ServletOutputStream的最有效方法是什么? 编辑: 如果使用NIO会更有效吗? 问题答案: 哪里是的FileInputStream和是。 IOUtils是Apache Commons中 Commons IO 模块的实用程序。

  • 我在把数据写到excel文件时遇到了问题。我使用的是apache POI 4.1.2版本库。下面是示例代码。 在excel文件中保存的最后一列单元格中,以前的单元格保持为空白。请帮忙,如果我做错了什么,请告诉我?