当前位置: 首页 > 面试题库 >

如何从文件内容创建Java字符串?

戚祺
2023-03-14
问题内容

我已经在下面使用过一段时间了。至少在我访问过的网站上,它似乎是分布最广的。

在Java中,是否有更好/不同的方式将文件读取为字符串?

private String readFile(String file) throws IOException {
    BufferedReader reader = new BufferedReader(new FileReader (file));
    String         line = null;
    StringBuilder  stringBuilder = new StringBuilder();
    String         ls = System.getProperty("line.separator");

    try {
        while((line = reader.readLine()) != null) {
            stringBuilder.append(line);
            stringBuilder.append(ls);
        }

        return stringBuilder.toString();
    } finally {
        reader.close();
    }
}

问题答案:

读取文件中的所有文本

Java 11添加了readString()方法来读取小文件,以String保留行终止符:

String content = Files.readString(path, StandardCharsets.US_ASCII);

对于介于Java 7和11之间的版本,这是一个紧凑而健壮的习惯用法,它包装在实用程序方法中:

static String readFile(String path, Charset encoding)
  throws IOException
{
  byte[] encoded = Files.readAllBytes(Paths.get(path));
  return new String(encoded, encoding);
}

从文件中读取文本行

Java 7添加了一种便捷方法,可以将文件读取为文本行(以表示)List<String>。这种方法是“有损的”,因为从每行的末端剥去了行分隔符。

List<String> lines = Files.readAllLines(Paths.get(path), encoding);

Java 8添加了Files.lines()生成的方法Stream<String>。同样,此方法是有损的,因为剥去了行分隔符。如果IOException在读取文件时遇到,则会将其包装在中UncheckedIOException,因为Stream它不接受引发检查异常的lambda

try (Stream<String> lines = Files.lines(path, encoding)) {
  lines.forEach(System.out::println);
}

这Stream确实需要close()打电话;这个在API上的文档很少,我怀疑很多人甚至没有注意到Stream有一个close()方法。确保使用如图所示的ARM模块。

如果使用的是文件以外的源,则可以改用lines()方法BufferedReader。

内存利用率

保留换行符的第一种方法可能临时需要占用文件大小几倍的内存,因为在短时间内,原始文件内容(字节数组)和解码后的字符(即使已编码也为16位) (文件中的8位)一次存储在内存中。将其应用于相对于可用内存较小的文件是最安全的。

第二种方法是读取行,通常可以提高内存效率,因为用于解码的输入字节缓冲区不需要包含整个文件。但是,它仍然不适用于相对于可用内存而言非常大的文件。

为了读取大文件,你需要为程序提供不同的设计,即从流中读取文本块,对其进行处理,然后再移至下一个,重新使用相同的固定大小的内存块。在此,“大”取决于计算机规格。如今,此阈值可能是许多GB的RAM。Stream<String>如果输入的“记录”恰好是单独的行,则使用a的第三种方法是一种方法。(使用的readLine()方法BufferedReader等效于此方法。)

字符编码

原始帖子的示例中缺少的一件事是字符编码。在某些特殊情况下,平台默认值是你想要的,但是很少见,你应该可以证明自己的选择合理。

StandardCharsets类中定义的所有Java运行时所需要的编码的一些常量:

String content = readFile("test.txt", StandardCharsets.UTF_8);

该平台默认可从该Charset类本身:

String content = readFile("test.txt", Charset.defaultCharset());


 类似资料:
  • 本文向大家介绍如何从Java ArrayList创建字符串?,包括了如何从Java ArrayList创建字符串?的使用技巧和注意事项,需要的朋友参考一下 要将ArrayList的内容转换为String,创建一个StringBuffer对象,将ArrayList的内容附加到该对象,最后使用toString()方法将StringBuffer对象转换为String 。 示例 输出结果

  • 问题内容: 在我的gulpfile中,我在字符串中有一个版本号。我想将版本号写入文件。在Gulp中有没有很好的方法可以做到这一点,还是我应该看看更通用的NodeJS API? 问题答案: 如果您想以类似口水的方式执行此操作,则可以创建“假”黑胶文件流并按常规方式调用。这是用于创建流的函数。“ stream”是一个核心模块,因此您不需要安装任何东西: 您可以像这样使用它:

  • 问题内容: 我有一个像这样的文本文件: 我想要一个像这样的字符串数组: 我试过了 : 任何人都可以帮助我…。所有答案将不胜感激… 问题答案: 根据您的输入,您就快到了。您错过了循环中保持从文件读取每一行的关键点。由于您不事先知道文件中的总行数,因此请使用集合(动态分配的大小)来获取所有内容,然后将其转换为的数组(这是您想要的输出)。 像这样: 那么输出()将是: 这不是最佳解决方案。其他更 聪明的

  • 我正在构建一个创建XML文件的简单java程序。我正在构建以下代码: 但如果我尝试启动此代码,我会出现以下错误: 线程“AWT-EventQueue-0”java中出现异常。lang.AbstractMethodError:gnu。xml。dom。DomDocument。com上的getXmlStandalone()Z。太阳组织。阿帕奇。泽兰。内部的xsltc。特拉克斯。DOM2TO。com上的s

  • 我正在编写一个Java Web服务,可以在其中上传3D对象,对其进行操作并存储它。 我试图做的是创建一个<code>AIScene作为输入参数,即文件本身(它的内容)。 我在文档中找不到这样做的方法,所有导入方法都需要路径。 现在,我要看一下Assimp的java版本和C版本。用哪一个来解决这个问题并不重要。 编辑:我试图完成的代码: 调试方法时,我在绑定到本机的方法中发现了访问冲突: 这是信息:

  • 问题内容: 我有一个字符串类型为\ u00C3的文件。我想创建一个由Java中的unicode表示的unicode字符。我尝试过但找不到。救命。 编辑:当我阅读文本文件时,字符串将包含“ \ u00C3”,而不是Unicode字符,而是ASCII字符’'‘u’‘0’‘0’‘3’。我想从该ASCII字符串形成unicode字符。 问题答案: 我在网上的某个地方捡到了这个: