JDK7中引入了新的文件操作类java.nio.file.File,它包含了很多有用的方法来操作文件,比如检查文件是否为隐藏文件,或者是检查文件是否为只读文件。开发者还可以使用Files.readAllBytes(Path)方法把整个文件读入内存,此方法返回一个字节数组,还可以把结果传递给String的构造器,以便创建字符串输出。此方法确保了当读入文件的所有字节内容时,文件属性是关闭的,否则就会出现IO异常或其它的未检查异常。这意味着在读文件到最后的块内容后,无需关闭文件。
要注意,此方法不适合读取很大的文件,因为可能存在内存空间不足的问题。开发者还应该明确规定文件的字符编码,以避免任异常或解析错误。
如果你想读入文件作为字符串,那么你还可以使用readAllLines(Path path, Charset cs)方法,此方法与之前的方法相似,也是在读完文件后无需关闭文件。但是它返回的不是字节数组,而是字符串数组。而且,Java8重写了此方法,无需指定字符集,直接使用UTF-8编码进行字符串转换。
如果你想一行一行的读入文件作为字符串,那么你可以使用Files.lines()方法,它会从读入的文件中返回字符串流,并使用UTF-8编码把字节转换成字符。使用forEach()方法,可以只用一行Java代码实现把文件的所有内容输出到控制台,如下面第三个代码片段。
import java.io.IOException; import java.nio.charset.StandardCharsets; import java.nio.file.Files; import java.nio.file.Paths; import java.util.List;public class FileReadingTest { public static void main(String[] args) throws IOException { // Java 7 例子 // Files.readAllBytes默认以UTF-8编码读入文件,故文件的编码如果不是UTF-8,那么中文内容会出现乱字符 System.out.println(new String(Files.readAllBytes(Paths.get("D:\\jd.txt")))); // Java 8例子 List<String> lines = Files.readAllLines(Paths.get("D:\\jd.txt"), StandardCharsets.UTF_8); StringBuilder sb = new StringBuilder(); for(String line : lines){ sb.append(line); } String fromFile = sb.toString(); System.out.println(fromFile);
} }
如果使用的不是JDK7,而是JDK8,那么一行代码即可完成读文件。
import static java.lang.System.out; import static java.nio.file.Files.readAllBytes; import static java.nio.file.Paths.get;import java.io.IOException; public class FileIntoString { public static void main(String[] args) throws IOException { // 一行代码搞定读文件,默认是UTF-8编码 out.println(new String(readAllBytes(get("d:/jd.txt")))); } }
如果使用JDK8,那么还可以使用流API来读写文件,这样代码更简洁、高效。
下面的例子中,lines()方法返回字符串流,字符串使用的是UTF-8编码。如下:
import java.io.IOException; import java.nio.charset.StandardCharsets; import java.nio.file.Files; import java.nio.file.Paths;public class Java8FileReader { public static void main(String[] args) throws IOException { // Java8用流的方式读文件,更加高效 Files.lines(Paths.get("D:\\jd.txt"), StandardCharsets.UTF_8).forEach(System.out::println); } }
上面的例子要注意几点:
1)文件可能很大,可能会超出内存空间,使用前要做评估。
2)要输出日志,记录为什么无法读取文件或者在阅读文件时遇到的任何错误。
3)在把字节转换成字符时,应该指定字符编码。
4)要处理文件不存在的情况。
还要注意,如果读入的文件的编码是ANSI编码,那么上面的例子在读取文件内容时会报java.nio.charset.MalformedInputException: Input length = 1错误。
问题内容: 我已经从Word DOCX文档(oleObject1.bin …等)中提取了许多OleObject文件。是否有开放源代码(主要在Java中)才能读取此文件。(如果可以轻松地移植到Java,我只会对* .net代码感兴趣)。我对Word文档的其余部分(在此问题中)不感兴趣。有一个Apache项目(http://poi.apache.org/)-我对它的工作方式很感兴趣 问题答案: Apa
问题内容: 现在我使用: 但是为了使代码看起来更好,我可以这样做: 使用上述语法时,如何关闭文件以释放系统资源? 问题答案: 您实际上不必关闭它-Python将在垃圾回收期间或程序退出时自动完成它。但是正如@delnan指出的,出于各种原因,显式关闭它是一种更好的做法。 因此,可以做些什么来使其简短,简单和明确: 我认为,现在只有两行,并且可读性强。
我有一个方法,它迭代一个映射,对值执行一个操作,并填充一个要返回的映射。 我的问题是,我如何将其转换为Java8(执行不循环的操作)? 代码:
问题内容: 如何使用fseek逐行读取文件? 代码可能会有所帮助。必须是跨平台和纯PHP。 提前谢谢了 问题答案: 问题是使用fseek进行询问,因此只能假定性能是一个问题,而file()不是解决方案。这是使用fseek的一种简单方法: 我的file.txt 和代码: 输出: 您不必像我一样附加到$ lines数组,如果这是脚本的目的,则可以立即打印输出。如果要限制行数,也很容易引入计数器。
问题内容: 我正在尝试一次读取一行大文件。我在Quora上发现了一个与该主题有关的问题,但我缺少一些联系以使整个组件组合在一起。 我想弄清楚的一点是,如何一次从文件而不是如本示例中的STDIN读取一行。 我试过了: 但它不起作用。我知道,在紧急情况下,我可能会转而使用PHP之类的东西,但是我想弄清楚这一点。 我不认为其他答案会起作用,因为该文件比我在其上运行的具有内存的服务器大得多。 问题答案: