当前位置：首页 > 面试题库 >

如何读取Java中具有特定字符编码的文件？

商德泽

2023-03-14

问题内容：

我试图根据此方法的输出以UTF-8或Windows-1252格式读取文件：

public Charset getCorrectCharsetToApply() {
    // Returns a Charset for either UTF-8 or Windows-1252.
}

到目前为止，我有：

String fileName = getFileNameToReadFromUserInput();
InputStream is = new ByteArrayInputStream(fileName.getBytes());
InputStreamReader isr = new InputStreamReader(is, getCorrectCharsetToApply());
BufferedReader buffReader = new BufferedReader(isr);

我遇到的问题是将BufferedReader实例转换为FileReader。

此外：

文件本身的名称（fileName）不能被认为是特定的Charset; 有时文件名将包含UTF-8字符，有时还包含Windows-1252。文件的内容也是如此（但是，如果文件名和文件内容始终具有匹配的字符集）。
只有内部的逻辑getCorrectCharsetToApply()可以选择要应用的字符集，因此在调用此方法之前尝试按文件名读取文件的结果非常好，Java尝试使用错误的编码读取文件名…导致文件死亡！

提前致谢！

问题答案：

因此，首先要注意的是，一定要意识到，fileName.getBytes()有了文件名，就得到文件名的字节，而不是文件本身。

其次，阅读FileReader的文档：

此类的构造函数假定默认字符编码和默认字节缓冲区大小是适当的。要自己指定这些值，请在FileInputStream上构造一个InputStreamReader。

因此，听起来好像FileReader实际上不是要走的路。如果我们采纳文档中的建议，那么您应该将代码更改为：

String fileName = getFileNameToReadFromUserInput();
FileInputStream is = new FileInputStream(fileName);
InputStreamReader isr = new InputStreamReader(is, getCorrectCharsetToApply());
BufferedReader buffReader = new BufferedReader(isr);

而不是尝试制作FileReader。

类似资料：

如何只读取特定字符串后的文本文件中的行？

问题内容：我想将字典中特定字符串之后的所有行读到字典中。我想对数千个文本文件执行此操作。我可以使用以下代码（从此答案中得到）识别并打印出特定的字符串（）：但是如何告诉Python开始读取仅在字符串之后的行？问题答案：当您到达要开始的行时，只需开始另一个循环即可：文件对象是其自己的迭代器，因此当到达其中的行时，我们将从该行继续进行迭代，直到消耗完迭代器为止。一个简单的例子：产生：您
读写具有特殊字符的.txt文件

问题内容：我打开记事本（Windows）并编写并转到“ 另存为… ”“ someFile.txt”，并将“ 编码” 设置为 UTF-8 。在Java中，我有但是我得到问号和类似的“特殊”字符。为什么？编辑：我有此输入（.txt文件中的一行）和这段代码和吐司输出（用于那些谁不熟悉与Android，吐司只是一个显示弹出式屏幕，在它特定的文本法）的罚款。控制台显示“奇怪的字符”（
读取具有不同编码的Rdata文件

问题内容：我在Linux（UTF-8）计算机上有一个要读取的.RData文件，但我知道该文件位于Latin1中，因为我是在Windows上自己创建的。不幸的是，我无权访问原始文件或Windows计算机，并且需要在Linux计算机上读取这些文件。要读取Rdata文件，通常的过程是运行。诸如此类的函数具有可用于解决此类问题的参数，但没有这种功能。如果尝试，我只会收到此（预期）错误：加载错误（“
如何使用Java中的文件中的特定行号读取特定行？

问题内容：在Java中，是否有任何方法可以从文件中读取特定行？例如，读取第32行或任何其他行号。问题答案：除非你以前对文件中的行有一定的了解，否则没有阅读前31行就无法直接访问第32行。所有语言和所有现代文件系统都是如此。如此有效地，你只需阅读第32行，直到找到第32行为止。
MonogDB：如何获取字段中具有特定值的所有文档？

我有一个由10个名为Arr的唯一对象id组成的数组，我在一个名为xyz的集合中有10000个文档。如何在只有一个请求的集合xyz中的数组Arr中使用对象ID查找文档？有$all和$in运算符，但用于使用数组查询字段。或者我是否需要发出等于Arr长度的请求并使用findOne获取单个文档？编辑：我期待这样的事情： db.getCollection（"xyz"）. search（{"_id"：
如何解码字符串中编码的特殊XML字符？

问题内容：我得到了一个像这样的字符串我该如何编写Java代码来解码编码字符，例如在字符串中。是否有任何现有的类/方法可以对其进行解码？谢谢。问题答案：要取消转义HTML / XML实体，请使用Apache Commons Lang 或homegrow one 。

相关阅读

如何解码字符串中编码的特殊XML字符？如何从Java中的特定偏移量读取文件？如何使用土耳其语字符在Java中读取UTF 8编码文件如何从Java中的特定字符串中删除特定字符？如何在Scala或Java中读取带有混合编码的文本文件？

相关文章

Ruby 中文编码 Java定义字符串 Java提取子字符串 Java获取字符串长度 Jsoup 读取文件获取HTML

相关问答

如何删除数据帧中具有特定字符的子字符串？PHP文件字符编码，mysql数据库字符编码，特殊字符如何读取. java文件中的特定行并打印出来…？如何在Wiremock请求正文中编码特殊字符？如何在特定字符后获取文本？

相关工具

ECMAScript6 编码规范 Sphinx 文档工具 WEB FTP文件管理工具文泉郑码手机号码查吉凶工具

相关文档

Java 编码规范 Java 并发编程实战阅读笔记阅读 express 源码 Ruby 源码解读如何编写 jQuery 插件