Java如何确定用于的编码System.out
?
给定以下类别:
import java.io.File;
import java.io.PrintWriter;
public class Foo
{
public static void main(String[] args) throws Exception
{
String s = "xxäñxx";
System.out.println(s);
PrintWriter out = new PrintWriter(new File("test.txt"), "UTF-8");
out.println(s);
out.close();
}
}
它被保存为UTF-8并javac -encoding UTF-8 Foo.java
在Windows系统上进行编译。
然后在git-bash控制台上(使用UTF-8字符集),我这样做:
$ java Foo
xxõ±xx
$ java -Dfile.encoding=UTF-8 Foo
xxäñxx
$ cat test.txt
xxäñxx
$ java Foo | cat
xxäñxx
$ java -Dfile.encoding=UTF-8 Foo | cat
xxäñxx
这里发生了什么?
显然,java检查它是否连接到终端,并在这种情况下更改其编码。有没有一种方法可以迫使Java简单地输出普通的UTF-8?
我也使用cmd控制台尝试了相同的操作。重定向STDOUT似乎没有任何区别。如果没有file.encoding参数,它将输出ansi编码,并输出utf8编码。
我假设您的控制台仍在cmd.exe下运行。我怀疑您的控制台真的希望使用UTF-8-我希望它真的是OEM
DOS编码(例如850或437)。
Java将在JVM初始化期间使用默认编码集对字节进行编码。
在我的电脑上复制:
java Foo
Java编码为Windows-1252;控制台解码为IBM850。结果: Mojibake
java -Dfile.encoding=UTF-8 Foo
Java编码为UTF-8;控制台解码为IBM850。结果: Mojibake
cat test.txt
cat将文件解码为UTF-8;cat编码为IBM850;控制台解码为IBM850。
java Foo | cat
Java编码为Windows-1252;cat解码为Windows-1252;cat编码为IBM850;控制台解码为IBM850
java -Dfile.encoding=UTF-8 Foo | cat
Java编码为UTF-8;cat解码为UTF-8;cat编码为IBM850;控制台解码为IBM850
cat的
此实现必须使用启发式方法来确定字符数据是否为UTF-8,然后将数据从UTF-8或ANSI(例如Windows-1252)转码为控制台编码(例如IBM850)。
可以使用以下命令确认:
$ java HexDump utf8.txt
78 78 c3 a4 c3 b1 78 78
$ cat utf8.txt
xxäñxx
$ java HexDump ansi.txt
78 78 e4 f1 78 78
$ cat ansi.txt
xxäñxx
该 猫 命令可以做出此决定,因为e4 f1
不是有效的UTF-8序列。
您可以通过以下方法更正Java输出:
HexDump 是一个简单的Java应用程序:
import java.io.*;
class HexDump {
public static void main(String[] args) throws IOException {
try (InputStream in = new FileInputStream(args[0])) {
int r;
while((r = in.read()) != -1) {
System.out.format("%02x ", 0xFF & r);
}
System.out.println();
}
}
}
问题内容: 如何通过编程正确设置JVM(1.5.x)使用的默认字符编码? 我读过,这-曾经是使用旧JVM的方法。由于没有理由,我没有那么奢侈。 我试过了: 并且该属性被设置,但似乎不会导致下面的最终调用使用UTF8: 问题答案: 不幸的是,必须在JVM启动时指定该属性。通过输入你的主要方法时,编码中使用的字符由和默认的构造函数,并已被永久缓存。 正如指出的那样,在这种特殊情况下, 可以使用环境
问题内容: 我有一个函数的返回类型为VOID,它直接在控制台上打印。 但是,我需要字符串形式的输出,以便可以对其进行处理。 由于我无法使用返回类型为VOID的函数进行任何更改,因此我不得不将该输出重定向到字符串。 如何在JAVA中重定向它? 关于将stdout重定向到字符串有很多问题,但是它们仅重定向从用户获取的输入,而不重定向某些函数的输出… 问题答案: 如果功能正在打印到,则可以使用更改为你提
问题内容: 程序应在中列出卷。 例如:我从vollist.java类获得此输出。 控制台输出: 如何在我的控制台中获得此控制台输出。 那只会显示row1-> vol1 row2-> vol1 ............如何获得类似于控制台row1-> vol1 row2-> vol2的输出(计数) 问题答案: 定义并实现您的TableModel(在这种情况下,扩展AbstractTableModel
问题内容: 通过控制台进行任何输入的数据类型(如我使用BufferedReader类所做的那样)为String。之后,我们将其类型转换为需要查询的数据类型(如Inter.parseInt()为整数)。但是在C语言中,我们可以接受任何输入原始数据类型,而在Java中,所有输入类型都是Neccerily String。为什么是这样? 问题答案: 控制台输入实际上以一系列字节而不是字符串的形式读入。这是
问题内容: 我想知道是否可以通过某种方式设置输出到Java控制台的文本的颜色。它是否特定于系统并不重要,因为该程序只能在我的Windows 7 x64笔记本电脑上运行。 这个问题:几周前有人问过在Javaeclipse控制台中更改颜色,它对类似的问题有很好的解决方案(@VonC提供),但是它仅解决了eclipse内的问题。 如果我从命令行执行程序,是否可以达到相同的效果?如果可以,怎么办? 问题答
问题内容: 我正在用Java编程 我的代码为: 在api中指定,如果不指定字符编码,它将采用默认的平台字符编码。 “默认平台字符编码”是什么意思? 它是Java编码还是OS编码? 如果这意味着操作系统编码,如何检查Windows和Linux的默认字符编码?无论如何,我们可以使用命令行获取默认的字符编码吗? 问题答案: 这表示您正在运行的JVM的默认字符编码, 要检查默认编码,您可以执行以下操作: