作为输入,字符串将是任何带有UTF-8编码的泰文字符字符串,将此字符串格式从UTF-8隐藏到Java的TIS620。
我是新的字符编码和检查了几个在线帮助链接,但找不到任何参考TIS620
输入是要转换的输入字符串,例如。
๕ค 9๖ต 0๗จ - ๘ข = ๙ช Q๐ๆ w \“ไ Eฎำ Rฑพ Tธะ Yํั U๊ี 我ณร oฯน Pญย [ ฐบ ] ,ล ⏎ ⇥ A.ฤฟ sฆห Dฏก Fโด Gฌเ H็้ J๋่ Kษา Lศส ; ซ
编码-tis 620
public static String encode(String input, String encoding) {
// byte[] bytes = input.getBytes();
return new String(input.getBytes(), Charset.forName(encoding));
}
预期输出是给定的UTF-8字符串将转换为TIS 620编码
原来TIS-620没有什么特别之处。虽然不是每个Java实现都需要支持它,但主要的全尺寸实现都需要。
是的,可能会有数据丢失:Unicode比TIS-620大得多。特别是,您的字符串中不支持两个字符:⏎ ⇥ 通常,不支持的字符替换为?但其他行为(如异常)也是可能的。
Charset.forName("TIS620")
.encode("๕ค 9 ๖ต 0 ๗จ - ๘ข = ๙ช q ๐ๆ w \"ไ e ฎำ r ฑพ t ธะ y ํั u ๊ี i ณร o ฯน p ญย [ ฐบ ] ,ล ⏎ ⇥ a ฤฟ s ฆห d ฏก f โด g ฌเ h ็้ j ๋่ k ษา l ศส ; ซ")
.array()
问题内容: 我遇到了这行遗留代码,我试图找出这些遗留代码: 据我了解,它是使用相同的charSet进行编码和解码。 这与以下内容有何不同? 在任何情况下,两条生产线的输出将不同? ps:只是要澄清一下,是的,我知道Joel Spolsky撰写的关于编码 的出色文章! 问题答案: 这可能是很复杂的方式 这缩短了String,而所使用的基础char []则更长。 但是,更具体地说,将检查每个字符是否都
问题内容: 我有一个带有“ñ”字符的字符串,并且我有一些问题。我需要将此字符串编码为UTF-8编码。我已经通过这种方式尝试过,但是没有用: 如何将该字符串编码为utf-8? 问题答案: Java中的对象使用无法修改的UTF-16编码。 唯一可以使用不同编码的是。因此,如果你需要UTF-8数据,则需要一个。如果你有一个包含意外数据的,则问题出在较早的地方,该错误地将一些二进制数据错误地转换为a (即
如果UTF-8是8位,不意味着最多只能有256个不同的字符吗? 前128个代码点与ASCII中的相同。但是它说UTF-8可以支持多达百万个字符? 这是怎么回事?
问题内容: 我正在使用BeautifulSoup从HTML提取一些文本,但是我只是想不出如何正确地将其打印到屏幕(或与此相关的文件)上。 这是我的包含文本的类的样子: 当尝试打印一个实例时,这是我在控制台上看到的: 无论我尝试什么,都无法获得想要的输出(上面的文本应该是希伯来语)。我的最终目标是序列化到文件(使用json或pickle)并能够将其读回。 我在Ubuntu 10.10上使用Pytho
问题内容: 为了在Swift中将实例转换为实例,您可以使用,它返回一个可选实例。 如果编码为UTF-8(),此函数的返回值是否可以? 如果返回值不能为零,则始终强制展开此类转换是安全的。 问题答案: UTF-8可以表示所有有效的Unicode代码点,因此,将Swift字符串转换为UTF-8数据不会失败。 强制打开 是安全的。 这同样为是真实的或,而不是用于表示仅受限的字符集,诸如编码或。 您也可以
我有一个用ISO-8859-1编码的项目(一个我不能改变的历史性选择)。 我设置我的IDE,IntelliJ 14.1.1终极,在ISO-8859-1无处不在:我的编码设置 (我的代码在ISO-8859-1中指定的文件夹中) 编码。xml看起来不错: 我的idea没有在git上提交,因为它不是标准的IDE。 但当我处理某个文件时,intelliJ会在保存时不断将编码切换到UTF-8。我多次将文件转
问题内容: 我有类似 “&ampauml; s&amparing;”之 类的字符串 需要像这样的 “äså” 进行转换请在这里帮助我。 提前致谢 问题答案: 看一下Apache Commons库中的类。(具体方法)。
问题内容: 如何检查字符串是否为有效的UTF-8格式? 问题答案: 只能检查字节数据。如果您构造了一个String,则其内部已经存在于UTF-16中。 同样, 只有 字节数组可以使用UTF-8编码。 这是UTF-8转换的常见情况。 如果您不知道字节数组的编码,那么juniversalchardet是一个可以帮助您检测它的库。