当前位置: 首页 > 面试题库 >

如何在Java中获取Unicode字符的十进制值?

淳于昊然
2023-03-14
问题内容

我需要一种编程方式来获取字符串中每个字符的十进制值,以便将它们编码为HTML实体,例如:

UTF-8:

著者名

小数:

著者名

问题答案:

我怀疑您只是对从转换charint,这是隐式的:

for (int i = 0; i < text.length(); i++)
{
    char c = text.charAt(i);
    int value = c;
    System.out.println(value);
}

编辑:如果要处理代理对,则可以使用类似以下内容的方法:

for (int i = 0; i < text.length(); i++)
{
    int codePoint = text.codePointAt(i);
    // Skip over the second char in a surrogate pair
    if (codePoint > 0xffff)
    {
        i++;
    }
    System.out.println(codePoint);
}


 类似资料:
  • 问题内容: 我正在研究PHP5中的编码。有某种方法可以获取字符串的原始十六进制转储吗?即字符串中每个字节(不是字符)的十六进制表示? 问题答案: 要么: 是包含输入的变量。

  • 问题内容: Java中有什么办法可以让我获得与任何字符均等的Unicode?例如 假设有一个方法。呼叫应该返回。 问题答案: 你可以使用以下一种衬里对任何Java字符进行处理: 但这仅适用于Unicode 3.0以下的Unicode字符,这就是为什么我建议你可以对任何Java字符都使用它。 由于Java是在Unicode 3.1出现之前进行设计的,因此Java的char原语不足以表示Unicode

  • 问题内容: 我已经从Web爬网脚本中提取了一个字符串,如下所示: 我想用utf-8解码。使用http://ddecode.com/hexdecoder/,我可以看到结果是 我尝试使用以下语法,但失败了。 错误: 请问如何正确解码字符串? 感谢帮助。 问题答案: 问题所在 是您正在尝试解码Unicode。那真的没有道理。您可以 从 Unicode编码为某种编码类型,也可以将字节字符串解码 为 Uni

  • Charset.defaultCharset()和file.encoding是JVM的字符集,而不是OS、控制台和终端的字符集。 现在我创建一个来运行程序,并使用要读取输出,如何为进程找到正确的字符集(是正确的,但似乎不是通用的)?

  • 问题内容: 有什么方法可以获取字符的键码吗?例如 有没有类似的东西? 谢谢 问题答案: 输出: 只是为了转义字符,您必须像字符一样使用

  • 问题内容: 我对Java有点陌生,当我将unicode字符串分配给 为什么在两种情况下结果都不同,文件a.txt也包含相同的字符串。但是当我打印文件的输出时,它会打印而不是实际的unicode字符。任何想法,如果我要归档也要作为字符串打印的内容,我该怎么做。 问题答案: 您的代码应该是正确的,但是我想文件“ a.txt”不包含用UTF-8编码的Unicode字符,而是转义的字符串“ \ u0142