问题：

为什么使用UTF-8编码的XML文件不能正确显示扩展字符

司马高昂

2023-03-14

我有一个使用UTF-8编码的XML文件，在XML声明中正确指定。

<?xml version="1.0" encoding="UTF-8"?>

该文件包括一些标准ASCII以外的字符。特别地，它包括带元音字符的o。它已经正确地将其表示为一个2字节的UTF-8序列c0b6。但在IE或Firefix中打开时，它会显示为除法符号“÷”，即使我已经将默认字体设置为Arial Unicode。浏览器正在正确地检测到（显式指定的）UTF-8编码。

显示如下所示：

<diag_description>Waldenstr÷m macroglobulinemia</diag_description>

我可以上传文件，但它相当大(190K)，我不相信复制和粘贴不做幕后转换。

共有1个答案

孔砚

2023-03-14

据我所知，ö实际上是C3 B6（在UTF-8编码中），而÷是C3 B7。所以我的猜测是，你只是有一个错误的字符在那里。

类似资料：

转换的word文档（从Windows-1252到UTF-8）不能正确显示字符

我有一个Windows 1252 word文档，我想转换为UTF-8。我需要这样做才能正确地将doc文件转换为pdf。这是我目前的做法：但是，当我在Word中打开转换后的文件（）时，它无法正确显示某些字符。例如，Ü将变成Ã¼。我该怎么解决这个问题？当我创建一个新的BufferedReader（使用UTF-8编码）并读取时，这些字符在我的IDE控制台中正确显示。
使用Javascript的atob解码base64不能正确解码utf-8字符串

问题内容：我正在使用Javascript 函数解码base64编码的字符串（特别是来自GitHubAPI的base64编码的内容）。问题是我回来了ASCII编码的字符（而不是）。如何正确处理传入的以base64编码的流，以便将其解码为utf-8？问题答案：此问题： “ Unicode问题”由于s是16位编码的字符串，因此在大多数浏览器中，如果字符超出8位字节的范围（0x00〜0xFF），则调
使用JavaScript的atob解码base64不能正确解码utf-8字符串

我正在使用Javascript函数来解码一个base64编码的字符串（特别是GitHub API中base64编码的内容）。问题是我得到了ASCII编码的字符（像而不是)。如何正确处理传入的base64编码的流，以便将其解码为UTF-8？
在Gradle中正确显示UTF-8文本

我有一个任务：当我使用命令时：文本显示不正确。如何修复？谢谢
R无法使用UTF-8正确编码罗马字符

我正在处理一个位置数据集，其中一些位置名称使用本地字符。大多数字符都被正确地看到，但我对一些罗马尼亚字符有意见，比如“ș”。我尝试改变我的Windows 10 64位系统区域设置使用UTF-8编码，但这并没有解决问题。可以在此处找到用于测试的示例文件：https://drive.google.com/file/d/1T7QQQ7G_dA_rXD9Ewf51uuQ6CUkscjP_/view?u
Windows-1252编码-显示的字符不正确

我有一个缓冲区与字符编码在Windows 1252。然而，当我用适当的编码创建一个新的字符串时，而不是预期的结果，我经常会得到询问标记，例如。因此，系统应在其上方显示带“^”的“u”字符。而是显示“？”。任何想法？

为什么使用UTF-8编码的XML文件不能正确显示扩展字符

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档