当前位置: 首页 > 知识库问答 >
问题:

为什么使用UTF-8编码的XML文件不能正确显示扩展字符

司马高昂
2023-03-14

我有一个使用UTF-8编码的XML文件,在XML声明中正确指定。

<?xml version="1.0" encoding="UTF-8"?>

该文件包括一些标准ASCII以外的字符。特别地,它包括带元音字符的o。它已经正确地将其表示为一个2字节的UTF-8序列c0b6。但在IE或Firefix中打开时,它会显示为除法符号“÷”,即使我已经将默认字体设置为Arial Unicode。浏览器正在正确地检测到(显式指定的)UTF-8编码。

显示如下所示:

<diag_description>Waldenstr÷m macroglobulinemia</diag_description> 

我可以上传文件,但它相当大(190K),我不相信复制和粘贴不做幕后转换。

共有1个答案

孔砚
2023-03-14

据我所知,ö实际上是C3 B6(在UTF-8编码中),而÷是C3 B7。所以我的猜测是,你只是有一个错误的字符在那里。

 类似资料:
  • 我有一个Windows 1252 word文档,我想转换为UTF-8。我需要这样做才能正确地将doc文件转换为pdf。这是我目前的做法: 但是,当我在Word中打开转换后的文件()时,它无法正确显示某些字符。例如,Ü将变成ü。 我该怎么解决这个问题?当我创建一个新的BufferedReader(使用UTF-8编码)并读取时,这些字符在我的IDE控制台中正确显示。

  • 问题内容: 我正在使用Javascript 函数解码base64编码的字符串(特别是来自GitHubAPI的base64编码的内容)。问题是我回来了ASCII编码的字符(而不是)。如何正确处理传入的以base64编码的流,以便将其解码为utf-8? 问题答案: 此问题: “ Unicode问题”由于s是16位编码的字符串,因此在大多数浏览器中,如果字符超出8位字节的范围(0x00〜0xFF),则调

  • 我正在使用Javascript函数来解码一个base64编码的字符串(特别是GitHub API中base64编码的内容)。问题是我得到了ASCII编码的字符(像而不是)。如何正确处理传入的base64编码的流,以便将其解码为UTF-8?

  • 我有一个任务: 当我使用命令时: 文本显示不正确。如何修复?谢谢

  • 我正在处理一个位置数据集,其中一些位置名称使用本地字符。大多数字符都被正确地看到,但我对一些罗马尼亚字符有意见,比如“ș”。 我尝试改变我的Windows 10 64位系统区域设置使用UTF-8编码,但这并没有解决问题。 可以在此处找到用于测试的示例文件:https://drive.google.com/file/d/1T7QQQ7G_dA_rXD9Ewf51uuQ6CUkscjP_/view?u

  • 我有一个缓冲区与字符编码在Windows 1252。然而,当我用适当的编码创建一个新的字符串时,而不是预期的结果,我经常会得到询问标记,例如。 因此,系统应在其上方显示带“^”的“u”字符。而是显示“?”。 任何想法?