当前位置: 首页 > 知识库问答 >
问题:

在web浏览器中查看时缺少字符的中文文本编码

尹钱青
2023-03-14

我有一个包含中文文本的HTML文件。在任何web浏览器中打开文件时,都会出现缺少的字符。

以下是从浏览器窗口复制的示例:

本函旨在邀請您參�� 定於

我知道一个事实,这里看到的所有其他字符都是正确的,除了丢失的字符(由母语为汉语的人确认)。

在HTML标题中,我有一个标记,表示文件包含UTF-8编码字符:

<META http-equiv="Content-Type" content="text/html; charset=utf-8">

我已经在这个META标记中尝试了一些其他字符集,但到目前为止,除了UTF-8之外,我尝试的任何编码方法最终看起来都更糟。

我还考虑到这可能是字体问题,所以我在我的系统上安装了3种不同的繁体中文字体,并强迫Chrome使用它们。他们中没有一个人有任何不同——丢失的字符仍然存在。

如果我用记事本打开HTML文件,我可以看到以下内容:

http://i.imgur.com/GoS07WX.png

如果我选择并复制粘贴此文本到常规的MS记事本,我得到这个:

本函旨在邀請您參劦nbsp;定於

所以你可以在这里看到记事本中可见的“xE5 x8A”似乎被取代了。

在这种情况下,浏览器会显示而不是,有什么原因吗?

共有1个答案

鲁鹤轩
2023-03-14

再次查看超文本标记语言文件。

我看到一个字符的前2个字节用UTF-8编码,然后是

但是,\xE5\x8A\xA0 UTF-8解码为U 52A0,这与U 52A6的外来字符不同。。。不太接近答案。

 类似资料:
  • 需要显示pdf、docx、ppt、图像等内容。使用iframe标记。 当我们使用时,就像这个文件被下载。而不是下载,我们需要显示的内容在浏览器本身。 试用了另一个示例来查看计算机中本地存在的文档https://view.officeapps.live.com/op/view.aspx?src=c%3a%5cusers%5c123456%5cdesktop%5cttk.docx,这导致显示错误页。

  • 我接收后端发送的pdf文件,如下所示:

  • 在我当前的项目中,我的目标是从AWS S3 bucket访问视频文件(在)。我已经创建了S3 bucket,名为。这是一个具有以下权限的公用文件夹(如下所示)。 bucket的访问控制列表(ACL)如下: 现在,桶""包含许多子文件夹(或子桶),包括一个名为""的子文件夹。这个子桶包含一些文件(如下图所示)。 我的问题是,当我单击其时,浏览器可以直接访问一些文件(如和)。我可以在浏览器中播放它们。

  • 现在你可以编辑文本文件,这很好。但是如果你只想查看一个文本文件呢?当然,你可以使用 vim,但很多时候它是过度的。还有两件事要考虑: 如果你想查看非常大的文件,你将需要在尽可能快的程序中查看它。 通常你不想意外地改变文件中的某些东西。 所以,我向你介绍强大的less,少即是多。“比什么多呢?”你可能会问。嗯...有一次,有一个被称为more的浏览器。它很简单,只是向你显示你要求它显示的文本文件。它

  • Web API 教程,提供各种浏览器 API 文档,其中包括使用方法、使用参数、回调函数的用法等。

  • 使用Notepad++,您可以选择在浏览器中运行。如何使用Visual Studio代码执行相同的操作?