当前位置: 首页 > 面试题库 >

修复损坏的UTF-8编码

百里疏珂
2023-03-14
问题内容

我正在修复一些错误的UTF-8编码。我目前正在使用PHP 5和MySQL。

在我的数据库中,我有一些编码错误的实例,例如:ƒ

  • 数据库整理是utf8_general_ci
  • PHP使用的是正确的UTF-8标头
  • Notepad ++设置为使用不带BOM的UTF-8
  • 数据库管理在phpMyAdmin中处理
  • 并非所有重音符号的情况都被破坏

我需要某种函数来帮助我将ƒ,®,?,?¼和其他类似的实例映射到其适当的带重音的UTF-8字符。


问题答案:

过去,我不得不尝试“修复”许多UTF8损坏的情况,但是不幸的是,这绝非易事,而且常常是不可能的。

除非您能确切确定它是如何破裂的,而且总是以完全相同的方式破裂,否则将很难“消除”损坏。

如果要尝试消除损害,最好的选择是开始编写一些示例代码,在该示例中,尝试对mb_convert_encoding()的调用进行多种变体,以查看是否可以找到“
from”和“ to”的组合修复您的数据。最后,通常最好不要再因为涉及到痛苦的程度而担心修复旧数据,而只是去解决将来的问题。

但是,在执行此操作之前,您需要确保首先解决导致此问题的所有问题。您已经提到数据库表排序规则和编辑器设置正确。但是,还有更多地方需要检查以确保所有内容都正确地是UTF-8:

  • 确保您将HTML用作UTF-8:
    • header(“ Content-Type:text / html; charset = utf-8”);
  • 将您的PHP默认字符集更改为utf-8:
    • ini_set(“ default_charset”,’utf-8’);
  • 如果您的数据库始终不能使用utf-8进行通信,那么您可能需要基于每个连接告诉它,以确保它处于utf-8模式,在MySQL中,您可以通过发出以下命令来做到这一点:
    • 字符集utf8
  • 您可能需要告诉您的网络服务器始终尝试使用UTF8进行对话,在Apache中,此命令是:
  • 最后,您需要始终确保您使用的是正确的UTF-8抱怨的PHP函数。这意味着始终使用mb_ *样式的“多字节感知”字符串函数。这也意味着在调用诸如htmlspecialchars()之类的函数时,应在末尾包含适当的’utf-8’charset参数,以确保其不会对它们进行错误编码。

如果您错过了整个过程中的任何一步,则编码可能会被破坏并且会出现问题。一旦您进入执行utf-8的“槽”,这一切便成为第二天性。当然,PHP6应该是来自getgo的完全unicode投诉,这将使很多事情变得更容易(希望如此)



 类似资料:
  • 问题内容: 我将PDO库与PHP中的MySQL数据库一起使用,但是如果我插入任何以UTF-8编码的数据(如阿拉伯文字),则会将其插入数据库中,但是为。 在我自己的框架中,创建PDO连接后,我发送两个查询– 和。它仍然不起作用。 例: 解决方法:在将数据插入数据库之前,使用该函数转换数据,并在提取后用于解码。这就是我现在的做法。 问题答案: 采用: 它在PDO连接上强制使用UTF-8。它为我工作。

  • 昨天我使用Xampp创建了一些简单的基于Web的实用工具。今天我想继续工作,但xampp控制面板给了我一些错误。 这是MySQL错误日志: 已经尝试过修复,但mySQL服务甚至无法启动,所以我有点无助。。。

  • 问题内容: 我正在使用apache commons http客户端使用post方法来调用url来发布参数,并且很少抛出以下错误。 有人可以建议导致此异常的原因以及如何对其进行调试吗? 问题答案: 原因是: 最通常的是,在另一端已经关闭连接时写入连接; 通常,对等方关闭连接而不读取其末端已经挂起的所有数据。 因此,在两种情况下,你的应用程序协议定义或实施都不充分。 还有第三个原因,我在这里不做记录,

  • 问题内容: 在对CSV文件进行编码的假设下运行了以前的文件。在此导入过程中,将多字节字符解释为两个单个字符,然后再次使用utf-8进行编码。 这种双重编码会产生类似的异常,而不是。 如何更正这些字符串? 问题答案: 下面的MySQL函数在双重编码后将返回正确的utf8字符串: 它可以与语句一起使用以更正字段:

  • 问题内容: 如何使eclipse重建项目或工作区中包含的类的数据库?这就是它使“参考”菜单操作起作用的目的,以及它用于“添加导入”对话框的作用等。基本上,这是Eclipse核心用途的一部分。现在,它只为我的项目的5%工作。 我已经多次遇到这个问题:eclipse发生了一些事情,要么是由于OutOfMemoryError,因为我打开了一个大文件,要么是因为工作区只有几个月的辛苦使用。 现在,我在Wi

  • 问题内容: 首先,一个简单的测试代码: 该测试代码使用Java 7仅创建一个文件“ test_0_0.log”,无论我运行该程序的频率如何。这是预期的行为,因为构造函数中的append参数设置为true。 但是,如果我使用Java 8运行此示例,则每次运行都会创建一个新文件(test_0_0.log,test_0_1.log,test_0_2.log等)。我认为这是一个错误。 恕我直言,Java的