当前位置: 首页 > 面试题库 >

PHP:将Unicode代码点转换为UTF-8

佴德曜
2023-03-14
问题内容

我的数据采用以下格式:U+597D或类似U+6211。我想将它们转换为UTF-8(原始字符是好和我)。我该怎么做?


问题答案:
$utf8string = html_entity_decode(preg_replace("/U\+([0-9A-F]{4})/", "&#x\\1;", $string), ENT_NOQUOTES, 'UTF-8');

这可能是最简单的解决方案



 类似资料:
  • 本文向大家介绍PHP 将ASCII转换为UTF-8编码,包括了PHP 将ASCII转换为UTF-8编码的使用技巧和注意事项,需要的朋友参考一下 如果我们知道当前的编码是ASCII,则可以使用'iconv'函数将ASCII转换为UTF-8。原始字符串可以作为参数传递给iconv函数,以将其编码为UTF-8。 示例 具有特殊字符的字符串被分配给'str'变量。它以当前所在的编码以及需要转换为的编码传递

  • 嗨,我在Python中将utf-8 json转换成unicode escape json时遇到了一些问题 我知道如何将utf-8.txt转换为unicodeescape.txt 但是,我在Python中使用json模块时遇到了上面应用的问题,如下所示 它保存得很好,但是,当涉及到json中的双引号(“)时,它会自动添加双反斜杠(\\),因此unicode-esc.json文件在调用python脚本

  • 问题内容: 假设我有一个这样的文本文件。 有什么办法可以将其转换为此吗? 当前,我正在使用,但是当我打印数据时,我得到的是Unicode代码点而不是字符串文字。我意识到这是的正确行为,只是不想。 我的目标是用文字字符替换代码点。 问题答案: 您可以使用和函数进行转换。 您应该注意的一件事是,只能取消引用中的字符串(例如,以引号char 或反引号char 开头和结尾```),因此我们必须手动附加该字

  • 世界中的字符有许许多多,有英文,中文,韩文等。我们强烈需要一个大大的映射表把世界上的字符映射成计算机可以阅读的二进制数字(字节)。 这样,每个字符都给予一个独一无二的编码,就不会出现写文字的人和阅读文字的人编码不同而出现无法读取的乱码现象了。 于是Unicode就出现了,它是一种所有符号的编码映射。最开始的时候,unicode认为使用两个字节,也就是16位就能包含所有的字符了。 但是非常可惜,两个

  • 问题内容: 我想将从文件中读取的unicode代码点转换为它们的UTF8编码。 例如,我想将字符串转换为字符串。 我可以使用这样的字符串文字手动完成此操作: 但我无法确定如何以编程方式进行操作。 问题答案: 使用内置函数将数字转换为字符,然后对其进行编码: 这是字符串本身。如果您希望字符串为ASCII十六进制,则需要使用或类似的方法逐步将每个字符转换为十六进制。 注意 :如果您仍然对Python

  • 问题内容: 我需要将unicode字符串转换为具有以unicode编码的非ascii字符的字符串。例如,字符串“汉字Max”应显示为“ \ u6F22 \ u5B57 Max”。 我尝试过的 的不同组合 新的String(sourceString.getBytes(encoding1),encoding2) Apache StringEscapeUtils也会转义ascii字符,例如双引号 Str