当前位置：首页 > 编程笔记 >

php 判断字符串编码是utf-8 或gb2312实例

万志专

2023-03-14

本文向大家介绍php 判断字符串编码是utf-8 或gb2312实例，包括了php 判断字符串编码是utf-8 或gb2312实例的使用技巧和注意事项，需要的朋友参考一下

php 判断字符串编码是utf-8 或gb2312

第一种方法：

function is_gb2312($str)
{
    for($i=0; $i<strlen($str); $i++) {
        $v = ord( $str[$i] );
        if( $v > 127) {
            if( ($v >= 228) && ($v <= 233) )
            {
                if( ($i+2) >= (strlen($str) - 1)) return true; // not enough characters
                $v1 = ord( $str[$i+1] );
                $v2 = ord( $str[$i+2] );
                if( ($v1 >= 128) && ($v1 <=191) && ($v2 >=128) && ($v2 <= 191) ) // utf编码
                    return false;
                else
                    return true;
            }
        }
    }
    return true;
}

第二种方法：

/**
 * 判断字符串是utf-8 还是gb2312
 * @param unknown $str
 * @param string $default
 * @return string
 */
public static function utf8_gb2312($str, $default = 'gb2312')
{
 $str = preg_replace("/[\x01-\x7F]+/", "", $str);
 if (empty($str)) return $default;

 $preg = array(
 "gb2312" => "/^([\xA1-\xF7][\xA0-\xFE])+$/", //正则判断是否是gb2312
 "utf-8" => "/^[\x{4E00}-\x{9FA5}]+$/u",   //正则判断是否是汉字(utf8编码的条件了)，这个范围实际上已经包含了繁体中文字了
 );

 if ($default == 'gb2312') {
 $option = 'utf-8';
 } else {
 $option = 'gb2312';
 }

 if (!preg_match($preg[$default], $str)) {
 return $option;
 }
 $str = @iconv($default, $option, $str);

 //不能转成 $option, 说明原来的不是 $default
 if (empty($str)) {
 return $option;
 }
 return $default;
}

感谢阅读，希望能帮助到大家，谢谢大家对本站的支持！

类似资料：

Java字符串编码（UTF-8）

问题内容：我遇到了这行遗留代码，我试图找出这些遗留代码：据我了解，它是使用相同的charSet进行编码和解码。这与以下内容有何不同？在任何情况下，两条生产线的输出将不同？ ps：只是要澄清一下，是的，我知道Joel Spolsky撰写的关于编码的出色文章！问题答案：这可能是很复杂的方式这缩短了String，而所使用的基础char []则更长。但是，更具体地说，将检查每个字符是否都
Java将字符串编码为UTF-8

问题内容：我有一个带有“ñ”字符的字符串，并且我有一些问题。我需要将此字符串编码为UTF-8编码。我已经通过这种方式尝试过，但是没有用：如何将该字符串编码为utf-8？问题答案： Java中的对象使用无法修改的UTF-16编码。唯一可以使用不同编码的是。因此，如果你需要UTF-8数据，则需要一个。如果你有一个包含意外数据的，则问题出在较早的地方，该错误地将一些二进制数据错误地转换为a （即
打印utf-8编码的字符串

问题内容：我正在使用BeautifulSoup从HTML提取一些文本，但是我只是想不出如何正确地将其打印到屏幕（或与此相关的文件）上。这是我的包含文本的类的样子：当尝试打印一个实例时，这是我在控制台上看到的：无论我尝试什么，都无法获得想要的输出（上面的文本应该是希伯来语）。我的最终目标是序列化到文件（使用json或pickle）并能够将其读回。我在Ubuntu 10.10上使用Pytho
字符串解码utf-8

问题内容：如何使用Android解码utf-8字符串？我尝试使用此命令，但输出与输入相同：问题答案：字符串不需要编码。它只是一个Unicode字符序列。要将字符串转换为字节序列时需要进行编码。您选择的字符集（UTF-8，cp1255等）确定了Character-> Byte映射。请注意，字符不必转换为单个字节。在大多数字符集中，大多数Unicode字符都转换为至少两个字节。字符串的编
特殊的ảỏ字符中断UTF-8编码

我网站上的一位用户在文本字段中输入了特殊字符：Ảỏ 这些显然不是我可以从键盘输入的相同的äö字符，因为当我将它们粘贴到程序员的记事本中时，它们分成两部分：a–o–字符在我的网站的服务器端，我有一个PHP脚本，它可以识别用户输入中的非法特殊字符，并在带有的html错误消息中高亮显示这些字符。字符分割也发生在那里，因此我得到了一个普通的字母a和o，带有一个奇怪的单独的xCC字符，它破坏了UTF
趣谈Unicode、Ascii、utf-8、GB2312、GBK等编码知识

本文向大家介绍趣谈Unicode、Ascii、utf-8、GB2312、GBK等编码知识，包括了趣谈Unicode、Ascii、utf-8、GB2312、GBK等编码知识的使用技巧和注意事项，需要的朋友参考一下从头讲讲编码的故事。那么就让我们找个草堆坐下，先抽口烟，看看夜晚天空上的银河，然后想一想要从哪里开始讲起。嗯，也许这样开始比较好…… 很久很久以前，有一群人，他们决定用8个可以开合的晶体管

相关阅读

趣谈Unicode、Ascii、utf-8、GB2312、GBK等编码知识如何检测是否必须对字符串应用UTF-8解码或编码？Python判断文件和字符串编码类型的实例检查字符串是否是用Java编码的有效UTF-8 在UTF-8编码的字符串上使用str_split

相关文章

判断是否二叉排序树字符串匹配实例讲解 Thymeleaf条件判断 Ruby 条件判断 Python编码规范（PEP 8）

相关问答

PHP-UTF-8转中文ANSI（GB2312？）-导出CSV文件在JSP中中断的UTF-8 URI编码 javascript - js 模板字符串判断？将请求参数作为UTF-8编码字符串传递[重复]在SQL Server中将XML UTF-8编码字符串转换为XML datatype

相关工具

UTF-8 CPP ECMAScript6 编码规范 PHP代码生成器 iOS 多线程编程实例 8 Kingdoms

相关文档

格式化字符串漏洞利用 PHP 编程之道 Java 编码规范 PHP 异步编程：手把手教你实现 co 与 Koa PHP 最佳实践