当前位置: 首页 > 面试题库 >

存储数据的奇怪字符编码,旧脚本正在向他们展示好的新脚本没有

荆哲
2023-03-14
问题内容

我正在尝试重写一个旧网站
它是波斯语,使用波斯/阿拉伯字符。

CREATE DATABASE `db` DEFAULT CHARACTER SET utf8 COLLATE utf8_persian_ci;
USE `db`;

几乎所有我的表/列COLLATE都设置为 utf8_persian_ci

我正在为我的新脚本使用codeigniter,我有

'char_set' => 'utf8',
'dbcollat' => 'utf8_persian_ci',

在数据库设置中,因此没有问题。

所以这是奇怪的部分

旧的脚本正在使用某种称为TUBADBENGINETUBA DB ENGINE… 的数据库引擎,没什么特别的。

当我使用旧脚本在波斯语数据库中输入某些数据时,当我查看数据库时,字符存储عمران

旧脚本获取/显示该数据很好,但是新脚本显示它们具有与数据库相同的奇怪字体/字符集

因此,当我输入时اااا,数据库存储的数据看起来像是عمراÙ,当我在新脚本中获取数据عمراÙ但在旧脚本中获取数据时,
اااا

CREATE TABLE IF NOT EXISTS `tnewsgroups` (
  `ID` int(11) NOT NULL AUTO_INCREMENT,
  `fName` varchar(200) COLLATE utf8_persian_ci DEFAULT NULL,
  PRIMARY KEY (`ID`)
) ENGINE=InnoDB  DEFAULT CHARSET=utf8 COLLATE=utf8_persian_ci AUTO_INCREMENT=11 ;

--
-- Dumping data for table `tnewsgroups`
--

INSERT INTO `tnewsgroups` (`ID`, `fName`) VALUES
(1, 'عمران'),
(2, 'معماری'),
(3, 'برق'),
(4, 'مکانیک'),
(5, 'test'),
(6, 'test2');

另一方面,当我ااااا直接输入数据库时

当然我有相同的اااا存储在数据库中

新脚本显示得很好

但是在旧脚本中我得到了 ????

任何人都可以理解吗?

这是大号引擎

https://github.com/maxxxir/mz-codeigniter-
crud/blob/master/tuba.php

旧脚本的用法示例:

define("database_type" , "MYSQL");
define("database_ip" , "localhost");
define("database_un" , "root");
define("database_pw" , "");
define("database_name" , "nezam2");
define("database_connectionstring" , "");
$db = new TUBADBENGINE(database_type , database_ip , database_un , database_pw , database_name , database_connectionstring);
$db->Select("SELECT * FROM tnews limit 3");
if ($db->Lasterror() != "") { echo "<B><Font color=red>ÎØÇ ! áØÝÇ ãÌÏøÏÇ ÊáÇÔ ˜äíÏ";  exit(); }
for ($i = 0 ; $i < $db->Count() ; $i++) {
    $row = $db->Next();
    var_dump($row);
}

问题答案:

简而言之,因为这已经被讨论了上千次了:

  1. PHP拥有一个"漢字"以UTF-8编码的字符串,例如。的字节为E6 BC A2 E5 AD 97
  2. 它通过 设置为latin1数据库连接 发送此字符串。
  3. 数据库接收字节E6 BC A2 E5 AD 97,认为这些字节代表latin1字符。
  4. 数据库存储字符æ¼¢å­E6 BC A2 E5 AD 97映射到中的字符latin1)。
  5. 反向执行相同的过程会使PHP接收相同的字节,然后将其视为UTF-8。即使数据库未按应有的方式对待字符,往返也适用于PHP。

因此,这里的问题是,当将数据输入数据库时​​,数据库连接设置不正确。您必须将数据库中的数据转换为正确的字符。尝试这个:

SELECT CONVERT(BINARY CONVERT(field_name USING latin1) USING utf8) FROM table_name

utf8尝试一下,也许这不是您所需要的。如果可行,UPDATE请将其更改为语句以永久更新数据。



 类似资料:
  • NiftyWindows (美妙的窗口)-- 作者: Enovatic-Solutions: 此脚本让您轻松地控制所有基本的窗口操作, 例如拖动, 调整大小, 最大化, 最小化和关闭. 它最强大的功能是通过拖动鼠标右键来激发. 想象将每个窗口分成一个虚拟的三行三列的 9 个单元组成的网格. 中心的单元是其中最大的: 通过点击并按住鼠标右键您可以抓取窗口并到处移动. 通过同样的方法使用其他八个单元来

  • 问题内容: 我正在尝试提交post变量的地方编写bash脚本,但是wget将其视为多个URL,我相信是因为它不是URLENCODED …这是我的基本思想 我遇到了错误,alert.php没有得到post变量,而且它还很糊糊地说 无法解决我无法解决我无法解决尝试..依此类推。 上面的示例是一个简单的sudo示例,但我相信如果可以对其进行url编码,它将通过,我什至尝试了php: 但PHP错误了..任

  • 问题内容: 我想从bash脚本执行python脚本,并且要将python脚本的输出存储在变量中。 在我的python脚本中,我将一些内容打印到屏幕上,最后我返回一个带有以下内容的字符串: 在我的bash脚本中,我执行了以下操作: 但是,当我检查with的值时,我得到了Python脚本打印到屏幕上的所有内容,但 没有 返回值! 我应该怎么做? 编辑:我需要该字符串,因为它告诉我Python脚本创建的

  • 我目前在macOS大苏尔和最近更新的pip从19.2.3到20.3.3,但现在有旧的包装脚本错误。我在网上搜索解决方案并尝试了所有这些解决方案,但没有任何效果。 所以目前我有python 3.8.2(我卸载了我的python 3.7.4) 我将python 3.8添加到现在 显示 但这对任何事情都没有帮助 我也试过重新安装,但也不好使。 我可以尝试其他解决方案吗?问题是因为路径吗? 如果这种情况仍

  • 我对Ant非常陌生(我来自Maven),我发现了很多问题来做下面的操作。 我有一个名为CrystalIceGUI主项目,它使用了另一个名为ShellextBridge的依赖项项目。 依赖项目ShellExtBridge有一个自己的build.xml文件,该文件编译项目并将其打包到一个jar文件中,该jar文件被插入名为Release的direcotry中 主项目CrystalIceGUI有它的bu

  • 问题内容: 我试图让Android Studio启动器(studio.sh)使用手动安装的Java(而不是系统范围的默认Java)。由于我已经在.bashrc文件中声明了PATH和JAVA_HOME,因此我只是在shell脚本中提供了该文件: 。/home/foobar/.bashrc 但是由于某些原因,该脚本仍无法将$ JAVA_HOME / bin / java识别为可执行文件。 我添加了一些