当前位置: 首页 > 面试题库 >

无法通过PDO_ODBC从Access中检索带有UTF-8重音符号的字符

葛兴发
2023-03-14
问题内容

我正在尝试将Access DB转换为MySQL。一切工作正常,请期待一把大猴子扳手。。。如果access
db有任何非标准字符,则它将无法工作。我的查询会告诉我:

Incorrect string value: '\xE9d'

如果我直接回显具有“无效”字符的行文本,则会在浏览器中的黑色方块中出现一个问号(因此é在回显时会变成无效的符号)。

注意:与from相同,它将接受,保存并在用于为该数据库上载命名的文本框中显示“é”罚款。另外,如果我“另存为”页面并重新打开它,则正确显示“é”。

这是我的连接方式:

$conn = new PDO("odbc:Driver={Microsoft Access Driver (*.mdb)};Dbq=$fileLocation;SystemDB=$securefilePath;Uid=developer;Pwd=pass;charset=utf;");

我尝试了很多事情,包括:

$conn -> exec("set names utf8");

当我尝试在访问中使用“
CurrentDb.Collat​​ingOrder”时,它会告诉我1033显然是dbSortGeneral的“英语,德语,法语和葡萄牙语整理顺序”。

怎么了?几乎就像PDO向我发送了我的浏览器排序规则,而PHP并没有完全理解。


问题答案:

问题

当使用本机PHP ODBC功能(PDO_ODBC或更旧的odbc_功能)和Access
ODBC驱动程序时,即使文本以Unicode字符存储在Access数据库中,文本也不是UTF-8编码的。因此,对于一个名为“ Teams”的示例表

Team
-----------------------
Boston Bruins
Canadiens de Montréal
Федерация хоккея России

编码

<?php
header('Content-Type: text/html; charset=utf-8');
?>
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<title>Access character test</title>
</head>
<body>
<?php
$connStr = 
        'odbc:' .
        'Driver={Microsoft Access Driver (*.mdb)};' .
        'Dbq=C:\\Users\\Public\\__SO\\28311687.mdb;' .
        'Uid=Admin;';
$db = new PDO($connStr);
$db->setAttribute(PDO::ATTR_ERRMODE, PDO::ERRMODE_EXCEPTION);

$sql = "SELECT Team FROM Teams";
foreach ($db->query($sql) as $row) {
    $s = $row["Team"];
    echo $s . "<br/>\n";
}
?>
</body>
</html>

在浏览器中显示

Boston Bruins
Canadiens de Montr�al
????????? ?????? ??????

简单但不完整的修复

Access
ODBC返回的文本实际上与该字符集中的字符的Windows-1252字符编码匹配,因此只需更改该行

$s = $row["Team"];

$s = utf8_encode($row["Team"]);

将允许第二个条目正确显示

Boston Bruins
Canadiens de Montréal
????????? ?????? ??????

但是utf8_encode()函数是从ISO-8859-1(而不是Windows-1252
)转换的,因此某些字符(特别是欧元符号“€”)将消失。更好的解决方案是使用

$s = mb_convert_encoding($row["Team"], "UTF-8", "Windows-1252");

但这仍然无法解决示例表中第三个条目的问题。

完整修复

为了获得完整的UTF-8支持,我们需要将COM与ADODB
Connection和Recordset对象一起使用,如下所示

<?php
header('Content-Type: text/html; charset=utf-8');
?>
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<title>Access character test</title>
</head>
<body>
<?php
$connStr = 
        'Driver={Microsoft Access Driver (*.mdb)};' .
        'Dbq=C:\\Users\\Public\\__SO\\28311687.mdb';
$con = new COM("ADODB.Connection", NULL, CP_UTF8);  // specify UTF-8 code page
$con->Open($connStr);

$rst = new COM("ADODB.Recordset");
$sql = "SELECT Team FROM Teams";
$rst->Open($sql, $con, 3, 3);  // adOpenStatic, adLockOptimistic
while (!$rst->EOF) {
    $s = $rst->Fields("Team");
    echo $s . "<br/>\n";
    $rst->MoveNext;
}
$rst->Close();
$con->Close();
?>
</body>
</html>


 类似资料:
  • 问题内容: 我无法在Redis数据库中设置和检索带有重音符号的字符串。 带重音符号的字符被编码,如何将它们放回原处? 问题答案: Redis服务器本身将所有数据存储为二进制对象,因此它不依赖于编码。服务器将只存储客户端发送的内容(包括UTF-8字符)。 以下是一些实验: c3a9是’é’char的表示。 实际上,数据已正确存储在Redis服务器中。但是,当它在终端中启动时,Redis客户端会解释输

  • 问题内容: 我在字符串列表的json.Marshal上得到这个: 原因很明显,但是如何在Go中删除/替换这样的字符串?我一直在阅读docst 和包,似乎没有明显/快速的方法。 例如,在Python中,您可以使用一些方法删除无效字符,将其替换为指定字符或严格设置,这会导致无效字符的异常。如何在Go中做等效的事情? 更新:我的意思是得到异常的原因(紧急?)-json.Marshal期望有效的UTF-8

  • 问题内容: 我有大量的文件和解析器。我要做的是剥离所有非utf-8符号并将数据放入mongodb中。目前,我有这样的代码。 不知何故我仍然出现错误 我不明白 有一些简单的方法吗? UPD :似乎Python和Mongo对Utf-8有效字符串的定义不同意。 问题答案: 请尝试在下面的代码行而不是最后两行。希望能帮助到你:

  • 问题内容: 网络服务器使用utf-8编码提供响应,所有文件都使用utf-8编码保存,我所知的所有设置都已设置为utf-8编码。 这是一个快速程序,用于测试输出是否有效: 该程序的输出为: 呈现为: 我可能做错了什么?我必须告诉DomDocument正确处理utf-8的具体程度是多少? 问题答案: 需要一个HTML字符串。 HTML 根据其规范使用默认的编码(ISO拉丁字母1号)。那是因为更长,请参

  • 问题内容: 我正在尝试为我的应用程序编写一个过滤器函数,该函数将采用输入字符串并以某种方式过滤掉与给定输入不匹配的所有对象。最简单的方法是使用String的contains方法,即仅检查对象(对象中的String变量)是否包含在过滤器中指定的字符串,但这不会考虑重音。 所讨论的对象基本上是Person,而我要匹配的字符串是名称。因此,例如,如果有人搜索Joao,我希望Joáo会包含在结果集中。我已

  • 问题内容: 如何从字符串中删除重音符号?尤其是在IE6中,我有类似以下内容: 但是IE6困扰着我,似乎不喜欢我的正则表达式。 问题答案: 使用ES2015 / ES6 String.Prototype.Normalize(), 这里发生两件事: 根据Unicode规范形式,将组合的字形分解为简单的字形。在中端起来表示为+ 。 现在,使用正则表达式字符类来匹配U + 0300→U + 036F范围,