当前位置: 首页 > 面试题库 >

utf8_general_ci和utf8_unicode_ci有什么区别?[重复]

吕征
2023-03-14
问题内容

这个问题已经在这里有了答案

7年前关闭。

可能重复:

utf8_general_ci和utf8_unicode_ci有什么区别

我对Unicode有了两个选择,这些选择对于mysql数据库来说很有希望。

utf8_general_ci unicode (multilingual), case-insensitive
utf8_unicode_ci unicode (multilingual), case-insensitive

您能解释一下utf8_general_ci和utf8_unicode_ci有什么区别吗?在设计数据库时,一个选择一个会产生什么影响?


问题答案:

utf8_general_ci这是一种非常简单的排序规则,在Unicode上很破损,这种排序对普通Unicode文本给出的 结果不正确
。它的作用是:

  • 转换为Unicode规范化形式D以进行规范分解
  • 删除任何组合字符
  • 转换为大写

这在Unicode上无法正常工作,因为它不了解Unicode大小写。单独使用Unicode框比处理ASCII格式的方法要复杂得多。例如:

  • “ẞ”的小写字母是“ß”,但是“ß”的大写字母是“ SS”。
  • 有两个小写的希腊语西格玛,但只有一个大写的西格玛。考虑“Σίσυφος”。
  • 像“ø”这样的字母不会分解为“ o”加变音符号,这意味着它不会正确排序。

还有许多其他的细微之处。

  1. utf8_unicode_ci使用标准 Unicode排序规则算法 ,支持所谓的扩展和连字,例如:德语字母ß(U + 00DF LETTER SHARP S)在“ ss”附近排序字母Œ(U + 0152 LATIN CAPITAL LIGATURE OE)在“ OE”附近排序”。

utf8_general_ci 不支持扩展名/连字号,而是将所有这些字母排序为单个字符,有时顺序错误。

  1. utf8_unicode_ci一般 所有脚本更准确。例如,在西里尔字母上: utf8_unicode_ci适用于所有以下语言:俄语,保加利亚语,白俄罗斯语,马其顿语,塞尔维亚语和乌克兰语。utf8_general_ci仅适用于西里尔文的俄语和保加利亚子集。白俄罗斯语,马其顿语,塞尔维亚语和乌克兰语中使用的多余字母排序不正确。

成本utf8_unicode_ci是,它是一个 稍微
有点慢utf8_general_ci。但这就是您为正确性付出的代价。您可能会得到一个错误的快速答案,或者是一个稍微慢一些的正确答案。你的选择。永远难以证明给出错误的答案是正确的,因此最好假设它utf8_general_ci不存在并始终使用utf8_unicode_ci。好吧,除非您想要错误的答案。

资料来源:http :
//forums.mysql.com/read.php?103,187048,188748#msg-188748



 类似资料:
  • 问题内容: 和之间,在效果方面是否存在差异? 问题答案: 这两个归类均适用于UTF-8字符编码。区别在于文本的排序和比较方式。 注意:在MySQL中,您必须使用而不是。令人困惑的是,是早期MySQL版本中有缺陷的UTF-8实现,仅用于向后兼容。固定版本的名称为。 注意:较新版本的MySQL已更新了Unicode排序规则,可以在名称下使用,例如 基于Unicode 9.0的等效规则-且没有等效 变体

  • < code>$@和< code >“$ @”有什么区别吗? 我知道非特殊字符可能存在差异,但是带有输入参数的符号呢?

  • 问题内容: 这个问题已经在这里有了答案 : MyISAM与InnoDB [已关闭] (25个答案) 6年前关闭。 我知道以前曾有人问过这个问题,但大多数时候都是针对特定的数据库或表提出这个问题。我无法在此站点上找到描述这两个引擎及其区别的答案,而不必顾及某人的特定数据库。 我希望将来能够在设计表或数据库方面做出更明智的决定,因此我正在寻找有关两个存储引擎之间差异的全面答案。 MyISAM和Inno

  • 问题内容: 我今天换了讲师,他对我说了奇怪的代码。(他说最好用,当我问为什么时,他回答“因为是!”) 所以这是一个例子: 而不是我习惯的: 两者之间有什么区别。为什么他的方式(使用)更好? 通过快速搜索发现了这一点,但我无法真正理解该答案: 问题答案: 在Java中,总是只比较两个引用(对于非原始元素),即,它测试两个操作数是否引用同一对象。 但是,该方法可以被覆盖-因此两个不同的对象仍然可以相等

  • 可能的重复: console.dir 和 console.log 有什么区别? 我最近了解到 的存在。 在浏览了MDN之后,我并没有清楚地理解它和< code>console.log之间的真正区别。它们都显示相同的输出(但是< code >。dir显示一些属性),是这样吗? 调试/开发时应该使用哪个函数? 编辑:我刚刚发现了一个回答我想法的现有问题:console.dir和console.log有

  • 问题内容: 两者都意味着空间,但是有什么区别吗? 问题答案: 一个是不间断空间,另一个是常规空间。不间断的空格表示该行不应在该点处换行,就像它不会在一个单词的中间换行一样。 此外,正如斯文德(Svend)在其评论中指出的那样,不间断的空间不会崩溃。