当前位置: 首页 > 面试题库 >

Swift中的字符串和字符比较不区分语言环境是什么意思?

干茂才
2023-03-14
问题内容

我开始学习Swift语言,我很好奇,这意味着Swift中的字符串和字符比较不区分语言环境?这是否意味着所有字符都像UTF-8字符一样存储在Swift中?


问题答案:

(现在已为Swift 3更新所有代码示例。)

将Swift字符串与<进行比较,基于所谓的“
Unicode规范化形式D”
(可以使用进行计算
decomposedStringWithCanonicalMapping)进行词典上的比较

例如,分解

"ä" = U+00E4 = LATIN SMALL LETTER A WITH DIAERESIS

是两个Unicode代码点的序列

U+0061,U+0308 = LATIN SMALL LETTER A + COMBINING DIAERESIS

出于演示目的,我编写了一个小的String扩展名,该扩展名将String的内容转储为Unicode代码点的数组:

extension String {
    var unicodeData : String {
        return self.unicodeScalars.map {
            String(format: "%04X", $0.value)
            }.joined(separator: ",")
    }
}

现在,让我们取一些字符串,用<以下命令对它们进行排序:

let someStrings = ["ǟψ", "äψ", "ǟx", "äx"].sorted()
print(someStrings)
// ["a", "ã", "ă", "ä", "ǟ", "b"]

并将每个字符串(原始和分解形式)的Unicode代码点转储到排序数组中:

for str in someStrings {
    print("\(str)  \(str.unicodeData)  \(str.decomposedStringWithCanonicalMapping.unicodeData)")
}

输出

äx  00E4,0078  0061,0308,0078
ǟx  01DF,0078  0061,0308,0304,0078
ǟψ  01DF,03C8  0061,0308,0304,03C8
äψ  00E4,03C8  0061,0308,03C8

很好地显示了该比较是通过分解形式的Unicode代码点的字典顺序进行的。

如以下示例所示,对于多个字符的字符串也是如此。用

let someStrings = ["ǟψ", "äψ", "ǟx", "äx"].sorted()

以上循环的输出是

äx  00E4,0078  0061,0308,0078
ǟx  01DF,0078  0061,0308,0304,0078
ǟψ  01DF,03C8  0061,0308,0304,03C8
äψ  00E4,03C8  0061,0308,03C8

意思就是

"äx" < "ǟx", but "äψ" > "ǟψ"

(这至少对我来说是出乎意料的)。

最后,让我们将其与语言环境敏感的顺序进行比较,例如瑞典语:

let locale = Locale(identifier: "sv") // svenska
var someStrings = ["ǟ", "ä", "ã", "a", "ă", "b"]
someStrings.sort {
    $0.compare($1, locale: locale) == .orderedAscending
}

print(someStrings)
// ["a", "ă", "ã", "b", "ä", "ǟ"]

如您所见,结果与Swift <排序不同。



 类似资料:
  • 问题内容: 我在Firebase中有一个数据库,该数据库将有单独的用户节点。在每个用户的节点中将是与他们有关的数据,并且将是私有的。除此之外,我还想创建一个仅包含已注册电子邮件集合的节点。原因是当用户使用“登录VC”并输入电子邮件时。如果电子邮件已注册,则图像视图将变为绿色。但是,如果电子邮件不在数据库中(或与电子邮件地址格式不匹配),该图像将为红色。 我先前的问题的先前答案表明我需要更改“。”。

  • 本文向大家介绍C语言字符串大小比较,包括了C语言字符串大小比较的使用技巧和注意事项,需要的朋友参考一下 C语言字符串大小比较 以上所述就是本文的全部内容了,希望大家能够喜欢。

  • 为了使事情清楚,第一个是希腊语'β',第二个是拉丁语'B'。 当然,python给出False作为输出是正确的,但是对于我正在工作的脚本来说,我需要这样的字符来计算相同的值。尝试了几种编码/解码操作,但仍然算作不同的操作。有什么想法吗?

  • 问题内容: 如何以不区分大小写的方式比较字符串? 例如,“ Go”和“ go”应视为相等。 问题答案: https://golang.org/pkg/strings/#EqualFold是您要寻找的功能。它的用法如下(来自链接文档的示例):

  • 问题内容: 我有一个Android应用程序,我想检查安装的应用程序名称是否与传递给包含此代码的函数的字符串匹配。代码和示例如下: 假设您打过电话,并且手机上的应用程序名称与返回的名称相同。但是,它永远不会。我记录了结果,它应该匹配,但事实并非如此。任何人都可以请问我为什么这行不通吗? 问题答案: 使用String的equals()方法代替==运算符来比较字符串: 在Java中,新手遇到的最常见错误

  • 这里有2个测量: 正如您所见,比较两个匹配的字符串比比较两个大小相同但不匹配的字符串要快。这是非常令人不安的:在字符串比较期间,我认为python是逐字符测试字符串的,所以应该比更长,因为它需要对1进行4次测试才能进行不匹配的比较。可能比较是基于哈希的,但在这种情况下,两种比较的计时应该相同。 你知道为什么吗?