当前位置: 首页 > 面试题库 >

查找两个字符串之间不同的第一个字符

单于山
2023-03-14
问题内容

给定两个相等长度的字符串,是否有一种优雅的方法来获取第一个不同字符的偏移量?

显而易见的解决方案是:

for ($offset = 0; $offset < $length; ++$offset) {
    if ($str1[$offset] !== $str2[$offset]) {
        return $offset;
    }
}

但这对于如此简单的任务而言似乎并不正确。


问题答案:

您可以使用按位XOR(^)的一个不错的属性来实现此目的:基本上,当您将两个字符串异或时,相同的字符将变为空字节("\0")。因此,如果我们对两个字符串进行异或运算,我们只需要使用以下命令找到第一个非空字节的位置strspn

$position = strspn($string1 ^ $string2, "\0");

这里的所有都是它的。因此,让我们看一个例子:

$string1 = 'foobarbaz';
$string2 = 'foobarbiz';
$pos = strspn($string1 ^ $string2, "\0");

printf(
    'First difference at position %d: "%s" vs "%s"',
    $pos, $string1[$pos], $string2[$pos]
);

将会输出:

位置7的第一个区别:“ a”与“ i”

所以应该这样做。这是 非常 有效的,因为它仅使用C函数,并且仅需要字符串存储的单个副本。

编辑:沿同一行的多字节解决方案:

function getCharacterOffsetOfDifference($str1, $str2, $encoding = 'UTF-8') {
    return mb_strlen(
        mb_strcut(
            $str1,
            0, strspn($str1 ^ $str2, "\0"),
            $encoding
        ),
        $encoding
    );
}

首先使用上述方法找到字节级别的差异,然后将偏移量映射到字符级别。这是通过使用mb_strcut函数完成的,该函数基本上是在substr尊重多字节字符边界。

var_dump(getCharacterOffsetOfDifference('foo', 'foa')); // 2
var_dump(getCharacterOffsetOfDifference('©oo', 'foa')); // 0
var_dump(getCharacterOffsetOfDifference('f©o', 'fªa')); // 1

它不像第一个解决方案那样优雅,但是仍然是单一的(如果使用默认编码则更简单):

return mb_strlen(mb_strcut($str1, 0, strspn($str1 ^ $str2, "\0")));


 类似资料:
  • 问题内容: 如何找到两个子字符串之间的字符串? 我当前的方法是这样的: 但是,这似乎效率很低而且不合Python。什么是做这样的更好的方法? 忘了提:该字符串可能无法启动,并最终和。他们之前和之后的字符可能更多。 问题答案:

  • 问题内容: 我正在尝试 使用循环从两个不同的用户输入中打印常用字母。(我需要使用for循环来完成它。)我遇到了两个问题:1.我的语句“ If char not in output …”没有提取唯一值。2.输出为我提供了单个字母列表,而不是单个字符串。我尝试分割输出,但是分割遇到类型错误。 问题答案: 您正在尝试执行“设置相交”。Python有 相同的方法。您可以将其用于您的用例,例如: 将返回字符

  • 我有一个这样的字符串: 我正在尝试获取任何显示为title(title=“anything here”)的内容。我已经尝试过了,但无法正常工作。

  • 问题内容: 假设我们有类似的东西: 我想将“ someText”替换为其他内容。考虑到我不知道someText可能是什么(任何字符串)并且我所知道的是它将被&firstString =和&endString =包围的事实,最佳方法是什么? 编辑:对不起,看起来这还不够清楚。我不知道“ someText”可能是什么,我仅有的信息是它将位于&firstString =和&endString =之间 我

  • 我正在使用DocX库来替换word文档中的文本。我想以某种方式找到模板docx文件中“[]”之间的所有字符串,例如[Name]、[LastName]、[Date]等...并将其替换为我以前加载到datagridview中具有相同列名(name、LastName、Date)的值。以下是我目前掌握的信息:

  • 如何获得一个字符串与Python中的另一个字符串相似的概率? 我想得到一个十进制值,如0.9(意味着90%)等。最好使用标准Python和库。 e、 g。