当前位置: 首页 > 面试题库 >

Murmur3散列Python和Java实现之间的不同结果

傅俊德
2023-03-14
问题内容

我有两个不同的程序,分别希望在Python和Java中使用Murmur3散列相同的字符串。

Python版本2.7.9:

mmh3.hash128('abc')

给出79267961763742113019008347020647561319L。

Java是Guava 18.0:

HashCode hashCode = Hashing.murmur3_128().newHasher().putString("abc", StandardCharsets.UTF_8).hash();

给出字符串“
6778ad3f3f3f96b4522dca264174a23b”,转换为BigInterger给出137537073056680613988840834069010096699。

如何从两者中获得相同的结果?

谢谢


问题答案:

这是从这两者获得相同结果的方法:

byte[] mm3_le = Hashing.murmur3_128().hashString("abc", UTF_8).asBytes();
byte[] mm3_be = Bytes.toArray(Lists.reverse(Bytes.asList(mm3_le)));
assertEquals("79267961763742113019008347020647561319",
    new BigInteger(mm3_be).toString());

哈希码的字节需要被视为 小端,BigInteger将字节解释为大端。大概是您new BigInteger(hex, 16)用来创建BigInteger,但是的输出HashCode.toString()实际上是一系列十六进制数字对,它们表示散列字节的顺序与它们返回的顺序相同asBytes()(小尾数)。(您还可以反转这些对的十六进制,以获取一个十六进制数,当传递给时,该十六进制数的确产生相同的结果new BigInteger(reversedHex, 16))。

我认为的文档toString()有些混乱,因为它指的是“大端”。它实际上并不意味着该方法的输出是十六进制数字,表示被解释为大端字节的字节。

要添加到,我们还有一个未解决的问题。asBigInteger()``HashCode



 类似资料:
  • 我有这个正则表达式:https://regex101.com/r/vxHtzh/1 我有四场比赛。 但是对于我简单的java代码,我有不同的输出。 输出: 我哪里做错了?

  • 问题内容: 我有一个大问题。我使用此C#函数对消息进行编码: 在Java方面,我使用以下代码段: 我的消息是:阻止|注释|文本!£$%&/()=?^€> <{}ç°§;:_-。,@#ùàòè+ 我有这个结果: 你能帮我吗??谢谢… 问题答案: 我的猜测是您似乎正在将ASCII字节与Latin1字节进行比较。尝试切换 对此 那可能会解决您的问题。 (或切换C#以使用Latin1) 程序中发生的事情是

  • 问题内容: 我正在尝试构建一个应用程序,该应用程序使用流音频输入(例如:麦克风中的一条线),并使用IBM Bluemix(Watson)进行语音转文本。 我简要修改了此处找到的示例Java代码。此示例发送一个WAV,但是我发送的是FLAC …这[无关]不相关。 结果很差,非常差。这是使用Java Websockets代码时得到的: 现在,将上面的结果与下面的结果进行比较。这些是发送相同内容但使用c

  • 为什么他们不一样?我需要如何更改java版本以使其与Go版本完全相同?

  • 问题内容: 这是我的问题: 我有一个JAVA函数来生成加密的字符串。我必须在PHP中做同样的事情。 我的Java函数: 我的PHP函数: 这两个函数的返回值不相同。我注意到的是,在编码为base 64之前,两个函数的结果相同。因此,对我而言,问题不在于密钥的生成,而在于编码。 有人能帮忙吗? 问题答案: 答案在PHP函数hash_hmac 的文档中。 设置为TRUE时,输出原始二进制数据。FALS

  • 本文向大家介绍简单总结Python中序列与字典的相同和不同之处,包括了简单总结Python中序列与字典的相同和不同之处的使用技巧和注意事项,需要的朋友参考一下 共同点: 1.它们都是python的核心类型,是python语言自身的一部分 核心类型与非核心类型 多数核心类型可通过特定语法来生成其对象,比如"dave"就是创建字符串类型的对象的表达式; 非核心类型需要内置函数来创建,比如文件类型需要调