问题：

Neo4j-如何基于给定节点的多个属性计算余弦相似性

冯俊英

2023-03-14

我有一个包含n-用户的Neo4j数据库。每个用户都连接到他们各自的性别节点（M和F）、年龄组节点、种族节点等。我想根据他们的性别、年龄、种族等找到两个用户之间的相似性。

此密码查询仅基于一个属性进行计算

MATCH (p1:Person)-[x:RATED]->(m:Movie)<-[y:RATED]-(p2:Person)
WITH  SUM(x.rating * y.rating) AS xyDotProduct,
SQRT(REDUCE(xDot = 0.0, a IN COLLECT(x.rating) | xDot + a^2)) AS xLength,
SQRT(REDUCE(yDot = 0.0, b IN COLLECT(y.rating) | yDot + b^2)) AS yLength,
p1, p2
MERGE (p1)-[s:SIMILARITY]-(p2)
SET   s.similarity = xyDotProduct / (xLength * yLength)

我想根据性别、年龄组、种族等多个属性进行计算

共有1个答案

左博学

2023-03-14

这里有一个用于neo4j链接的APOC库，它可以为您做到这一点。两个功能的示例：

MATCH (p1:Person),(p2:Person) 
WITH p1,p2,apoc.algo.cosineSimilarity([p1.count,p1.age_nor],[p2.count,p2.age_nor]) as value
MERGE (p1)-[s:SIMILARITY]-(p2)
SET s.cosine = value

你也可以查看这篇博文以了解更多信息。

类似资料：

余弦相似度的SQL计算

问题内容：假设您在数据库中按以下方式构造了一个表：为了清楚起见，应输出：请注意，由于向量存储在数据库中，因此我们仅需要存储非零条目。在此示例中，我们只有两个向量$ v_ {99} =（4,3,4,0）$和$ v_ {1234} =（0,5,2,3）$都在$ \ mathbb {R}中^ 4 $。这些向量的余弦相似度应为$ \ displaystyle \ frac {23} {\ sqrt
如何计算两个向量的余弦相似度？

问题内容：如何找到向量之间的余弦相似度？我需要找到相似性来衡量两行文本之间的相关性。例如，我有两个句子：用户界面系统用户界面机 …及其在tF-idf之后的向量，然后使用LSI进行标准化，例如和。如何测量这些向量之间的相似性？问题答案：我最近在大学的信息检索部门做了一些tf-idf的工作。我使用了这种余弦相似度方法，该方法使用Jama：Java Matrix Package 。有
Python-给定2个句子字符串，计算余弦相似度

问题内容：从：查找文档相似度，可以使用余弦计算文档相似度。如果不导入外部库，是否有任何方法可以计算2个字符串之间的余弦相似度？问题答案：一个简单的纯Python实现是：印刷品：这里所用的余弦公式描述这里。这不包括通过对单词进行加权，但是为了使用，你需要具有一个相当大的语料库才能从中估计的权重。你还可以通过使用更复杂的方法从一段文本中提取单词，对其进行词干或词义化等来进一步开发它。
如何计算两个张量之间的余弦相似度？

问题内容：我有两个标准化张量，我需要计算这些张量之间的余弦相似度。如何使用TensorFlow做到这一点？问题答案：这将完成工作：此打印
余弦相似度

问题内容：我计算了两个文档的tf / idf值。以下是tf / idf值：这些文件就像：如何使用这些值来计算余弦相似度？我知道我应该计算点积，然后找到距离并除以点积。如何使用我的值来计算？还有一个问题：两个文档的字数相同是否重要？问题答案： a * b是点积一些细节：是。在某种程度上，a和b必须具有相同的长度。但是a和b通常具有稀疏表示，您只需要存储非零条目，就可以更快地计算范数
两个pyspark数据帧的余弦相似性

我有一个PySpark数据帧，df1，看起来像: 我有第二个PySpark数据帧，df2 我想得到两个数据帧的余弦相似性。并有类似的东西

Neo4j-如何基于给定节点的多个属性计算余弦相似性

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档