当前位置：首页 > 面试题库 >

如何计算两个向量的余弦相似度？

裴意

2023-03-14

问题内容：

如何找到向量之间的余弦相似度？

我需要找到相似性来衡量两行文本之间的相关性。

例如，我有两个句子：

用户界面系统

用户界面机

…及其在tF-idf之后的向量，然后使用LSI进行标准化，例如 [1,0.5]和[0.5,1]。

如何测量这些向量之间的相似性？

问题答案：

public class CosineSimilarity extends AbstractSimilarity {

  @Override
  protected double computeSimilarity(Matrix sourceDoc, Matrix targetDoc) {
    double dotProduct = sourceDoc.arrayTimes(targetDoc).norm1();
    double eucledianDist = sourceDoc.normF() * targetDoc.normF();
    return dotProduct / eucledianDist;
  }
}

我最近在大学的信息检索部门做了一些tf-idf的工作。我使用了这种余弦相似度方法，该方法使用Jama：Java Matrix
Package
。

有关完整的源代码，请参阅《IR Math with
Java：相似性度量》
，这是一个非常好的资源，涵盖了许多不同的相似性度量。

类似资料：

如何计算两个张量之间的余弦相似度？

问题内容：我有两个标准化张量，我需要计算这些张量之间的余弦相似度。如何使用TensorFlow做到这一点？问题答案：这将完成工作：此打印
计算Keras中两个张量之间的余弦相似度

问题内容：我一直在遵循一个教程，该教程显示了如何制作word2vec模型。本教程使用以下代码：（未提供其他信息，但我想这来自）现在，我已经对该方法进行了一些研究，但对此却知之甚少。据我了解，它已被许多功能取代。我应该使用什么？有，它有一个参数（似乎正确），但没有参数。在这种情况下我可以使用什么？问题答案： Keras文档中有一些尚不清楚的事情，我认为了解这些至关重要：对于keras
余弦相似度的SQL计算

问题内容：假设您在数据库中按以下方式构造了一个表：为了清楚起见，应输出：请注意，由于向量存储在数据库中，因此我们仅需要存储非零条目。在此示例中，我们只有两个向量$ v_ {99} =（4,3,4,0）$和$ v_ {1234} =（0,5,2,3）$都在$ \ mathbb {R}中^ 4 $。这些向量的余弦相似度应为$ \ displaystyle \ frac {23} {\ sqrt
余弦相似度

问题内容：我计算了两个文档的tf / idf值。以下是tf / idf值：这些文件就像：如何使用这些值来计算余弦相似度？我知道我应该计算点积，然后找到距离并除以点积。如何使用我的值来计算？还有一个问题：两个文档的字数相同是否重要？问题答案： a * b是点积一些细节：是。在某种程度上，a和b必须具有相同的长度。但是a和b通常具有稀疏表示，您只需要存储非零条目，就可以更快地计算范数
两个pyspark数据帧的余弦相似性

我有一个PySpark数据帧，df1，看起来像: 我有第二个PySpark数据帧，df2 我想得到两个数据帧的余弦相似性。并有类似的东西
Python-给定2个句子字符串，计算余弦相似度

问题内容：从：查找文档相似度，可以使用余弦计算文档相似度。如果不导入外部库，是否有任何方法可以计算2个字符串之间的余弦相似度？问题答案：一个简单的纯Python实现是：印刷品：这里所用的余弦公式描述这里。这不包括通过对单词进行加权，但是为了使用，你需要具有一个相当大的语料库才能从中估计的权重。你还可以通过使用更复杂的方法从一段文本中提取单词，对其进行词干或词义化等来进一步开发它。

相关阅读

Python-给定2个句子字符串，计算余弦相似度 Python 余弦相似度与皮尔逊相关系数计算实例计算pyspark中数据框所有行之间的余弦相似度余弦相似度与Okapi BM25有何不同？余弦相似性计算及python代码实现过程解析

相关文章

初识支持向量机SVM分类算法 Matlab向量 Tableau计算中车株洲计算机方向笔试+一面【华为OD机试2023】统计差异值大于相似值二Python

相关问答

计算几个向量的中值如果两个重载函数相似，如何做出更好的设计正余弦模扩展精度算法查找两个字符串之间的相似性度量如何基于Python中的一个条件计算两列字符串类型中的相似值？

相关工具

功能齐全的计算器计算机进化简易计算器一个类似Twitter的微博平台 Axiom计算机代数系统

相关文档

计算机科学的基础 Python 科学计算 OpenCL 2.0 异构计算计算与推断思维学习计算机编程