当前位置: 首页 > 面试题库 >

使用NLTK比较术语/表达式的相似性?

邴子实
2023-03-14
问题内容

我正在尝试比较在语义上相关的术语/表达-这些不是完整的句子,不一定是单个单词;例如-

“社交网络服务”和“社交网络”显然密切相关,但是我如何使用nltk对此进行量化?

显然,我甚至缺少一些代码:

w1 = wordnet.synhtml" target="_blank">sets('social network')

返回一个空列表。

关于如何解决这个问题有什么建议吗?


问题答案:

有一些语义上的相似性或相似性度量,但是据我所知,最好将它们定义为wordnet词典中的单个单词或单个表达式-而不是wordnet词典条目的复合词。

这是许多基于wordnet的相似度的不错的Web实现

  • http://wn-similarity.sourceforge.net/

如果您有兴趣,还可以阅读一些有关使用词网相似性解释化合物的文章(尽管不评估化合物的相似性):

  • CiteSeerX(引用更清晰)
  • 同一篇文章,PDF


 类似资料:
  • 问题内容: 我正在尝试将一张图片与其他图片列表进行比较,并返回该列表中具有最高70%相似度的图片(例如Google搜索图片)。 我在这篇文章中获得了这段代码,并根据自己的情况进行了更改 我的问题是,如何将图像与图像列表进行比较并仅获得相似图像?有什么方法可以做到这一点? 问题答案: 我建议您看一下图像之间推土机的距离(EMD)。该度量给人一种将标准化的灰度图像转换成另一幅图像有多难的感觉,但可以将

  • 了解ANTLR最好的方法就是实例。构建一个简单的计算器是个不错的主意。为了使它容易理解且保持简单,我们将只允许基本的算术运算符(加、减、乘、除)、括号表达式、整数和变量。 grammar Calc; prog : stat+ ; stat : expr | ID '=' expr ; expr : expr ('*'|'/') expr

  • 问题内容: 我想将多个字符串相互比较,并找到最相似的字符串。我想知道是否有任何库,方法或最佳实践会返回我哪些字符串与其他字符串更相似的字符串。例如: “The quick fox jumped” -> “The fox jumped” “The quick fox jumped” -> “The fox” 该比较将返回第一个比第二个更相似。 我想我需要一些方法,例如: 某处有这样的东西吗? 编辑:

  • 给定一个 R 表达式,该表达式表示项的总和,例如 <代码>表达式 我想以名称或表达式列表的形式检索sum的所有项的集合。因此,在本例中,元素将是:< code>a、< code>b * c、< code>d和< code>e * f。 以下内容来自评论。 tems本身可以包含一个运算符,如 所以我们需要对R语言有所了解。 是否有一个简单的方法进行,例如,使用pryr包的?

  • 问题内容: 我写了以下正则表达式来标记某些短语模式 此模式将正确标记短语,例如: 并使用2个短语给出所需的输出: 披萨很好 意大利面不好 但是,如果我的句子是这样的: 仅匹配短语: 而不是所需的: 我如何在第二个示例中也加入正则表达式模式? 问题答案: 首先,让我们看一下NLTK提供的POS标签: (注意:以上是NLTK v3.1的输出,旧版本可能有所不同) 您实际上想要捕获的是: NN VBD

  • 问题内容: 我花了很多时间研究一个库,该库使我可以用Java比较图像。 我并没有真正找到有用的东西,也许我的GoogleSearch技能还不够高,所以我想问一下你们是否可以指出我在哪里可以找到这样的东西。 基本上我想做的是将两个图像相互比较,并获得两个相似程度的值。大约一个百分比。 我希望你们有我可以使用的东西,我自己不知道该怎么写… PS:不一定必须使用Java,这只是我的应用程序将要运行的环境