当前位置: 首页 > 知识库问答 >
问题:

NLP提取关联词

田永春
2023-03-14

我是NLP算法的新手。我正在用法语使用 python 3。我想从属于一起的文本中提取一组单词。例如“左脚”“瓶装水”。我怎样才能找到一个规则,从文本/句子中提取一组单词。

(ps:我是法国人,不好意思表达自己)

谢谢你

共有1个答案

仲孙翔飞
2023-03-14

您可以使用Gensim短语(搭配)检测来查找句子中的常见短语(2个单词短语或3个单词短语),例如:

bigram = Phraser(phrases)
sent = [u'the', u'mayor', u'of', u'new', u'york', u'was', u'there']
print(bigram[sent])
Output: [u'the', u'mayor', u'of', u'new_york', u'was', u'there']

把注意力集中在纽约这个词上。

要确定两个单词是否相似,可以为它们计算单词向量并计算余弦相似度,请查看Gensim文档

此存储库上的法语预训练单词向量

祝你好运)

 类似资料:
  • 我选择两个id列,但指定错误: 一些代码: 如何修复错误,我做错了什么?

  • 据说是965的神仙公司,面试官有帅哥、有既好看声音又好听的小姐姐,都保养的很好,基本上都没有大厂的岁月感,慕了慕了 一面 拷打论文、项目 问输入输出、评价指标、改进和不足 把你的研究经历串起来 问模型训练、RAG、embedding、transformer等基础八股 二面 拷打项目、论文 数据质量评估 数据多样性、去重、配比的衡量 智能体 attention、kv cache等八股 手撕softm

  • 我试图通过视图约束循环。 我在view1中添加了:顶部、尾部、前导和高度约束。 顶部、尾部和前导是主ViewControllers视图。 如果循环查看view1的约束,则只会看到高度约束。 NSLayoutConstraint:0x618000968A0 UIView:0x7fae6b409dd0。高度==146(激活) 所以我循环了它的superviews约束(ViewControllers主视

  • 你可以使用 setFetchMode() 在运行时定义动态关联抓取的语义。 List cats = sess.createCriteria(Cat.class) .add( Restrictions.like("name", "Fritz%") ) .setFetchMode("mate", FetchMode.EAGER) .setFetchMode("kittens",

  • 问题内容: 我正在选择两个id列,但指定了错误: 一些代码: 如何解决错误,我在做什么错? 问题答案: 使用常规而不是(顺便说一句,默认情况下): 正如错误消息告诉您的那样,在这里没有意义,因为它是一种性能提示,会迫使人们急切加载收藏。

  • 我去研究了关于JPA2.1规范的信息,这就是我发现的: 用于联接的联接条件来自映射的联接列。这意味着JPQL用户通常不必知道每个关系是如何连接的。在某些情况下,需要在连接条件中附加附加条件,通常是在外部连接的情况下。这可以通过ON子句来实现。ON子句在JPA2.1规范中定义,某些JPA提供程序可能支持ON子句。EclipseLink:Hibernate:TopLink-支持ON子句。 需要注意的是

  • 使用“关联类型”可以增强代码的可读性,其方式是移动内部类型到一个 trait 作为output(输出)类型。这个 trait 的定义的语法如下: // `A` 和 `B` 在 trait 里面通过`type` 关键字来定义。 // (注意:此处的 `type` 不同于用作别名时的 `type`)。 trait Contains { type A; type B; // 通常