当前位置: 首页 > 知识库问答 >
问题:

LDA可以为一个单词指定多个主题吗?

琴琪
2023-03-14

我刚刚开始阅读关于潜在Dirichlet分配LDA的文章,并希望将其应用到我的项目中。

我可以知道LDA是否能将一个主题分配给多个单词吗?

例如,A条谈到“河岸”,而B条谈到“银行在金融中的作用”。因此,LDA是否允许将“银行”一词潜在地分配给两个不同的主题?

共有1个答案

毕浩渺
2023-03-14

LDA主题是项的概率分布。术语在任何或所有主题中可能具有非零权重。你可以改变这一点,找出每个主题在给定特定术语时的概率。因此,是的,像“银行”这样的术语可以被分配到许多主题,但一般来说,它将被分配到一些比其他更重要的主题。

 类似资料:
  • 当我的@KafkaListener收听多个主题时,有人知道如何优先考虑单个Kafka主题吗? 下面是我的代码示例: 我的问题是,我想从主题之前阅读其他非Prio主题。只有当我的是空的,我才应该开始使用其他主题,而没有任何特定的顺序。任何提示/建议都很感激。谢谢你的帮助!

  • 潜在狄利克雷分配(LDA)是一个主题模型,用于查找一组文档背后的潜在变量(主题)。我使用python gensim包,有两个问题: > 我打印出每个主题最频繁的单词(我尝试了10,20,50个主题),发现单词的分布非常“平坦”:意味着即使是最频繁的单词也只有1%的概率... 大多数主题都是相似的:这意味着每个主题中最常用的单词重叠很多,并且主题中的高频词几乎共享同一组单词。。。 我想问题可能是因为

  • 在构建Kafka Streams拓扑时,可以通过两种不同的方式对多个主题的读取进行建模: 读取具有相同源节点的所有主题。 选项1相对于选项2是否有相对优势,反之亦然?所有主题都包含相同类型的数据,并具有相同的数据处理逻辑。

  • 我正在使用gensim lda进行主题建模并获得如下结果: 主题1:word1 word2 word3 word4 主题2:word4 word1 word2 word5 主题3:word1 word4 word5 word6 然而,在同一个lda上使用木槌不会产生跨主题的重复单词。我有大约20份文件

  • 有人知道一个听众是否可以听下面这样的多个话题吗?我知道“主题1”很管用,如果我想添加其他主题呢?你能给我举个例子吗?谢谢你的帮助! 或者