问题：

在lda中出现在所有主题中的单词

子车峰

2023-03-14

我正在使用gensim lda进行主题建模并获得如下结果：

主题1:word1 word2 word3 word4

主题2:word4 word1 word2 word5

主题3:word1 word4 word5 word6

然而，在同一个lda上使用木槌不会产生跨主题的重复单词。我有大约20份文件

共有1个答案

孔经武

2023-03-14

在LDA中，所有单词都是所有主题的一部分，但概率不同。你可以为你的文字定义一个最小的打印概率，但如果mallet在不同的主题中也没有找到至少两个“重复”的文字，我会非常惊讶。确保gensim和mallet使用相同的参数。

类似资料：

在主题建模中使用Word2vec输出作为LDA的输入

我已经读到，主题建模（从文本中提取可能的主题）最常用的技术是潜在的Dirichlet分配（LDA）。但最近我了解到另一款lda2vec。然而，我感兴趣的是尝试Word2Vec输出作为LDA的输入是否是一个好主意。你认为为了一些研究而采用这种方法有意义吗？因为我正在做主题建模，所以需要一些新颖的方法。
使用LDA（主题模型）：每个主题在单词上的分布相似且“平坦”

潜在狄利克雷分配（LDA）是一个主题模型，用于查找一组文档背后的潜在变量（主题）。我使用python gensim包，有两个问题： > 我打印出每个主题最频繁的单词（我尝试了10,20,50个主题），发现单词的分布非常“平坦”：意味着即使是最频繁的单词也只有1%的概率... 大多数主题都是相似的：这意味着每个主题中最常用的单词重叠很多，并且主题中的高频词几乎共享同一组单词。。。我想问题可能是因为
如何更改目录中所有文件中单词的所有出现

问题内容：我正在创建其中一种方法为的类的过程。之后砰我的头到键盘的时间，我终于发现，我是谁继承了这个特定的数据库先前编码拼写的单词“ 权限 ”为“ privelages 在数百个文件在MySQL数据库”，因而也处处访问这些“ 特权 ”就是这样拼写的。是否有Linux操作系统（的方式 Ubuntu的服务器），我可以去通过每一个地方的文件夹，并替换“ privelages 用”，“ 特权 ”，
选择VSCode中所有出现的选定单词

在visual studio代码中选择所选单词的所有实例是否有任何技巧或扩展，以便在不搜索和替换的情况下编辑或删除这些实例，如升华文本中的ِAltF3
命令列出Kafka版本0.8.1中的所有主题

然而，我无法在0.8.1中找到相同的内容。https://github.com/apache/kafka/blob/0.8.1/bin 任何指针都可以
删除Kafka主题中的所有消息

我看过与此相关的类似问题，但并没有找到正确的答案。我只想从 Kafka 主题中删除消息，而不是更改保留超时。我已经安装了kafka_2.11-0.8.2.1，并使用蝙蝠文件在Windows上运行它。我想知道我是否可以删除主题中发布的所有消息，而不删除整个主题。

在lda中出现在所有主题中的单词

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档