当前位置: 首页 > 知识库问答 >
问题:

创建单词列表并按索引分组

许沛
2023-03-14

我有一列索引,每个索引都有对应的单词:

等等

我想按索引将它们按如下方式分组:对于id 1-[word1,word2,word3]对于id 2-[word4,word5]

诸如此类

并提取到CSV文件

我有这个代码:

df = pd.DataFrame(data)
d={"word":"first"}
df_new = df.groupby(df['id'], as_index=False).aggregate(d).reindex(columns=df['word'])
print (df_new)

df_new.to_csv('test.csv', sep='\t', encoding='utf-8', index=False)    

我需要做什么改变才能让它起作用?

提前谢谢你

共有1个答案

韩弘方
2023-03-14
# Import Dependencies
import pandas as pd

# Create DataFrame
data = {'id': [1, 1, 1, 2, 2], 'word': ['word1', 'word2', 'word3', 'word4', 'word5']}
df = pd.DataFrame(data)

# Groupby and Merge
df = df.groupby('id', as_index=False).agg({'word' : ','.join})  
# Result

    id  word
0   1   word1,word2,word3
1   2   word4,word5
 类似资料:
  • 我有以下问题:有几个文本文档需要解析和创建索引,但没有停止词和词干。我可以手动操作,但我从一位同事那里听说Lucene可以自动操作。我在网上搜索了很多我尝试过的例子,但是每个例子都使用了不同版本的lucene和不同的方法,没有一个例子是完整的。在这个过程结束时,我需要计算集合中每个术语的tf/idf。 更新:我现在已经用一个文档创建了一个索引。doc没有停止词,并且有词干。如何使用lucenc计算

  • 问题内容: 我想按索引列表来分割字符串,其中分割段以一个索引开始,然后在下一个索引之前结束。 例: 这将返回: 长字符串,我想分手 的字符串,我想分手了 ,我想分手 我想分手 我试图得到: 长 串 的是 我要分手 问题答案: 退货 您可以使用以下命令进行打印: 另一种可能性(不复制)是:

  • 问题内容: 我有一个CHAR(250)列用作varchar(24)列的外键。 在MySQL中,我记得我可以创建一个指定column(24)的索引,以便在最左边的24个字符上创建索引。在MS SQL Server上似乎无法实现。 我的问题是这样的: 是否可以在SQL Server 2008上使用索引视图为该列的子字符串建立索引,如果是,则它会对表的性能产生任何副作用吗? 问题答案: 您可以创建一个持

  • 问题内容: 在Python中,我有一个元素列表和一个索引列表。我有什么办法可以立即检索其中的值作为索引的所有那些项? 例: 问题答案: 我不知道有什么方法可以做。但是您可以使用列表理解:

  • 问题内容: 您是否需要为Oracle数据库中按字段分组的字段创建索引? 例如: 我正在测试我为上面创建的索引,与此查询唯一相关的索引是为field_two创建的索引。在任何其他字段上创建的其他单字段索引或组合索引将不会用于上述查询。这听起来正确吗? 问题答案: 可能是正确的,但这取决于您拥有多少数据。通常,我会为我在GROUP BY中使用的列创建索引,但是在您的情况下,优化器可能已经决定,在使用f

  • 源码 .. index:: 创建, 索引, 测试