当前位置: 首页 > 知识库问答 >
问题:

Python/Pandas合并并从逗号分隔的变量/列[重复]生成唯一值列表

计燕七
2023-03-14

我有张桌子是这样的:TABLE

LOCATION   ANALYSIS TYPE
A          A,B,C,D
A          D,E,F
B          KA
B          A,B,C
B          C,D,E

我希望为每个位置生成一个单行清单,列出使用pandas可用的分析类型。因此,对于这列列表,我希望合并并按位置显示唯一值的单个列表。

IE:
A         A,B,C,D,E,F
B         A,B,C,D,E,KA

所需表格_OUT

抱歉,没有代码。我在熊猫身上尝试过各种劈叉,没有接近。

共有1个答案

闾丘炫明
2023-03-14

试试这个:

df1 = pd.DataFrame({'Location':['A']*2+['B']*3
                   ,'Analysis_Type':['A,B,C,D','D,E,F','KA','A,B,C','C,D,E']})
df1.set_index('Location')['Analysis_Type'].str.split(',')\
   .groupby(level=0)\
   .agg(lambda x: ','.join(sorted(list(set(x.sum())))))\
   .reset_index()

输出:

  Location Analysis_Type
0        A   A,B,C,D,E,F
1        B  A,B,C,D,E,KA
 类似资料:
  • 我已经查看了Pandas的内置csv功能,但是我的csv数据保存在一个列表中。我如何简单地将列表隐藏到一个7列的数据帧中。 提前谢了。

  • 是有效输入。 无效 有效 无效 无效(只有7个数字) 我尝试了,但它接受重复的数字

  • 问题内容: 我有一个这样的熊猫数据框: 我现在想做的是获取一个包含Column1和新columnA的新数据框。此columnA应该包含第2列-(to)n的所有值(其中n是从Column2到行尾的列数),如下所示: 我如何最好地解决这个问题?任何意见将是有益的。提前致谢! 问题答案: 您可以按行调用pass ,然后将dtype转换为和: 在这里,我呼吁摆脱,但是我们需要再次强制转换为,这样我们才不会

  • 我有两列,一列有年份,另一列有月份数据,我正试图从中创建一列(包含年份和月份)。 示例: 我想拥有 我试过了 但它给了我“无法从重复轴重新编制索引”错误。

  • 我如何修改我的regex来为那些以“”或“,”开头,以“”或“,”结尾的字符串返回false

  • 我在sessionList中有这种数据 现在,我想运行一个循环,将此数据放入hashmap,即键和值对,因为我想将hashmap数据发布到URL,所以我需要将会话列表中的所有值映射到hashmap中 我试过这样的东西,但它不起作用。 如您所见,我将一些字符串值放在字符串映射中,并将“date”和count值作为变量,以便可以在其中填充检索到的值。此“date”值应由逗号之前的sesionList数