问题：

Python/Pandas合并并从逗号分隔的变量/列[重复]生成唯一值列表

计燕七

2023-03-14

我有张桌子是这样的：TABLE

LOCATION   ANALYSIS TYPE
A          A,B,C,D
A          D,E,F
B          KA
B          A,B,C
B          C,D,E

我希望为每个位置生成一个单行清单，列出使用pandas可用的分析类型。因此，对于这列列表，我希望合并并按位置显示唯一值的单个列表。

IE:
A         A,B,C,D,E,F
B         A,B,C,D,E,KA

所需表格_OUT

抱歉，没有代码。我在熊猫身上尝试过各种劈叉，没有接近。

共有1个答案

闾丘炫明

2023-03-14

试试这个：

df1 = pd.DataFrame({'Location':['A']*2+['B']*3
                   ,'Analysis_Type':['A,B,C,D','D,E,F','KA','A,B,C','C,D,E']})
df1.set_index('Location')['Analysis_Type'].str.split(',')\
   .groupby(level=0)\
   .agg(lambda x: ','.join(sorted(list(set(x.sum())))))\
   .reset_index()

输出：

  Location Analysis_Type
0        A   A,B,C,D,E,F
1        B  A,B,C,D,E,KA

类似资料：

Python将逗号分隔列表转换为pandas dataframe

我已经查看了Pandas的内置csv功能，但是我的csv数据保存在一个列表中。我如何简单地将列表隐藏到一个7列的数据帧中。提前谢了。
Regex验证逗号分隔的唯一数字列表

是有效输入。无效有效无效无效（只有7个数字）我尝试了，但它接受重复的数字
将多个列值合并到python pandas的一列中

问题内容：我有一个这样的熊猫数据框：我现在想做的是获取一个包含Column1和新columnA的新数据框。此columnA应该包含第2列-（to）n的所有值（其中n是从Column2到行尾的列数），如下所示：我如何最好地解决这个问题？任何意见将是有益的。提前致谢！问题答案：您可以按行调用pass ，然后将dtype转换为和：在这里，我呼吁摆脱，但是我们需要再次强制转换为，这样我们才不会
Python：合并两列[重复]

我有两列，一列有年份，另一列有月份数据，我正试图从中创建一列（包含年份和月份）。示例：我想拥有我试过了但它给了我“无法从重复轴重新编制索引”错误。
Regex中逗号分隔的值[重复]

我如何修改我的regex来为那些以“”或“，”开头，以“”或“，”结尾的字符串返回false
如何用逗号分隔数组列表值并放入hashmap

我在sessionList中有这种数据现在，我想运行一个循环，将此数据放入hashmap，即键和值对，因为我想将hashmap数据发布到URL，所以我需要将会话列表中的所有值映射到hashmap中我试过这样的东西，但它不起作用。如您所见，我将一些字符串值放在字符串映射中，并将“date”和count值作为变量，以便可以在其中填充检索到的值。此“date”值应由逗号之前的sesionList数

Python/Pandas合并并从逗号分隔的变量/列[重复]生成唯一值列表

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档