我有张桌子是这样的:TABLE
LOCATION ANALYSIS TYPE
A A,B,C,D
A D,E,F
B KA
B A,B,C
B C,D,E
我希望为每个位置生成一个单行清单,列出使用pandas
可用的分析类型。因此,对于这列列表,我希望合并并按位置显示唯一值的单个列表。
IE:
A A,B,C,D,E,F
B A,B,C,D,E,KA
所需表格_OUT
抱歉,没有代码。我在熊猫身上尝试过各种劈叉,没有接近。
试试这个:
df1 = pd.DataFrame({'Location':['A']*2+['B']*3
,'Analysis_Type':['A,B,C,D','D,E,F','KA','A,B,C','C,D,E']})
df1.set_index('Location')['Analysis_Type'].str.split(',')\
.groupby(level=0)\
.agg(lambda x: ','.join(sorted(list(set(x.sum())))))\
.reset_index()
输出:
Location Analysis_Type
0 A A,B,C,D,E,F
1 B A,B,C,D,E,KA
我已经查看了Pandas的内置csv功能,但是我的csv数据保存在一个列表中。我如何简单地将列表隐藏到一个7列的数据帧中。 提前谢了。
是有效输入。 无效 有效 无效 无效(只有7个数字) 我尝试了,但它接受重复的数字
问题内容: 我有一个这样的熊猫数据框: 我现在想做的是获取一个包含Column1和新columnA的新数据框。此columnA应该包含第2列-(to)n的所有值(其中n是从Column2到行尾的列数),如下所示: 我如何最好地解决这个问题?任何意见将是有益的。提前致谢! 问题答案: 您可以按行调用pass ,然后将dtype转换为和: 在这里,我呼吁摆脱,但是我们需要再次强制转换为,这样我们才不会
我有两列,一列有年份,另一列有月份数据,我正试图从中创建一列(包含年份和月份)。 示例: 我想拥有 我试过了 但它给了我“无法从重复轴重新编制索引”错误。
我如何修改我的regex来为那些以“”或“,”开头,以“”或“,”结尾的字符串返回false
我在sessionList中有这种数据 现在,我想运行一个循环,将此数据放入hashmap,即键和值对,因为我想将hashmap数据发布到URL,所以我需要将会话列表中的所有值映射到hashmap中 我试过这样的东西,但它不起作用。 如您所见,我将一些字符串值放在字符串映射中,并将“date”和count值作为变量,以便可以在其中填充检索到的值。此“date”值应由逗号之前的sesionList数