问题：

熊猫：在独立列中转换列的值

尹冠宇

2023-03-14

我有一个熊猫数据框，它看起来如下（df\u olymic）。我希望将列Type的值转换为独立的列（df_olympic_table）

原始数据帧

In [3]: df_olympic
Out[3]: 
   Country    Type Num
0      USA    Gold  46
1      USA  Silver  37
2      USA  Bronze  38
3       GB    Gold  27
4       GB  Silver  23
5       GB  Bronze  17
6    China    Gold  26
7    China  Silver  18
8    China  Bronze  26
9   Russia    Gold  19
10  Russia  Silver  18
11  Russia  Bronze  19

转换数据帧

In [5]: df_olympic_table
Out[5]: 
  Country N_Gold N_Silver N_Bronze
0     USA     46       37       38
1      GB     27       23       17
2   China     26       18       26
3  Russia     19       18       19

实现这一目标最方便的方法是什么？

共有1个答案

虞俊美

2023-03-14

您可以使用DataFrame。枢轴：

df = df.pivot(index='Country', columns='Type', values='Num')
print (df)
Type     Bronze  Gold  Silver
Country                      
China        26    26      18
GB           17    27      23
Russia       19    19      18
USA          38    46      37

另一个带有DataFrame的解决方案。设置索引和系列。取消堆叠：

df = df.set_index(['Country','Type'])['Num'].unstack()
print (df)
Type     Bronze  Gold  Silver
Country                      
China        26    26      18
GB           17    27      23
Russia       19    19      18
USA          38    46      37

但如果得到：

ValueError:索引包含重复的条目，无法重塑

需要pivot_table和一些aggreagte函数，默认为np。平均值，但您可以使用求和，先。。。

#add new row with duplicates value in 'Country' and 'Type'
print (df)
   Country    Type  Num
0      USA    Gold   46
1      USA  Silver   37
2      USA  Bronze   38
3       GB    Gold   27
4       GB  Silver   23
5       GB  Bronze   17
6    China    Gold   26
7    China  Silver   18
8    China  Bronze   26
9   Russia    Gold   19
10  Russia  Silver   18
11  Russia  Bronze   20 < - changed value to 20
11  Russia  Bronze  100 < - add new row with duplicates


df = df.pivot_table(index='Country', columns='Type', values='Num', aggfunc=np.mean)
print (df)
Type     Bronze  Gold  Silver
Country                      
China        26    26      18
GB           17    27      23
Russia       60    19      18 < - Russia get ((100 + 20)/ 2 = 60
USA          38    46      37

或者Groupby，聚合的意思是，并通过unstack重塑：

df = df.groupby(['Country','Type'])['Num'].mean().unstack()
print (df)
Type     Bronze  Gold  Silver
Country                      
China        26    26      18
GB           17    27      23
Russia       60    19      18 < - Russia get ((100 + 20)/ 2 = 60
USA          38    46      37

类似资料：

熊猫将True列转换为列值

我有以下布尔值表：我想创建一个具有相同索引的新数据帧，但每行都有前一列的前三个 True 列名。如果一行少于三个真值，则新数据帧将具有空值。
在熊猫中将一行转换为列

请考虑下表：对于每个代码，每一个状态都有一些值。现在我想以这样的方式转置表，使成为列：我不能让它工作，只转置那个特定的列。在熊猫身上实现这一目标的好办法是什么？
将熊猫列转换为DateTime

我有一个字段在熊猫DataFrame被导入为字符串格式。它应该是日期时间变量。如何将其转换为日期时间列，然后根据日期进行筛选。示例：数据帧名称：原始数据
在熊猫[重复的]中转换为行的序列列表

我有一个数据框，如下所示如何从它创建一个单独的x和y列？
熊猫-替换列值

问题内容：我知道这个问题有很多主题，但是没有一种方法适合我，因此我将发布有关我的具体情况的信息我有一个看起来像这样的数据框：我想做的是将“性别”列中的全0替换为“女”，并将所有1替换为“男”，但是当我使用上面的代码时，数据框中的值似乎没有变化我是否使用了replace（）错误？还是有更好的方法进行条件值替换？问题答案：是的，您使用的是错误的，默认情况下不是就地操作，它会返回替换的数据框
熊猫列值到列？

问题内容：我已经看到了将一个列/系列分解为Pandas数据框的多个列的主题的几种变体，但是我一直在尝试做点事情，而实际上并没有成功地使用现有方法。给定这样的一个DataFrame：我想将系列中的项目转换为以值作为值的列，如下所示：我觉得这应该是相对简单的事情，但是由于卷积水平的提高，我已经为此花了几个小时不停地努力，但没有成功。问题答案：有几种方法：使用：使用：使用后跟：

熊猫：在独立列中转换列的值

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档