问题：

Python（熊猫）-处理数字数据，但添加非数字数据回来

阎涵忍

2023-03-14

我有一个CSV文件，如下所示：

Build,Avg,Min,Max
BuildA,56.190,39.123,60.1039
BuildX,57.11,40.102,60.200
BuildZER,55.1134,35.129404123,60.20121

我想得到每列的平均值，最小值，最大值，并将这些统计数据作为新行。我排除非数字列（构建列），然后运行统计信息。我通过这样做来实现这一点：

df = pd.read_csv('fakedata.csv')
columns = []
builds = []

for column in df.columns:
    if(df[column].dtype == 'float64'):
        columns.append(column)
    else:
        builds.append(column)

save = df[builds]
df = df[columns]

print(df)

df.loc['Min']= df.min()
df.loc['Average']= df.mean()
df.loc['Max']= df.max()

如果我当时将此数据写入CSV，它将如下所示：

,Avg,Min,Max
0,56.19,39.123,60.1039
1,57.11,40.102,60.2
2,55.1134,35.129404123,60.20121
Min,55.1134,35.129404123,60.1039
Average,55.8817,37.3709520615,60.1522525
Max,57.11,40.102,60.20121

这接近我想要的，但我希望构建列再次成为第一列，并在最小，平均，最大值的顶部存在构建名称。基本上是这样的：

Builds,Avg,Min,Max
BuildA,56.19,39.123,60.1039
BuildX,57.11,40.102,60.2
BuildZER,55.1134,35.129404123,60.20121
Min,55.1134,35.129404123,60.1039
Average,55.8817,37.3709520615,60.1522525
Max,57.11,40.102,60.20121

我试图通过以下方式实现这一目标：

df.insert(0,'builds', save)
with open('fakedata.csv', 'w') as f:
    df.to_csv(f)

但这给了我一个CSV：

,builds,Avg,Min,Max
0,Build1,56.19,39.123,60.1039
1,Build2,57.11,40.102,60.2
2,Build3,55.1134,35.129404123,60.20121
Min,,55.1134,35.129404123,60.1039
Average,,55.8817,37.3709520615,60.1522525
Max,,57.11,40.102,60.20121

我怎样才能解决这个问题？

共有1个答案

万知

2023-03-14

IIUC：

df_out = pd.concat([df.set_index('Build'),df.set_index('Build').agg(['max','min','mean'])]).rename(index={'max':'Max','min':'Min','mean':'Average'}).reset_index()

输出：

      index      Avg        Min       Max
0    BuildA  56.1900  39.123000  60.10390
1    BuildX  57.1100  40.102000  60.20000
2  BuildZER  55.1134  35.129404  60.20121
3       Max  57.1100  40.102000  60.20121
4       Min  55.1134  35.129404  60.10390
5   Average  56.1378  38.118135  60.16837

类似资料：

添加两个熊猫数据框

问题内容：我有两个，都被索引。我需要将元素添加在一起以形成一个new ，但前提是索引和列相同。如果该项不存在于之一，则应将其视为零。我试过使用，但这无论索引和列如何。还尝试了一个简单的方法，但是如果两个数据框都没有该元素，则给出a 。有什么建议？问题答案：怎么样
熊猫：为多个列添加数字

我正在与以下df合作：我想强制所有年份的数字：有没有一个简单的方法来做这件事，还是我必须把它们全部打印出来？
Python熊猫数据帧加入两个数据帧[复制]

我正在尝试连接到数据帧。它们看起来像这样期望的最终目标是：我一直试图使用pd.merge和。连接函数与on='外'设置不成功
熊猫数据帧中两个非数字列之间的关联

我从表中的SQL查询中获取数据到我的熊猫数据框。数据如下所示：现在我想从这两列中找出相关性和频率，并用Matplotlib将其可视化。我试过这样的方法：现在，我如何以最简单的方式将这种关联可视化呢？
熊猫：从字典创建数据帧

拿着字典：我如何把这个字典变成一个数据框，其中的值是列？即。我想要一个数据框显示：这种形式似乎根本得不到！谢谢这是一个不同的问题，另一个问题只是问如何将字典的值放入数据帧，我问的是如何获得我概述的特定形式
Python熊猫重塑数据帧

这似乎是非常基本的知识，但我还是卡住了，尽管我有一些数据处理的理论背景（通过其他软件）。值得一提的是，我是蟒蛇和熊猫图书馆的新手。我的任务是将系列名称列的值作为单独的列（从长到宽转换）。我花了很长时间尝试不同的方法，但只有错误。例如：我犯了一个错误： ...很多短信...通过值的长度是2487175，索引暗示2 有谁能指导我完成这个过程吗？谢谢它用于代码“mydata=mydata”。pi

Python（熊猫）-处理数字数据，但添加非数字数据回来

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档