当前位置: 首页 > 知识库问答 >
问题:

一个数组的平均间隔,python中的标准差(Pandas)

呼延明朗
2023-03-14

我想计算两个相关数组的许多连续间隔的均值和标准偏差(如下所示),其中前两列分别是(比方说)时间和距离。第三、四、五是平均时间(中心)、平均距离和偏差标准。(实际上这是我亲手做的)。在这个例子中,平均值和标准差是为每三个连续的间隔做出的(但通常可以超过4×4,10×10,以此类推)。

所以,我有类似的长列表,我想计算(可能用PANDAS,NUMPY和/或SCIPY)类似的东西,做一些循环,创建平均时间,平均距离和偏差标准数组。因此,能够绘制距离与时间的关系图,并绘制时间和距离的平均值及其标准差(误差,称为西格玛)

1  1   2  4.6   3.29
2  4   5  25.6  8.17
3  9   8  64.6  13.07
4  16  11 121.6 17.96
5  25  14 196.6 22.86
6  36  17 289.6 27.76
7  49  20 400.6 32.66
8  64
9  81
10 100
11 121
12 144
13 169
14 196
15 225
16 256
17 289
18 324
19 361
20 400
21 441

我使用errorbar绘制了这个图,但我的问题是如何为每个间隔执行循环

共有1个答案

申黎明
2023-03-14

你可以用Numpy做这个。Reshape可用于将数据分组为块以计算统计数据:

import numpy as np

// data
time = np.arange(1.0,22.0)
distance = time ** 2

// group data into chunks to get stats
meanTime = np.mean(time.reshape(-1,3),axis=1)
meanDistance = np.mean(distance.reshape(-1,3), axis=1)
std = np.std(distance.reshape(-1,3), axis=1)
 类似资料:
  • 问题内容: 我正在尝试学习SQL,所以请耐心等待。我正在使用PostgreSQL 9.3 我想根据日期窗口对一列进行平均。我能够编写窗口函数来完成一个集合,但是我希望能够随着不断增长做到这一点。我的意思是: 我假设有一个比对我要平均的每个范围运行查询更好的方法。任何建议表示赞赏。谢谢你。 编辑 我正在尝试创建均匀分布的垃圾箱,以用于汇总表的值。 我的间隔是: 这里是一个表的列 并且 是并列我想表分

  • 问题内容: 这是我的问题,我有一个像这样的数据框: 我只想计算整个数据帧的平均值,因为以下方法不起作用: 然后我想出了: 但是,此技巧不适用于计算标准偏差。我最后的尝试是: 除了在后一种情况下,它使用了numpy中的mean()和std()函数。这不是平均值的问题,而是std的问题,因为pandas函数默认使用,而不是numpy的where 。 问题答案: 您可以将数据框转换为单列(将形状从5x3

  • 我想用excel计算三个月内三名员工的销售标准差和平均值。是否有一个公式可以根据所选员工姓名给出该公式?我希望它是一个可重复和可扩展的公式,适用于100名员工。另外,我不想在这里使用pivot功能,因为我想在pivot字段中使用std-dev和average。输入输入 输出

  • 示例数据: 我想计算每个唯一列名称的平均值和标准偏差(忽略NA)以获得如下输出: 可再现数据: 我得到的最接近的是 这是我从这篇文章中得到的,但我不知道如何调整它来得到我想要的。我知道我可以取rowmeans的平均值来得到每组的平均值,但这不适用于标准差。

  • 我的大脑正在融化。。。我正在努力实现以下目标: 我知道有多少个数组,每个数组有多少个元素。这些数字是动态的,但假设有:3个数组,每个数组中有18个元素。 例子: 现在我想得到所有三个数组的元素1的平均值,以及所有三个数组的元素2的平均值,以此类推。 最终结果应该是所有18个元素的平均值的一个数组。 比如: 如果3是固定的,这将起作用,但数组的数量是动态的。 希望这有意义...

  • 我想用C++实现这样一个算法,但是任何对解决方案的描述都会很有帮助。