我有一个集合列表和每个集合的一些基本统计数据(项目数、最小值、最大值、平均值、标准差)。我想计算所有集合的相同统计数据。计算总计数、最小最大值和平均值很容易,但我不确定如何计算总标准偏差。
数据如下所示:
Count Max Min Mean Stddev
1,027,671 781 68 57.8 32.79
839,473 552 54 61.3 48.53
3,012,102 890 41 64.9 41.92
同时生成所有集合的统计信息:
4,879,246 890 41 62.8 ???
我认为不可能根据你掌握的数据准确计算出这一点。问题在于,标准偏差取决于组合数据集的平均值,该平均值不一定与单个平均值相同,还取决于每个点与该平均值之间的距离,您无法精确(但可能近似)访问该平均值。
我假设您正在编写维护分布的代码,而不仅仅是使用一些已经计算了标准偏差的数据。对于计算机来说,标准dev并不是一个很自然的参数。相反,您应该保持项目数量、总和和项目总和的平方,然后您可以轻松地计算这3条原始信息的平均值和标准偏差分布。我在这里的代码中使用这个策略。添加操作支持合并两个发行版。注意它的实现是多么简单。http://github.com/rrenaud/dominionstats/blob/master/stats.py#L17.
返回数组数组的标准偏差。 使用 Array.reduce() 来计算均值,方差已经值的方差之和,方差的值,然后确定标准偏差。 您可以省略第二个参数来获取样本标准偏差,或将其设置为 true 以获得总体标准偏差。 const standardDeviation = (arr, usePopulation = false) => { const mean = arr.reduce((acc, va
我有20个具有相同分辨率和范围的光栅。这是一个时间序列,每个光栅代表一年。 我想计算所有光栅的像素均方差。到目前为止,我使用的是光栅包。 中庸之道奏效了。但标准差给了我这个错误:
我对标准差的计算有点执着,如果你能在下面的两个问题上给我一些帮助,那就太好了。 代码 问题1:我如何计算这个的标准误差(平均值的标准偏差)? 代码 问题2:如何计算累积标准偏差? 非常感谢!!(很抱歉数据格式错误!)
问题内容: 我想澄清一下,我正在寻找一种使用Streams计算标准偏差的方法(我目前有一种工作方法可以计算并返回SD,但不使用Streams)。 我正在使用的数据集紧密匹配,如Link中所示。如该链接所示,能够对我的数据进行分组并获得平均值,但无法弄清楚如何获取SD。 码 我还检查了DoubleSummaryStatistics上的链接,但似乎对SD没有帮助。 问题答案: 您可以将自定义收集器用于
问题内容: 使用Python,假设我正在运行已知数量的项目,并且能够计时处理每个项目要花费的时间,以及运行所花费的总时间以及到目前为止所处理项目的数量。我目前正在计算飞行中的平均值,但是如果说单个项目花费的时间特别长(几秒钟而不是几毫秒),则可能会导致偏差。 我想展示一个运行中的标准偏差。如何在不保存每个记录的情况下执行此操作? 问题答案: 我使用的是Welford方法,它给出的结果更准确。该链接