我对标准差的计算有点执着,如果你能在下面的两个问题上给我一些帮助,那就太好了。
Day Drink People
1 Coffee 1
1 Coffee 3
1 Tea 5
1 Tea 4
1 Mint 7
1 Mint 5
2 Coffee 1
2 Coffee 3
2 Tea 4
2 Tea 8
2 Mint 9
2 Mint 3
3 Coffee 2
3 Coffee 4
3 Tea 5
3 Tea 3
3 Mint 2
3 Mint 2
代码
t <- aggregate(People ~ Day + Drink, data=t, mean)
Day Drink People
1 Coffee 2
1 Tea 5
1 Mint 6
2 Coffee 2
2 Tea 6
2 Mint 6
3 Coffee 3
3 Tea 4
3 Mint 2
问题1:我如何计算这个的标准误差(平均值的标准偏差)?
代码
t <- transform(t, AccPeople = ave(People, Drink, FUN=cumsum))
Day Drink People Acc People
1 Coffee 2 2
1 Tea 5 5
1 Mint 6 6
2 Coffee 2 4
2 Tea 6 11
2 Mint 6 12
3 Coffee 3 7
3 Tea 4 15
3 Mint 2 14
问题2:如何计算累积标准偏差?
非常感谢!!(很抱歉数据格式错误!)
您可以从层包中使用
ddply
:
library(plyr)
> < li>
计算平均值和标准误差(以及标准偏差):
dat2 <- ddply(dat, .(Day, Drink), summarise,
M = mean(People), SE = sd(People) / sqrt((length(People))),
SD = sd(People))
其中 dat
是数据框的名称。
计算累积平均值和累积标准差:
ddply(dat2, .(Drink), mutate,
Macc = cumsum(M), SDacc = cumsum(SD))
返回数组数组的标准偏差。 使用 Array.reduce() 来计算均值,方差已经值的方差之和,方差的值,然后确定标准偏差。 您可以省略第二个参数来获取样本标准偏差,或将其设置为 true 以获得总体标准偏差。 const standardDeviation = (arr, usePopulation = false) => { const mean = arr.reduce((acc, va
问题内容: 我想澄清一下,我正在寻找一种使用Streams计算标准偏差的方法(我目前有一种工作方法可以计算并返回SD,但不使用Streams)。 我正在使用的数据集紧密匹配,如Link中所示。如该链接所示,能够对我的数据进行分组并获得平均值,但无法弄清楚如何获取SD。 码 我还检查了DoubleSummaryStatistics上的链接,但似乎对SD没有帮助。 问题答案: 您可以将自定义收集器用于
我有一个集合列表和每个集合的一些基本统计数据(项目数、最小值、最大值、平均值、标准差)。我想计算所有集合的相同统计数据。计算总计数、最小最大值和平均值很容易,但我不确定如何计算总标准偏差。 数据如下所示: 同时生成所有集合的统计信息:
问题内容: 使用Python,假设我正在运行已知数量的项目,并且能够计时处理每个项目要花费的时间,以及运行所花费的总时间以及到目前为止所处理项目的数量。我目前正在计算飞行中的平均值,但是如果说单个项目花费的时间特别长(几秒钟而不是几毫秒),则可能会导致偏差。 我想展示一个运行中的标准偏差。如何在不保存每个记录的情况下执行此操作? 问题答案: 我使用的是Welford方法,它给出的结果更准确。该链接
我尝试使用< code>rowSds()来计算每一行的标准偏差,这样我就可以选择具有高标准偏差的行来绘制图表。 我的数据帧名为<code>xx 我试图计算每一行的标准偏差,并辅助sd列名: 我得到这个错误: 知道在计算SD时如何省略吗?我的语法正确吗?