df为1个data.frame对象,有stratum和psu两列,这里统计stratum列计数
方法1:
cnt = table(df$stratum)
方法2:
cnt = tapply(df$psu, INDEX=df$stratum, FUN=length)
在方法2的基础上,只要改变FUN函数就可以实现分组求和、求均值等功能,如下
分组求均值:
tapply(df$psu, INDEX=df$stratum, FUN=mean)
#(等价于python中的df.groupby('stratum').psu.mean)