为了比较不同的组,我们需要每个组的摘要统计信息。它有助于我们观察两组之间的差异。摘要统计信息提供最小值,第一四分位数,中位数,第三四分位数和最大值。因此,我们可以比较每个组的这些值。要找到R数据帧的逐组汇总统计信息,我们可以使用tapply函数。
请看以下数据帧-
> set.seed(99) > x1<-sample(1:100,50,replace=TRUE) > x2<-rep(c("G1","G2","G3","G4","G5"),times=10) > df<-data.frame(x1,x2) > head(df,20) x1 x2 1 48 G1 2 33 G2 3 44 G3 4 22 G4 5 99 G5 6 62 G1 7 98 G2 8 32 G3 9 13 G4 10 20 G5 11 100 G1 12 31 G2 13 68 G3 14 9 G4 15 82 G5 16 88 G1 17 30 G2 18 86 G3 19 84 G4 20 32 G5
查找每个组的x1的摘要统计量-
> tapply(df$x1, df$x2, summary) $G1 Min. 1st Qu. Median Mean 3rd Qu. Max. 14.0 55.0 72.0 67.8 86.5 100.0 $G2 Min. 1st Qu. Median Mean 3rd Qu. Max. 4.0 31.5 60.5 52.4 69.5 98.0 $G3 Min. 1st Qu. Median Mean 3rd Qu. Max. 14.0 33.5 41.0 46.9 64.5 86.0 $G4 Min. 1st Qu. Median Mean 3rd Qu. Max. 9.00 23.75 53.00 53.30 82.75 97.00 $G5 Min. 1st Qu. Median Mean 3rd Qu. Max. 7.00 31.25 32.00 42.40 44.75 99.00
让我们再看一个例子-
> y1<-rep(c(letters[1:5]),times=5) > y2<-rep(c(14,25,13,12,41,52,44,28,17,30),times=c(2,5,3,3,1,5,1,2,2,1)) > df_y<-data.frame(y1,y2) > head(df_y,20) y1 y2 1 a 14 2 b 14 3 c 25 4 d 25 5 e 25 6 a 25 7 b 25 8 c 13 9 d 13 10 e 13 11 a 12 12 b 12 13 c 12 14 d 41 15 e 52 16 a 52 17 b 52 18 c 52 19 d 52 20 e 44 > tapply(df_y$y2, df_y$y1, summary) $a Min. 1st Qu. Median Mean 3rd Qu. Max. 12.0 14.0 25.0 26.2 28.0 52.0 $b Min. 1st Qu. Median Mean 3rd Qu. Max. 12.0 14.0 25.0 26.2 28.0 52.0 $c Min. 1st Qu. Median Mean 3rd Qu. Max. 12.0 13.0 17.0 23.8 25.0 52.0 $d Min. 1st Qu. Median Mean 3rd Qu. Max. 13.0 17.0 25.0 29.6 41.0 52.0 $e Min. 1st Qu. Median Mean 3rd Qu. Max. 13.0 25.0 30.0 32.8 44.0 52.0
我有一个BigDecimal的列表。 如何使用Java8流获得上述列表的汇总统计信息,而不丢失BigDecimal的3-4位小数的精度?
本文向大家介绍如何找到R数据帧的列值之和?,包括了如何找到R数据帧的列值之和?的使用技巧和注意事项,需要的朋友参考一下 R数据框包含可能代表相似类型变量的列;因此,我们可能希望找到每个列的值的总和,然后基于该总和进行比较。这可以借助sum函数来完成,但是首先我们需要提取列以找到和。 示例 请看以下数据帧- 找出所有列的总和- 让我们再看一个例子-
本文向大家介绍如何将摘要统计信息保存到R中的数据框中?,包括了如何将摘要统计信息保存到R中的数据框中?的使用技巧和注意事项,需要的朋友参考一下 当我们找到数据帧的摘要统计信息时,输出将作为表返回,并且每一列都记录了最小,第一四分位数,中位数,中位数,第三四分位数和最大值及其名称。如果我们要将此摘要另存为数据框,则最好使用apply函数对其进行计算并将其存储为data.frame。 示例 请看以下数
本文向大家介绍如何找到R数据帧中所有值的均值?,包括了如何找到R数据帧中所有值的均值?的使用技巧和注意事项,需要的朋友参考一下 如果数据框具有所有数字列,那么我们可能有兴趣查找该数据框中所有值的均值,但是由于数据框对象不是数字,因此无法直接完成此操作。因此,要查找R数据帧中所有值的均值,我们需要先将其转换为矩阵,然后使用均值函数。 示例 请看以下数据帧- 输出结果 使用均值函数查找均值- 示例 输
我试着把XML解析成R数据帧,这个链接帮了我大忙: 如何从xml文件创建R数据帧 但我还是没有弄清楚我的问题: 下面是我的代码: 我想要的数据帧是这样的: 我被困住了,任何帮助都将非常感谢,谢谢。
问题内容: 给定一个自引用表 与相关值的相关表 还有一些样本数据 我需要一个存储程序来接送直属孩子,并为他们,他们的孩子和他们的孩子一路走来。 例如,如果传入,则树将是直接子代,输出将是 应该采用哪种方法来实现此行为? 我正在考虑使用CTE,但想知道是否有更好/更快的方法。 问题答案: 假设您的层次结构不算太深,这样的递归CTE将可以工作: 非CTE方法将需要某种形式的迭代,基于游标或其他方式。由