当前位置: 首页 > 编程笔记 >

如何找到R数据帧的分组汇总统计信息?

陆栋
2023-03-14
本文向大家介绍如何找到R数据帧的分组汇总统计信息?,包括了如何找到R数据帧的分组汇总统计信息?的使用技巧和注意事项,需要的朋友参考一下

为了比较不同的组,我们需要每个组的摘要统计信息。它有助于我们观察两组之间的差异。摘要统计信息提供最小值,第一四分位数,中位数,第三四分位数和最大值。因此,我们可以比较每个组的这些值。要找到R数据帧的逐组汇总统计信息,我们可以使用tapply函数

示例

请看以下数据帧-

> set.seed(99)
> x1<-sample(1:100,50,replace=TRUE)
> x2<-rep(c("G1","G2","G3","G4","G5"),times=10)
> df<-data.frame(x1,x2)
> head(df,20)
x1 x2
1 48 G1
2 33 G2
3 44 G3
4 22 G4
5 99 G5
6 62 G1
7 98 G2
8 32 G3
9 13 G4
10 20 G5
11 100 G1
12 31 G2
13 68 G3
14 9 G4
15 82 G5
16 88 G1
17 30 G2
18 86 G3
19 84 G4
20 32 G5

查找每个组的x1的摘要统计量-

> tapply(df$x1, df$x2, summary)
$G1
Min. 1st Qu. Median Mean 3rd Qu. Max.
14.0 55.0 72.0 67.8 86.5 100.0
$G2
Min. 1st Qu. Median Mean 3rd Qu. Max.
4.0 31.5 60.5 52.4 69.5 98.0
$G3
Min. 1st Qu. Median Mean 3rd Qu. Max.
14.0 33.5 41.0 46.9 64.5 86.0
$G4
Min. 1st Qu. Median Mean 3rd Qu. Max.
9.00 23.75 53.00 53.30 82.75 97.00
$G5
Min. 1st Qu. Median Mean 3rd Qu. Max.
7.00 31.25 32.00 42.40 44.75 99.00

让我们再看一个例子-

> y1<-rep(c(letters[1:5]),times=5)
> y2<-rep(c(14,25,13,12,41,52,44,28,17,30),times=c(2,5,3,3,1,5,1,2,2,1))
> df_y<-data.frame(y1,y2)
> head(df_y,20)
  y1 y2
 1 a 14
 2 b 14
 3 c 25
 4 d 25
 5 e 25
 6 a 25
 7 b 25
 8 c 13
 9 d 13
10 e 13
11 a 12
12 b 12
13 c 12
14 d 41
15 e 52
16 a 52
17 b 52
18 c 52
19 d 52
20 e 44
> tapply(df_y$y2, df_y$y1, summary)
$a
Min. 1st Qu. Median Mean 3rd Qu. Max.
12.0 14.0 25.0 26.2 28.0 52.0
$b
Min. 1st Qu. Median Mean 3rd Qu. Max.
12.0 14.0 25.0 26.2 28.0 52.0
$c
Min. 1st Qu. Median Mean 3rd Qu. Max.
12.0 13.0 17.0 23.8 25.0 52.0
$d
Min. 1st Qu. Median Mean 3rd Qu. Max.
13.0 17.0 25.0 29.6 41.0 52.0
$e
Min. 1st Qu. Median Mean 3rd Qu. Max.
13.0 25.0 30.0 32.8 44.0 52.0
 类似资料:
  • 我有一个BigDecimal的列表。 如何使用Java8流获得上述列表的汇总统计信息,而不丢失BigDecimal的3-4位小数的精度?

  • 本文向大家介绍如何找到R数据帧的列值之和?,包括了如何找到R数据帧的列值之和?的使用技巧和注意事项,需要的朋友参考一下 R数据框包含可能代表相似类型变量的列;因此,我们可能希望找到每个列的值的总和,然后基于该总和进行比较。这可以借助sum函数来完成,但是首先我们需要提取列以找到和。 示例 请看以下数据帧- 找出所有列的总和- 让我们再看一个例子-

  • 本文向大家介绍如何将摘要统计信息保存到R中的数据框中?,包括了如何将摘要统计信息保存到R中的数据框中?的使用技巧和注意事项,需要的朋友参考一下 当我们找到数据帧的摘要统计信息时,输出将作为表返回,并且每一列都记录了最小,第一四分位数,中位数,中位数,第三四分位数和最大值及其名称。如果我们要将此摘要另存为数据框,则最好使用apply函数对其进行计算并将其存储为data.frame。 示例 请看以下数

  • 本文向大家介绍如何找到R数据帧中所有值的均值?,包括了如何找到R数据帧中所有值的均值?的使用技巧和注意事项,需要的朋友参考一下 如果数据框具有所有数字列,那么我们可能有兴趣查找该数据框中所有值的均值,但是由于数据框对象不是数字,因此无法直接完成此操作。因此,要查找R数据帧中所有值的均值,我们需要先将其转换为矩阵,然后使用均值函数。 示例 请看以下数据帧- 输出结果 使用均值函数查找均值- 示例 输

  • 我试着把XML解析成R数据帧,这个链接帮了我大忙: 如何从xml文件创建R数据帧 但我还是没有弄清楚我的问题: 下面是我的代码: 我想要的数据帧是这样的: 我被困住了,任何帮助都将非常感谢,谢谢。

  • 问题内容: 给定一个自引用表 与相关值的相关表 还有一些样本数据 我需要一个存储程序来接送直属孩子,并为他们,他们的孩子和他们的孩子一路走来。 例如,如果传入,则树将是直接子代,输出将是 应该采用哪种方法来实现此行为? 我正在考虑使用CTE,但想知道是否有更好/更快的方法。 问题答案: 假设您的层次结构不算太深,这样的递归CTE将可以工作: 非CTE方法将需要某种形式的迭代,基于游标或其他方式。由