当前位置: 首页 > 知识库问答 >
问题:

如何使用group_by和summarize dplyr函数连接列

晋涛
2023-03-14

我有以下数据集“df1”:

我使用“group_by”和“总结”根据“类”列的最小值对codfam进行分组

df <- df1 %>% 
group_by(codfam) %>%
summarize(fam_class = min(class))

它工作正常,并返回如下结果:

现在,我将获得与函数“summarize”保留在数据集中的每个codfam相关的列“sex”的值,如下所示:

我试着用

   df <- df1 %>% 
   group_by(sex, codfam) %>%
   summarize(fam_class = min(class))

但不幸的是,它不起作用。

任何帮助或建议将不胜感激,提前感谢!

共有1个答案

花阳辉
2023-03-14

我们可以使用slice_min

library(dplyr)
df1 %>% 
  group_by(codfam) %>%
  slice_min(n = 1, order_by = class) %>%
  ungroup
 类似资料:
  • 问题内容: 我有一个令人尴尬的并行任务,我使用Spark来分配计算。这些计算是在Python中进行的,我使用PySpark读取和预处理数据。我任务的输入数据存储在HBase中。不幸的是,我还没有找到一种令人满意的(即易于使用且可扩展)的方式,可以使用Python从/向Spark读取/写入HBase数据。 我之前探讨过的内容: 使用从我的Python进程内部进行连接。该软件包允许使用HBase的Th

  • 我试图编写一个函数,该函数采用数据帧和变量名(或变量名列表),并使用group_by和summary函数输出摘要信息。然而,我不断得到以下错误之一: 或此错误: 最后一个错误表示它找不到名为“value”的列,该列包含数据框的值(熔化后)。 这是我的代码: 这是一个小数据示例。请注意,“变量”是一个总是被传递到group_by函数中的列,所以我决定将其硬编码。 如何编写此函数,使其接受group_

  • 我正在尝试将进度条连接到我的项目的函数。 到目前为止,这就是我所拥有的,但我很确定它毫无用处: 下面是我制作进度条的代码,如果有帮助的话: 我做了一些研究,了解到tkinter窗口在运行函数或类似的东西时会冻结。有没有办法在主函数中调用的每个函数末尾“解冻”窗口?

  • 问题内容: 我正在尝试从我的网站连接数据库,并使用C ++显示一些行。因此,基本上我正在尝试制作一个从站点数据库中的表中进行选择查询的应用程序。现在,这必须可行,因为我已经看到大量的应用程序正在这样做。 我该怎么做呢?有人可以举一个例子,告诉我应该使用哪些库吗? 问题答案: 在这里找到:

  • 我被要求创建一个名为的对象,它可以链接函数和。 例如: 在此场景中,它首先打印早餐,等待3秒钟,打印午餐,然后在3秒钟后打印晚餐。 我试过这样的东西,但没用。我错过了什么?

  • 我尝试使用spring boot和MySQL制作一些rest API。我在我的eclipse环境中完成了它。下一步是创建docker映像。然而,当我在docker中运行MySQL服务器和RESTAPI时,它会给我一个连接拒绝错误。 我找到了其他基本的spring-boot和MySQL教程。但我无法解决这个问题。 这是 spring-boot 项目的 mysql 设置。 这是在docker中运行my