下面是一些示例数据,它的输出是我想要得到的。
df <- tibble(id=c(rep("A",100),rep("B",100),rep("C",100)),
val=c(rnorm(300,mean=500,sd=100))) %>%
mutate(val_bin=cut(val,breaks=5))
table(df$id,df$val_bin)
输出:
(210,325] (325,440] (440,554] (554,669] (669,784]
A 4 22 55 18 1
B 6 19 46 24 5
C 3 23 44 22 8
我们可以选择
感兴趣的列并应用表
library(dplyr)
df %>%
select(id, val_bin) %>%
table
或者另一个选项是在{}
中包装
df %>%
{table(.$id, .$val_bin)}
在tidyverse
中,获取所需的输出要复杂一些
library(dplyr)
library(tidyr)
df %>%
count(id, val_bin) %>%
pivot_wider(names_from = val_bin, values_from = n, values_fill = list(n = 0)) %>%
column_to_rownames('id')
# (214,338] (338,461] (461,584] (584,707] (707,831]
#A 5 30 44 20 1
#B 9 30 34 27 0
#C 8 28 43 20 1
我如何只使用dplyr函数(想象一下有6M行的巨大的Data.Table(BIGiris))来实现与下面的代码相同的功能呢 输出是这个。请注意,我必须重新命名列1。另外,在dplyr mutate或其他调用中,我希望以某种方式为我的新count列指定名称。 想象一下连接到这样一个表(假设iris data.frame有6M行),species更像是“species_id” 最终联接和输出(对于联接
我有以下数据集“df1”: 我使用“group_by”和“总结”根据“类”列的最小值对codfam进行分组 它工作正常,并返回如下结果: 现在,我将获得与函数“summarize”保留在数据集中的每个codfam相关的列“sex”的值,如下所示: 我试着用 但不幸的是,它不起作用。 任何帮助或建议将不胜感激,提前感谢!
传递参数 链接管道 我们可以将多个管道连接在一起,以便在一个表达式中使用多个管道。
即。在货币管道上完成一些额外的格式化。为此,我想在自定义管道的组件代码中使用现有管道。
我想在另一个函数中使用函数,但我不知道如何将参数传递给这个函数。 有人能提供一个可行的例子吗?
我正在使用ARM模板为我的Azure资源创建CI/CD管道。在我的Arm模板中,我使用zipdeploy来部署我的azure函数的代码。 基本上,我需要指定包Uri,它需要通过互联网访问。 在我的 Azure 管道中,我正在创建函数的 zip 包,并使用 dotnet 发布发布到 Azure 管道项目,然后我获取 URL:https://dev.azure.com/ifolor/_apis/res