问题：

使用case_when与dplyr跨接

郑安晏

2023-03-14

简单地说，我需要将一系列列中的值与一个“基线”列进行比较。当列中的值高于基线时，我需要使用基线值。当列中的值低于或等于基线时，我需要保留该值。下面是一个示例数据集（我的实际数据集要大得多）：

test <- structure(list(baseline = c(5, 7, 8, 4, 9, 1, 0, 46, 47), bob = c(7, 
11, 34, 9, 6, 8, 3, 49, 12), sally = c(3, 5, 2, 2, 6, 1, 3, 4, 
56), rita = c(6, 4, 6, 7, 6, 0, 3, 11, 3)), class = c("spec_tbl_df", 
"tbl_df", "tbl", "data.frame"), row.names = c(NA, -9L), spec = structure(list(
    cols = list(baseline = structure(list(), class = c("collector_double", 
    "collector")), bob = structure(list(), class = c("collector_double", 
    "collector")), sally = structure(list(), class = c("collector_double", 
    "collector")), rita = structure(list(), class = c("collector_double", 
    "collector"))), default = structure(list(), class = c("collector_guess", 
    "collector")), skip = 1), class = "col_spec"))

我当前的代码使用mutate_at()并且运行良好：

trial1 <- test %>% 
  mutate_at(
    vars('bob','sally', 'rita'),
    funs(case_when(
      . > baseline ~ baseline, 
      . <= baseline ~ .)))

但是当我试图更新它以反映DPLYR1.0中的跨（）时，我总是得到一个错误。以下是我的尝试：

trial2 <- test %>% 
  mutate(across(c(bob, sally, rita), 
                case_when(. > baseline ~ baseline, 
                          . <= baseline ~ .)))

你知道我做错了什么吗？case_when()是否适用于交叉？

共有1个答案

解修然

2023-03-14

我们可以使用~指定匿名函数/lambda函数调用

library(dplyr)
test %>% 
   mutate(across(c(bob, sally, rita), 
             ~ case_when(. > baseline ~ baseline, 
                       . <= baseline ~ .)))

-输出

# A tibble: 9 x 4
#  baseline   bob sally  rita
#     <dbl> <dbl> <dbl> <dbl>
#1        5     5     3     5
#2        7     7     5     4
#3        8     8     2     6
#4        4     4     2     4
#5        9     6     6     6
#6        1     1     1     0
#7        0     0     0     0
#8       46    46     4    11
#9       47    12    47     3

或使用.funs参数

test %>% 
        mutate(across(c(bob, sally, rita), 
                  .funs = case_when(. > baseline ~ baseline, 
                            . <= baseline ~ .)))

函数/lambda列表，例如list（mean=mean,n_miss=~sum(is.na(.x))

另外，我们可以使用case_when代替pmin

test %>% 
    mutate(across(c(bob, sally, rita), ~ pmin(baseline, .)))

-输出

# A tibble: 9 x 4
#  baseline   bob sally  rita
#     <dbl> <dbl> <dbl> <dbl>
#1        5     5     3     5
#2        7     7     5     4
#3        8     8     2     6
#4        4     4     2     4
#5        9     6     6     6
#6        1     1     1     0
#7        0     0     0     0
#8       46    46     4    11
#9       47    12    47     3

类似资料：

使用case_when内部跨突变

我有这样的调查数据。唯一的回答是“na”或“yes”。我不得不对数据应用以下逻辑： null null 任何建议都非常感谢！我想我可能得用一个循环，但我不知道怎么用。如果我转换为数值并将所有4列求和，我可以使用类似…？
避免与DPLYR::CASE_WHEN发生类型冲突

我试图在中使用来创建一个新变量，在这个变量中，我将一些值设置为missing并同时重新编码其他值。但是，如果尝试将值设置为，则会出现一个错误，说明我们无法创建变量，因为是逻辑的： mutate_impl(.data,dots）中出错: 计算错误：类型必须是double,不是逻辑。在数据帧的非逻辑向量中，是否有方法使用此设置值？
跨列使用case_when创建新列

我有一个很大的数据集，其中有许多带有状态的列。我想做一个新的专栏，有参与者的当前状态。我试图在dplyr中使用case_when，但我不确定如何跨列。数据集的列太多，我无法键入每一列。以下是数据示例：对于代码，我想要一个新的列，列中说明参与者的最终状态；然而，如果他们的状态曾经是完成的，那么我希望它说完成，不管他们的最终状态是什么。对于该数据，答案如下所示：还有，如果你能包括对你的代码的任何解
dplyr R中具有多种条件的case_when

我有数据。看起来像这样的框架首先，我想根据Day aka group_by（Day）对数据帧进行分组。当在每个组中，每种类型（tr1，tr2）的和（平均sd）大于控制（ctrl）的差（平均sd），然后我想在新列（new.col）中指定值~是，如果不是，我想指定值~否。例如，我希望我的数据看起来像这样。它不一定要看起来像这样
使用dplyr跨多个列进行变异

我试图计算许多列的行平均值。有人能解释一下为什么下面的代码只计算代码中两个变量（var_1和var_13）的平均值，而不是所有13列的平均值吗？
在mutate_at内使用case_when

我想在中使用，如以下示例所示：使用调用中的code>也不起作用。可以替换为第二个call，为简洁起见，我没有将其包括在内。

使用case_when与dplyr跨接

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档