使用R，如何过滤一列以保持另一列中包含的项？

史英睿

2023-03-14

我有一个这样的数据帧

columna <- c(1,2,3)
columnb <- c("a b e", "c d", "a c d")
columnc <- as.Date(c('2010-11-1','2008-3-25','2007-3-14'))
alldata <- data.frame(columna,columnb,columnc)
tokeep <- c("c", "e")

我想得到相同的所有数据，修改为只保留在tokeep中的字符串。

理想情况下，我希望将

[ "e", "c", "c" ]

我第一次想我可以用这样的东西

filter(alldata, alldata$columnb %in% tokeep)
alldata[which(alldata$b %in% tokeep), ]

但我无法找到解决方案。

有人能指导我吗？

共有2个答案

雍马鲁

2023-03-14

另一个选项是str_extract

library(stringr)
alldata$columnb <- str_extract(alldata$columnb, paste(tokeep, collapse="|"))
alldata$columnb
[#1] "e" "c" "c"

饶元章

2023-03-14

我们可以尝试使用gsub用空字符串替换我们不想要的字符

alldata$columnb<- gsub(paste0("[^",paste0(tokeep,collapse = "|"),"]"),"", alldata$columnb)

alldata
#  columna columnb    columnc
#1       1       e 2010-11-01
#2       2       c 2008-03-25
#3       3       c 2007-03-14

我们正在创建的正则表达式是

paste0("[^",paste0(tokeep, collapse = "|"), "]")

#[1] "[^c|e]"

这意味着除了c或e之外的任何内容。

编辑

根据Wiktor的评论，我们可能需要正则表达式作为

paste0("[^",paste0(tokeep,collapse = ""),"]")
#[1] "[^ce]"

类似资料：

Pandas，过滤其中哪一列包含另一列的行

问题内容：如何过滤包含另一列的行？例如，如果我们有两列A，B的DT，是否可以使用B.contains（A）过滤行？不仅B是否包含来自DT的所有A中的一些A值，而且还只是一行。问题答案：您可以使用由和（如果需要）过滤器列和每行创建的掩码：解决方案的差异 -输入已更改：
如何测试一个列表是否包含另一个列表？

问题内容：如何测试一个列表是否包含另一个列表（即它是一个连续的子序列）。假设有一个名为contains的函数：编辑：问题答案：这是我的版本：正如安德鲁·贾菲（Andrew Jaffe）在他的评论中指出的那样，它返回一个元组（start，end + 1），因为我认为这更像pythonic。它不对任何子列表进行切片，因此应该相当有效。新手感兴趣的一点是，它使用了for语句上的else子句-
如何通过在另一列 r 中使用多个变量来改变新列

嗨，我想通过使用mutate函数来创建一个新变量Foldchange。但是我想使用来自同一列的值来计算这个值。有没有什么方法可以计算一个新变量，从同一列中折叠更改，而无需重新排列表格，这样表格就不需要拆分了？下面是一个清晰的例子: 我想要的输出类似于使用：获取显然，我不能使用此代码基于V1和V2变量进行选择，但这只是为了说明。我希望通过这种方式，我可以保持我的附加表的完整性，折叠更改将具有重
如何查找另一个列表中是否包含一个列表/集

问题内容：我有一个产品ID列表，我想找出哪些订单包含所有这些产品。订单表的结构如下：显然，我可以使用PHP中的一些循环来做到这一点，但是我想知道是否有一种优雅的方法可以完全在mysql中完成。我理想的幻想查询将是这样的：有希望还是我应该去阅读托尔金？:)另外，出于好奇，如果不能在mysql中使用，是否还有其他具有此功能的数据库？问题答案：你很亲密关于关系代数中的“出于好奇”问题，这可以
列表包含另一个列表java ee

我在数据库中有一个包含（id、日期、类别、行、持续时间）的表，我每天都有许多注册表，例如（1，12/12/2014，cat1，ligne1，12）（2，12/2014，cat2，ligne1，10）（3，12/12/2014，cat3，ligne2，23）（4,13/12/2014，cat1，LINGE1，10）（5,13/12/2014，cat2，LINGE1，20）（6,13/12/2014
如何通过另一个计算列使用一个计算列

问题内容：我在Sqlite中有一个查询，其中涉及复杂的列计算，可以这样说：我想将此计算选择为，但我还需要将其用作另一种计算的组成部分：不幸的是，这会产生错误：我知道我可以简单地重复计算：但是，假设操作复杂且昂贵，是否有什么方法可以在以后重新引用它而不必重新计算呢？问题答案：您需要使用子查询。结果

使用R，如何过滤一列以保持另一列中包含的项？

共有2个答案

相关问答

相关文章

相关阅读

相关工具

相关文档