分类变量具有多个类别,但是如果数据集很大且类别也很大,那么识别它们就会有些困难。因此,我们可以为分类变量提取唯一值,这将有助于我们轻松识别分类变量的类别。我们可以通过对R数据帧的每一列使用唯一的方法来做到这一点。
请看以下数据帧-
> x1<-rep(c("A","B","C","D"),each=5) > x2<-rep(c(5,10,15,20),times=c(2,8,6,4)) > x3<-rep(c("India","Russia","China","Indonesia","Iceland"),times=c(4,3,5,2,6)) > x4<-rep(c(letters[1:10]),times=2) > df<-data.frame(x1,x2,x3,x4) > df x1 x2 x3 x4 1 A 5 India a 2 A 5 India b 3 A 10 India c 4 A 10 India d 5 A 10 Russia e 6 B 10 Russia f 7 B 10 Russia g 8 B 10 China h 9 B 10 China i 10 B 10 China j 11 C 15 China a 12 C 15 China b 13 C 15 Indonesia c 14 C 15 Indonesia d 15 C 15 Iceland e 16 D 15 Iceland f 17 D 20 Iceland g 18 D 20 Iceland h 19 D 20 Iceland i 20 D 20 Iceland j
在列x1中找到唯一值-
> unique(df[c("x1")]) x1 1 A 6 B 11 C 16 D
在列x2中查找唯一值-
> unique(df[c("x2")]) x2 1 5 3 10 11 15 17 20
在列x3中查找唯一值-
> unique(df[c("x3")]) x3 1 India 5 Russia 8 China 13 Indonesia 15 Iceland
在列x4中查找唯一值-
> unique(df[c("x4")]) x4 1 a 2 b 3 c 4 d 5 e 6 f 7 g 8 h 9 i 10 j
本文向大家介绍如何在R数据帧的列中查找不为零的值数?,包括了如何在R数据帧的列中查找不为零的值数?的使用技巧和注意事项,需要的朋友参考一下 如果R数据帧具有数字列,则在少数或全部列中也可能存在零,并且我们可能有兴趣查找一列中非零值的数量。这将帮助我们根据非零值上的数字比较列,这可以通过使用colSums来完成。 示例 请看以下数据帧- 输出结果 查找每列中不为零的值的数量- 示例 输出结果 让我们
本文向大家介绍如何找到R数据帧的列值之和?,包括了如何找到R数据帧的列值之和?的使用技巧和注意事项,需要的朋友参考一下 R数据框包含可能代表相似类型变量的列;因此,我们可能希望找到每个列的值的总和,然后基于该总和进行比较。这可以借助sum函数来完成,但是首先我们需要提取列以找到和。 示例 请看以下数据帧- 找出所有列的总和- 让我们再看一个例子-
本文向大家介绍如何基于R中的某些列查找唯一行?,包括了如何基于R中的某些列查找唯一行?的使用技巧和注意事项,需要的朋友参考一下 特别是当实验条件相同时,我们希望某些列的某些行值相同,这在设计实验以检查变量的固定效果时也有意做到。如果要确定唯一行,则可以通过使用R中的唯一函数来完成。 示例 请看以下数据帧- 让我们看另一个例子-
本文向大家介绍如何在R中制作数据帧列表?,包括了如何在R中制作数据帧列表?的使用技巧和注意事项,需要的朋友参考一下 这可以通过使用列表功能来完成。 示例 创建上述数据帧的列表-
下面有一段代码,它创建了数据框中每列中缺失值的汇总表。我希望我可以构建一个类似的表来计算唯一的值,但是DataFrame没有唯一的()方法,只有每一列是独立的。 (资料来源:https://stackoverflow.com/a/39734251/7044473) 如何为唯一值实现相同的功能?
第一次问问题(温柔点),因为我还没有找到任何有用的东西。 在R中,我有两个数据帧。一个(DataFrameA)有一列带有唯一日期列表。另一个(DataFrameB)也有日期列表。但是DataFrameB中的某些日期在DataFrameA中可能不存在。在这种情况下,我想将DataFrameB中的日期更新为DataFrameA中的最小日期,该日期大于DataFrameB中的日期。 在SQL中,我可能会