当前位置: 首页 > 编程笔记 >

如何使用shapiro wilk检验来检查R数据帧列的正常性?

程祺
2023-03-14
本文向大家介绍如何使用shapiro wilk检验来检查R数据帧列的正常性?,包括了如何使用shapiro wilk检验来检查R数据帧列的正常性?的使用技巧和注意事项,需要的朋友参考一下

要将shapiro wilk测试应用于向量的正态性,我们只需在shapiro.test函数内部简单地命名向量即可,但是如果我们想对R数据帧列执行相同的操作,则该列将必须以适当的方式指定该列。例如,如果数据框名称为df且列名称为x,则该html" target="_blank">函数将作为shapiro.test(df $x)使用。

示例

x1<-rnorm(1000,1.5)
df1<-data.frame(x1)
shapiro.test(df1$x1)

输出结果

   Shapiro-Wilk normality test
data: df1$x1
W = 0.99886, p-value = 0.792

示例

x2<-runif(1000,2,10)
df2<-data.frame(x2)
shapiro.test(df2$x2)

输出结果

   Shapiro-Wilk normality test
data: df2$x2
W = 0.9581, p-value = 2.562e-16

示例

x3<-rpois(4000,2)
df3<-data.frame(x3)
shapiro.test(df3$x3)

输出结果

   Shapiro-Wilk normality test
data: df3$x3
W = 0.91894, p-value < 2.2e-16

示例

x4<-rpois(4000,5)
df4<-data.frame(x4)
shapiro.test(df4$x4)

输出结果

   Shapiro-Wilk normality test
data: df4$x4
W = 0.97092, p-value < 2.2e-16

示例

x5<-sample(1:5,5000,replace=TRUE)
df5<-data.frame(x5)
shapiro.test(df5$x5)

输出结果

   Shapiro-Wilk normality test
data: df5$x5
W = 0.88902, p-value < 2.2e-16

示例

x6<-sample(1:10,5000,replace=TRUE)
df6<-data.frame(x6)
shapiro.test(df6$x6)

输出结果

   Shapiro-Wilk normality test
data: df6$x6
W = 0.93373, p-value < 2.2e-16

示例

x7<-sample(1:100,5000,replace=TRUE)
df7<-data.frame(x7)
shapiro.test(df7$x7)

输出结果

   Shapiro-Wilk normality test
data: df7$x7
W = 0.9556, p-value < 2.2e-16

示例

x8<-sample(2500:3500,5000,replace=TRUE)
df8<-data.frame(x8)
shapiro.test(df8$x8)

输出结果

   Shapiro-Wilk normality test
data: df8$x8
W = 0.95117, p-value < 2.2e-16

示例

x9<-rbinom(5000,10,0.5)
df9<-data.frame(x9)
hapiro.test(df9$x9)

输出结果

   Shapiro-Wilk normality test
data: df9$x9
W = 0.96629, p-value < 2.2e-16

示例

x10<-rbinom(5000,1000,0.5)
df10<-data.frame(x10)
shapiro.test(df10$x10)

输出结果

   Shapiro-Wilk normality test
data: df10$x10
W = 0.9993, p-value = 0.04748
 类似资料:
  • 本文向大家介绍R检查丢失的数据,包括了R检查丢失的数据的使用技巧和注意事项,需要的朋友参考一下 示例 anyNA报告是否存在任何缺失值;而按is.na元素报告缺失值: ìs.na返回在算术运算(FALSE = 0,TRUE = 1)下被强制为整数值的逻辑向量。我们可以使用它来找出有多少个缺失值: 扩展这种方法,我们可以在数据帧上使用colSums和is.na来计算每列的NA: naniar软件包(

  • 如何检查数据帧是否为空?在我的例子中,如果为空,我想在终端中打印一些消息。

  • 我试图在R中合并2个数据帧,但我有两个不同的列,带有不同类型的ID变量。有时一行会有其中一列的值,而另一列却没有。我想同时考虑它们,这样,如果一个帧缺少一个列的值,那么将使用另一个列。 我想合并这两个数据帧,得到2行: null 编辑:理想情况下,输出如下所示: 第1行匹配,因为列“first”在两个数据帧中具有相同的值,并且它填充了来自DF2的“second”的值 第2行匹配,因为列“secon

  • 本文向大家介绍如何在R数据帧的列中查找唯一值?,包括了如何在R数据帧的列中查找唯一值?的使用技巧和注意事项,需要的朋友参考一下 分类变量具有多个类别,但是如果数据集很大且类别也很大,那么识别它们就会有些困难。因此,我们可以为分类变量提取唯一值,这将有助于我们轻松识别分类变量的类别。我们可以通过对R数据帧的每一列使用唯一的方法来做到这一点。 示例 请看以下数据帧- 在列x1中找到唯一值- 在列x2中

  • 本文向大家介绍如何在R数据帧的列中查找不为零的值数?,包括了如何在R数据帧的列中查找不为零的值数?的使用技巧和注意事项,需要的朋友参考一下 如果R数据帧具有数字列,则在少数或全部列中也可能存在零,并且我们可能有兴趣查找一列中非零值的数量。这将帮助我们根据非零值上的数字比较列,这可以通过使用colSums来完成。 示例 请看以下数据帧- 输出结果 查找每列中不为零的值的数量- 示例 输出结果 让我们

  • 问题内容: 我有一个脚本,可以从SQL数据库获取XML文件。这是我的操作方法: 但是,解析不适用于特定的数据库行,尽管当我将该字段的内容复制到单独的文件中并从文件中进行解析时,解析仍然有效。经过两天的“反复试验”,我确定了主要问题。似乎以这种方式查询短的XML文件不会引起任何问题,但是当我查询较大的文件时,该字符串在65534个字符后被砍掉。因此,XML文件的末尾丢失了,并且该文件无法解析。 我认