这是一篇学习笔记。
由于t检验的前提假设是总体服从正态分布,因此在进行t检验之前要先进行正态性检验,观察我们用于t检验的样本是否服从正态分布。
画图法
1.画直方图,观察形状是否为倒钟形,若为倒钟形那便是接近正态分布的
hist(data$col1)
2.画QQ图,观察形状是否是一条连接主对角线的线,若是,那便是接近正态分布的
qqnorm(data$col1)
3.shapiro.test
这种检验方式适合于样本量比较小(N<20)的时候使用
result<-shapiro.test(data$col1)
if(result$p.value<0.05){
print("在置信度95%的情况下拒接原假设,数据不符合正态分布")
}
t.test()
参数 | 释义 |
---|---|
x | 唯一的必选参数,一个数值型非空向量,若为单样本检验,那么这里就是那个样本;若为双样本检验,这里就是样本之一 |
y | 可选参数,单样本检验时可以为空,双样本检验时是样本之一 |
alternative | "two.sided"双侧检验,“greater”和“less”都是单侧检验,“greater”是右侧,“less”是左侧 |
mu | 单样本检验的时候是样本均值,双样本检验的时候是样本均值之差,默认值=0 |
spaired | 是否为配对t检验,TRUE为配对t检验 |
var.equal | 是否将两个样本的方差视为相等,一般来说如果不能很确定会相等,这里就设置为FALSE,默认值为FALSE |
conf.level | 置信度,e.g. 0.95 |
当我们在双样本检验时懒得把两个样本的数据分离出来,而只是把他们放在同一个datafarme中使用一个flag字段进行区分时,我们可以使用t.test()中的formula参数进行t检验。
result<-with(data,t.test(formula=col1~flag,conf.level=0.95,...))