当前位置: 首页 > 文档资料 > Python 数据科学 >

Python P-Value

优质
小牛编辑
124浏览
2023-12-01

p值大约是假设的强度。 我们基于一些统计模型建立假设,并使用p值比较模型的有效性。 获得p值的一种方法是使用T检验。

这是对零假设的双边检验,即独立观察样本'a'的预期值(平均值)等于给定的总体平均值, popmean 。 让我们考虑以下示例。

from scipy import stats
rvs = stats.norm.rvs(loc = 5, scale = 10, size = (50,2))
print stats.ttest_1samp(rvs,5.0)

上述程序将生成以下输出。

Ttest_1sampResult(statistic = array([-1.40184894, 2.70158009]),
pvalue = array([ 0.16726344, 0.00945234]))

比较两个样本

在以下示例中,有两个样本,可以来自相同或不同的分布,我们想测试这些样本是否具有相同的统计属性。

ttest_ind - 计算两个独立分数样本均值的T检验。 这是零假设的双侧检验,即两个独立样本具有相同的平均(预期)值。 该测试假设群体默认具有相同的方差。

如果我们观察来自相同或不同群体的两个独立样本,我们可以使用该测试。 让我们考虑以下示例。

from scipy import stats
rvs1 = stats.norm.rvs(loc = 5,scale = 10,size = 500)
rvs2 = stats.norm.rvs(loc = 5,scale = 10,size = 500)
print stats.ttest_ind(rvs1,rvs2)

上述程序将生成以下输出。

Ttest_indResult(statistic = -0.67406312233650278, pvalue = 0.50042727502272966)

您可以使用相同长度的新数组进行相同的测试,但具有不同的平均值。 在loc使用不同的值并测试相同的值。