当前位置: 首页 > 编程笔记 >

python统计函数库scipy.stats的用法解析

阎英朗
2023-03-14
本文向大家介绍python统计函数库scipy.stats的用法解析,包括了python统计函数库scipy.stats的用法解析的使用技巧和注意事项,需要的朋友参考一下

背景

总结统计工作中几个常用用法在python统计函数库scipy.stats的使用范例。

正态分布

以正态分布的常见需求为例了解scipy.stats的基本使用方法

1.生成服从指定分布的随机数

norm.rvs通过loc和scale参数可以指定随机变量的偏移和缩放参数,这里对应的是正态分布的期望和标准差。size得到随机数数组的形状参数。(也可以使用np.random.normal(loc=0.0, scale=1.0, size=None))

In [4]: import numpy as np
In [5]: import scipy.stats as st
In [6]: st.norm.rvs(loc = 0,scale = 0.1,size =10)
Out[6]:
array([ 0.12259875, 0.07001414, 0.11296181, -0.00630321, -0.04377487,
0.00474487, -0.00728678, 0.03860256, 0.06701367, 0.03797084])
In [7]:
In [9]: st.norm.rvs(loc = 3,scale = 10,size=(2,2))
Out[9]:
array([[-13.26078265, 0.88411923],
[ 5.14734849, 17.94093177]])
In [10]:

2.求概率密度函数指定点的函数值

stats.norm.pdf正态分布概率密度函数。

In [33]: st.norm.pdf(0,loc = 0,scale = 1)
Out[33]: 0.3989422804014327
In [34]: st.norm.pdf(np.arange(3),loc = 0,scale = 1)
Out[34]: array([ 0.39894228, 0.24197072, 0.05399097])
In [35]:

3.求累计分布函数指定点的函数值

stats.norm.cdf正态分布累计概率密度函数。

In [52]: st.norm.cdf(0,loc=3,scale=1)
Out[52]: 0.0013498980316300933
In [53]: st.norm.cdf(0,0,1)
Out[53]: 0.5
In [54]:

4.累计分布函数的逆函数

stats.norm.ppf正态分布的累计分布函数的逆函数,即下分位点。

In [59]: z05 = st.norm.ppf(0.05)
In [60]:
In [60]: z05
Out[60]: -1.6448536269514729
In [61]: st.norm.cdf(z05)
Out[61]: 0.049999999999999975
In [62]:

通用函数

stats连续型随机变量的公共方法:

名称 备注
rvs 产生服从指定分布的随机数
pdf 概率密度函数
cdf 累计分布函数
sf 残存函数(1-CDF)
ppf 分位点函数(CDF的逆)
isf 逆残存函数(sf的逆)
fit 对一组随机取样进行拟合,最大似然估计方法找出最适合取样数据的概率密度函数系数。

*离散分布的简单方法大多数与连续分布很类似,但是pdf被更换为密度函数pmf。

常见分布

可能用到的分布对照表

名称 含义
beta beta分布
f F分布
gamma gam分布
poisson 泊松分布
hypergeom 超几何分布
lognorm 对数正态分布
binom 二项分布
uniform 均匀分布
chi2 卡方分布
cauchy 柯西分布
laplace 拉普拉斯分布
rayleigh 瑞利分布
t 学生T分布
norm 正态分布
expon 指数分布

以上这篇python统计函数库scipy.stats的用法解析就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持呐喊教程

 类似资料:
  • 主要内容:百分比变化(pct_change),协方差(cov),相关系数(corr),排名(rank)Pandas 的本质是统计学原理在计算机领域的一种应用实现,通过编程的方式达到分析、描述数据的目的。而统计函数则是统计学中用于计算和分析数据的一种工具。在数据分析的过程中,使用统计函数有助于我们理解和分析数据。本节将学习几个常见的统计函数,比如百分比函数、协方差函数、相关系数等。 百分比变化(pct_change) Series 和 DatFrames 都可以使用 pct_change() 函数

  • 本文向大家介绍Python中统计函数运行耗时的方法,包括了Python中统计函数运行耗时的方法的使用技巧和注意事项,需要的朋友参考一下 本文实例讲述了Python中统计函数运行耗时的方法。分享给大家供大家参考。具体实现方法如下: 另一个更高级一点的版本是: 希望本文所述对大家的Python程序设计有所帮助。

  • 这些函数从给定数组中的元素沿指定轴返回最小值和最大值。 输出如下: 我们的数组是: [[3 7 5] [8 4 3] [2 4 9]] 调用 amin() 函数: [3 3 2] 再次调用 amin() 函数: [2 4 3] 调用 amax() 函数: 9 再次调用 amax() 函数: [8 7 9] numpy.ptp() numpy.ptp()函数返回沿轴的值的范围(最大值 - 最小值)。

  • NumPy 提供了很多统计函数,例如对数组求和、用于从数组中查找最小元素,最大元素,百分位标准差和方差等。 常用的统计函数如下: 函数 说明 sum 对数组中的全部或沿着轴向的元素求和。 mean、median 求数组的算术平均值、中位数 std、var 分别为标准差和方差 min、max 最小值和最大值 argmin、argmax 分别为最小和最大元素的索引 cumsum 所有元素的累计和 cu

  • 主要内容:numpy.amin() 和 numpy.amax(),numpy.ptp(),numpy.percentile(),numpy.median(),numpy.mean(),numpy.average(),方差np.var() ,标准差np.std()NumPy 提供了许多统计功能的函数,比如查找数组元素的最值、百分位数、方差以及标准差等。 numpy.amin() 和 numpy.amax() 这两个函数用于计算数组沿指定轴的最小值与最大值: amin() 沿指定的轴,查找数组中元素

  • 主要内容:正态连续随机变量,均匀分布,描述性统计所有的统计函数都位于子包中,并且可以使用函数获得这些函数的完整列表。随机变量列表也可以从子包的中获得。 该模块包含大量的概率分布以及不断增长的统计函数库。 每个单变量分布都有其自己的子类,如下表所述 - 编号 类 描述 1 用于子类化的通用连续随机变量类 2 用于子类化的通用离散随机变量类 3 生成由直方图给出的分布 正态连续随机变量 随机变量X可以取任何值的概率分布是连续的随机变量。 位置()关