statsmodels

统计建模和计量经济学
授权协议 未知
开发语言 Python
所属分类 应用工具、 科研计算工具
软件类型 开源软件
地区 不详
投 递 者 金和雅
操作系统 跨平台
开源组织
适用人群 未知
 软件概览

statsmodels是一个包含统计模型、统计测试和统计数据挖掘python模块。对每一个模型都会生成一个对应的统计结果。统计结果会和现有的统计包进行对比来保证其正确性。

特点

  • 线性回归模型:
    • 普通最小二乘法
    • 广义最小二乘法
    • 加权最小二乘法
    • 具有自回归误差的最小二乘法
    • 分位数回归
    • 递归最小二乘法
  • 具有混合效应和方差成分的混合线性模型
  • GLM:支持所有一参数指数族分布的广义线性模型
  • 用于二项式和泊松的贝叶斯混合GLM
  • GEE:单向聚类或纵向数据的广义估计方程
  • 离散模型:
    • Logit和Probit
    • 多项式logit(MNLogit)
    • 泊松和广义泊松回归
    • 负二项式回归
    • 零充气计数模型
  • RLM:鲁棒的线性模型,支持多个M估计量。
  • 时间序列分析:时间序列分析模型
    • 完整的StateSpace建模框架
      • 季节性ARIMA和ARIMAX模型
      • VARMA和VARMAX模型
      • 动态因子模型
      • 未观察到的组件模型
    • 马尔可夫切换模型(MSAR),也称为隐马尔可夫模型(HMM)
    • 单变量时间序列分析:AR,ARIMA
    • 向量自回归模型,VAR和结构VAR
    • 矢量纠错模型,VECM
    • 指数平滑,Holt-Winters
    • 时间序列的假设检验:单位根,协整和其他
    • 用于时间序列分析的描述性统计数据和过程模型
  • 生存分析:
    • 比例风险回归(Cox模型)
    • 幸存者功能估计(Kaplan-Meier)
    • 累积入射函数估计
  • 多变量:
    • 缺少数据的主成分分析
    • 旋转因素分析
    • MANOVA
    • 典型相关
  • 非参数统计量:单变量和多变量内核密度估计量
  • 数据集:用于示例和测试的数据集
  • 统计:广泛的统计测试
    • 诊断和规格测试
    • 拟合优度和正态性检验
    • 多重测试功能
    • 各种其他统计检验
  • 使用MICE进行插补,阶数统计量回归和高斯插补
  • 调解分析
  • 图形包括用于视觉分析数据和模型结果的绘图功能
  • 输入输出
    • 用于读取Stata .dta文件的工具,但pandas具有较新的版本
    • 表输出到ascii,latex和html
  • 杂项模型
  • Sandbox:statsmodels包含一个沙箱文件夹,其中包含处于开发和测试各个阶段的代码,因此不被视为“生产就绪”。其中包括
    • 广义矩估计(GMM)估计器
    • 内核回归
    • scipy.stats.distributions的各种扩展
    • 面板数据模型
    • 信息理论测度
  • 1、关于 StatsModels statsmodels(http://www.statsmodels.org)是一个Python库,用于拟合多种统计模型,执行统计测试以及数据探索和可视化。 欢迎关注 Youcans 原创系列,每周更新数模笔记 Python数模笔记-PuLP库 Python数模笔记-StatsModels统计回归 Python数模笔记-Sklearn Python数模笔记-Net

  • statsmodels是一个Python模块,它提供对许多不同统计模型估计的类和函数,并且可以进行统计测试和统计数据的探索。 说实话,statsmodels这个词我总是记不住,但是国宝“熊猫”这个单词pandas我还是记得住的,因此每次我打开statsmodels的方式是: 百度搜索pandas,然后进入pandas官网 点击里面的documentation进入对应标签页面 选择下方pandas

  • 1 介绍 主要的 statsmodels API 分为以下模块: statsmodels.api: 横截面模型和方法。 statsmodels.tsa.api: 时间序列模型和方法。 statsmodels.formula.api: 使用公式字符串和 DataFrame 指定模型的便捷接口。 2 statsmodels.api 2.1 回归 类 描述 OLS(endog[, exog, missi

  • 写在前面,这是一篇单变量时间序列分析学习笔记,参考了很多大佬的文章,东拼西凑才勉强吧时间序列分析理清。在下数据分析萌新一名,有错误的地方欢迎指正,侵删 一、稳定性检验 当一个序列的均值与标准差不随时间变化,则称该序列是一个平稳序列。 ARMA、AR、MA等模型只能用于预测平稳序列,因此需要对序列进行平稳性检验 1、绘图法 如下图a为平稳序列,图b为非平稳序列 [外链图片转存失败,源站可能有防盗链机

  • 三.时间序列研究(Time-Series Study) (1)导入: #通常导入为tsa: import statsmodels.tsa.api as tsa #注意: ①这类接口推荐用于交互式使用 ②这些类/函数实际上是定义在其他地方的,sm只是提供了1个接口 (2)统计与测试(Statistics and Tests): 求"自相关函数"(Autocorrelation Function):

  • 官方文档:https://www.statsmodels.org/stable/user-guide.html \quad https://www.statsmodels.org/stable/api.html 一.概述 1.简介 (1)简介: 参见:https://zhuanlan.zhihu.com/p/91384305 statsmodels是1个Python统计分析模块,源于斯坦福大学统计

  • 包? 你可以使用pip或conda来下载statsmodels包。你可以在命令行中输入“pip install statsmodels”或“conda install statsmodels”来完成安装。

  • 成功解决Not Implemented Error: statsmodels.tsa.arima_model. ARMA and statsmodels.tsa.arima_model. ARIMA have been removed in favor of statsmodels.tsa.arima.model.ARIMA (note the . between arima and model)

  •  statsmodels 安装报错,使用 whl 包也无法安装 error: subprocess-exited-with-error Getting requirements to build wheel did not run successfully. exit code: 1 ...... ...... ..

 相关资料
  • 11.5 计算经济学 计算经济学(computational economics)是计算机科学与经济和管理科学相结合而形成 的交叉学科,其主要研究领域包括经济系统的计算模型、计算计量经济学、计算金融学等, 目的是利用计算技术和数值方法来解决传统方法无法解决的问题。这里,我们特别考虑建模 问题,简单介绍基于代理的计算经济学。 基于代理的(agent-based)模型是用于模拟自治个体的行为和相互作用

  • 统计量 设$$X_1$$,$$X_2$$,...,$$X_n$$是来自总体$$X$$(随机变量)的一个样本,它们相互独立,$$g(X_1,X_2,...,X_n)$$是$$X_1$$,$$X_2$$,...,$$X_n$$的函数,若$$g$$中不含未知参数,则称$$g(X_1,X_2,...,X_n)$$是一统计量。 因为$$X_1$$,$$X_2$$,...,$$X_n$$都是随机变量,而统计量

  • 基本统计 基本统计包含昨日消耗流量、昨日卡均流量、近7日卡均流量、本月已用总流量。 流量池统计 以可视化的图形形态,清晰直观的展示当前流量池的使用情况。多个流量池会依次显示。 流量最值情况 显示昨日流量使用最多、流量使用最少的情况。可以初步判定昨日用量是否有卡异常使用。并且可以针对异常的卡查看详情,详细排查问题,观测最近几天是否均出现异常情况。 流量使用情况 查询当前所有卡的流量消耗曲线、每日卡均

  • 可以统计当前客户所有号码情况,并且包含不同生命周期状态的卡数量及开机、停机、销户的数量及比例。 (总号码数=测试期号码数+沉默期号码数+计费期号码数) (计费期号码数=开机号码数+停机号码数+销户号码数) 另外可以统计昨日新增/7日新增/30日新增,昨日流失/7日流失/30日流失数量、曲线图及详细表。

  • 观众量统计 1、 获取用户维度下按小时统计的观众量,该接口仅提供某一天的数据查询。地址为: a https://spark.bokecc.com/api/stats/uniquevisitor/user/hourly 需要传递以下参数: 参数 说明 userid 用户id,不可为空 date 查询日期,日期不能大于今日,格式为yyyy-MM-dd,不可为空 返回数据unique_visitors包

  • 1、 获取用户维度下按小时统计的播放量,该接口仅提供某一天的数据查询。地址为: a: https://spark.bokecc.com/api/stats/playcount/user/hourly 需要传递以下参数: 参数 说明 userid 用户id,不可为空 date 查询日期,日期不能大于今日,格式为yyyy-MM-dd,不可为空 返回数据play_counts包含如下字段: 字段名 说明

  • 济南中职教资下午场面试题目,包含结构化题目、试讲题目、答辩题目。结构化题目中有两个问题都是针对老师方面的,试讲题目有一个问题是设计的方面,答辩题目有一个问题。围绕着设计专业和教师共同两个方面进行的提问。 结构化题目: 1.作为一名年轻教师,很多同学和家长不认可你的教学方式,你该怎么办? 2.如何在课堂上发挥学生的主体作用? 试讲题目: 平面设计的构成元素都有哪些?列举说明并说一下各个元素的作用 答

  • 在Spark dataframe列中获取最大值的最佳方法 这篇文章展示了如何在表上运行聚合(distinct、min、max),如下所示: null