statsmodels公司

statsmodels公司是一个Python模块,为估算提供类和函数许多不同的统计模型,以及用于进行统计测试和统计数据探索。每个估计器都有一个广泛的结果统计列表。将根据现有的统计数据包对结果进行测试,以确保其正确性。这个软件包是根据开源的Modified BSD(3条款)许可证发布的。在线文档位于statsmodels.org网站.

介绍

statsmodels公司支持使用R样式公式和熊猫数据帧。下面是一个使用普通最小二乘法的简单示例:

在[1]中:进口 笨蛋 作为 净现值

在[2]中:进口 statsmodels.api公司 作为 平方米

在[3]中:进口 statsmodels.formula.api 作为 表面粗糙度

#加载数据
在[4]中:日期 = 平方米.数据集.获取数据集(“盖里”, “历史数据”).数据

#拟合回归模型(使用其中一个回归因子的自然对数)
在[5]中:结果 = 表面粗糙度.ols公司('彩票~识字+np.log(Pop1831)', 数据=日期).适合()

#检查结果
在[6]中:打印(结果.总结())
OLS回归结果
==============================================================================
折旧变量:彩票R平方:0.348
型号:OLS Adj.R平方:0.333
方法:最小二乘F-统计量:22.20
日期:2023年12月14日星期四问题(F统计):2008年9月19日
时间:14:55:34对数似然:-379.82
观察次数:86 AIC:765.6
Df残差:83 BIC:773.0
Df型号:2
协方差类型:非稳健
===================================================================================
标准误差系数P>|t|[0.025 0.975]
-----------------------------------------------------------------------------------
拦截         246.4341     35.233      6.995      0     176.358     316.510
读写能力           -0.4889      0.128     -3.832      0      -0.743      -0.235
净现值.日志(波普1831)   -31.3114      5.977     -5.239      0     -43.199     -19.424
==============================================================================
综合总线:3.713杜宾-沃森:2.019探针(综合总线):                  0.156   贾克-贝拉 (接线盒):                3.394
倾斜:-0.487探针(JB):0.183峭度:3.003条件。702号。==============================================================================

笔记:[1] 标准 错误 假定 那个 这个 协方差 矩阵 属于 这个 错误  正确地 明确规定.

您还可以使用笨蛋数组而不是公式:

在[7]中:进口 笨蛋 作为 净现值

在[8]中:进口 statsmodels.api公司 作为 平方米

#生成人工数据(2个回归变量+常量)
在[9]中:诺贝尔奖 = 100

在[10]中:X(X) = 净现值.随机的,随机的.随机的,随机的((诺贝尔奖, 2))

在[11]中:X(X) = 平方米.添加常量(X(X))

在[12]中:贝塔 = [1, .1, .5]

在[13]中:e(电子) = 净现值.随机的,随机的.随机的,随机的(诺贝尔奖)

在[14]中: = 净现值.(X(X), 贝塔) + e(电子)

#拟合回归模型
在[15]中:结果 = 平方米.OLS公司(, X(X)).适合()

#检查结果
在[16]中:打印(结果.总结())
OLS回归结果
==============================================================================
部门变量:y R平方:0.247
型号:OLS Adj.R平方:0.231
方法:最小二乘F-统计量:15.90
日期:2023年12月14日星期四Prob(F-statistic):1.07e-06
时间:14:55:34对数似然:-18.185
观察次数:100 AIC:42.37
Df残差:97 BIC:50.18
Df型号:2
协方差类型:非稳健
==============================================================================
标准误差系数P>|t|[0.025 0.975]
------------------------------------------------------------------------------
常数          1.5135      0.073     20.685      0       1.368       1.659
x1个             0.1958      0.102      1.925      0.057      -0.006       0.398
2个             0.4922      0.104      4.740      0       0.286       0.698
==============================================================================
综合总线:23.831杜宾-沃森:1.951探针(综合总线):                  0   贾克-贝拉 (接线盒):                6.295
倾斜:-0.262探头(JB):0.0430峭度:1.888条件。编号4.95==============================================================================

笔记:[1] 标准 错误 假定 那个 这个 协方差 矩阵 属于 这个 错误  正确地 明确规定.

看看吧dir(结果)查看可用结果。属性在中进行了描述结果__文件__和results方法有自己的文档字符串。

引用

请使用以下引文引用科学出版物中的统计模型:

Seabold、Skipper和Josef Perktold。statsmodels:计量经济学和统计建模蟒蛇。诉讼第九届Python科学大会。2010

Bibtex条目:

@正在进行中{seabold2010statsmodels公司,
  标题={statsmodels公司: 计量经济学  统计的 建模 具有 蟒蛇},
  作者={希伯尔德, 跳跃者  珀克托尔德, 约瑟夫},
  书名={9第个 蟒蛇 在里面 科学类 会议},
  ={2010},
}

索引

索引

模块索引


上次更新时间:2023年12月14日