statsmodels公司是一个Python模块,为估算提供类和函数许多不同的统计模型,以及用于进行统计测试和统计数据探索。每个估计器都有一个广泛的结果统计列表。将根据现有的统计数据包对结果进行测试,以确保其正确性。这个软件包是根据开源的Modified BSD(3条款)许可证发布的。在线文档位于statsmodels.org网站.
介绍
statsmodels公司
支持使用R样式公式和熊猫
数据帧。下面是一个使用普通最小二乘法的简单示例:
在[1]中:进口 笨蛋 作为 净现值
在[2]中:进口 statsmodels.api公司 作为 平方米
在[3]中:进口 statsmodels.formula.api 作为 表面粗糙度
#加载数据
在[4]中:日期 = 平方米.数据集.获取数据集(“盖里”, “历史数据”).数据
#拟合回归模型(使用其中一个回归因子的自然对数)
在[5]中:结果 = 表面粗糙度.ols公司('彩票~识字+np.log(Pop1831)', 数据=日期).适合()
#检查结果
在[6]中:打印(结果.总结())
OLS回归结果
==============================================================================
折旧变量:彩票R平方:0.348
型号:OLS Adj.R平方:0.333
方法:最小二乘F-统计量:22.20
日期:2023年12月14日星期四问题(F统计):2008年9月19日
时间:14:55:34对数似然:-379.82
观察次数:86 AIC:765.6
Df残差:83 BIC:773.0
Df型号:2
协方差类型:非稳健
===================================================================================
标准误差系数P>|t|[0.025 0.975]
-----------------------------------------------------------------------------------
拦截 246.4341 35.233 6.995 0 176.358 316.510
读写能力 -0.4889 0.128 -3.832 0 -0.743 -0.235
净现值.日志(波普1831) -31.3114 5.977 -5.239 0 -43.199 -19.424
==============================================================================
综合总线:3.713杜宾-沃森:2.019探针(综合总线): 0.156 贾克-贝拉 (接线盒): 3.394
倾斜:-0.487探针(JB):0.183峭度:3.003条件。702号。==============================================================================
笔记:[1] 标准 错误 假定 那个 这个 协方差 矩阵 属于 这个 错误 是 正确地 明确规定.
您还可以使用笨蛋
数组而不是公式:
在[7]中:进口 笨蛋 作为 净现值
在[8]中:进口 statsmodels.api公司 作为 平方米
#生成人工数据(2个回归变量+常量)
在[9]中:诺贝尔奖 = 100
在[10]中:X(X) = 净现值.随机的,随机的.随机的,随机的((诺贝尔奖, 2))
在[11]中:X(X) = 平方米.添加常量(X(X))
在[12]中:贝塔 = [1, .1, .5]
在[13]中:e(电子) = 净现值.随机的,随机的.随机的,随机的(诺贝尔奖)
在[14]中:年 = 净现值.点(X(X), 贝塔) + e(电子)
#拟合回归模型
在[15]中:结果 = 平方米.OLS公司(年, X(X)).适合()
#检查结果
在[16]中:打印(结果.总结())
OLS回归结果
==============================================================================
部门变量:y R平方:0.247
型号:OLS Adj.R平方:0.231
方法:最小二乘F-统计量:15.90
日期:2023年12月14日星期四Prob(F-statistic):1.07e-06
时间:14:55:34对数似然:-18.185
观察次数:100 AIC:42.37
Df残差:97 BIC:50.18
Df型号:2
协方差类型:非稳健
==============================================================================
标准误差系数P>|t|[0.025 0.975]
------------------------------------------------------------------------------
常数 1.5135 0.073 20.685 0 1.368 1.659
x1个 0.1958 0.102 1.925 0.057 -0.006 0.398
2个 0.4922 0.104 4.740 0 0.286 0.698
==============================================================================
综合总线:23.831杜宾-沃森:1.951探针(综合总线): 0 贾克-贝拉 (接线盒): 6.295
倾斜:-0.262探头(JB):0.0430峭度:1.888条件。编号4.95==============================================================================
笔记:[1] 标准 错误 假定 那个 这个 协方差 矩阵 属于 这个 错误 是 正确地 明确规定.
看看吧dir(结果)查看可用结果。属性在中进行了描述结果__文件__和results方法有自己的文档字符串。
引用
请使用以下引文引用科学出版物中的统计模型:
Seabold、Skipper和Josef Perktold。“statsmodels:计量经济学和统计建模蟒蛇。”诉讼第九届Python科学大会。2010
Bibtex条目:
@正在进行中{seabold2010statsmodels公司,
标题={statsmodels公司: 计量经济学 和 统计的 建模 具有 蟒蛇},
作者={希伯尔德, 跳跃者 和 珀克托尔德, 约瑟夫},
书名={9第个 蟒蛇 在里面 科学类 会议},
年={2010},
}
索引
索引
模块索引
上次更新时间:2023年12月14日