×

可缩放整体线性回归。 (英文) Zbl 1525.62031号

摘要:我们提出了一种新的可扩展的整体线性回归算法,该算法基于D.伯西马斯A.金【运营决议64,第1号,第2-16号(2016年;Zbl 1338.90272号)]. 具体来说,我们开发了新的理论,将重要性和多重共线性建模为惰性约束,而不是反复检查条件。与之前的框架中的低100秒相比,所得到的算法在10000秒内随样本数的增加而扩展。在真实数据集和合成数据集上的计算结果表明,与之前的算法相比,该算法在准确性、假检测率、计算时间和可扩展性方面有了很大提高。

MSC公司:

62J05型 线性回归;混合模型
90立方厘米 混合整数编程

软件:

UCI-毫升
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Bertsimas,D。;Copenhaver,M.S.,线性回归和矩阵回归中稳健化和正则化等价性的表征,欧洲J.Oper。Res.,270931-942(2018)·Zbl 1403.62040号
[2] Bertsimas,D。;King,A.,线性回归的算法方法,Oper。第64、1、2-16号决议(2016年)·Zbl 1338.90272号
[3] Carrizosaa,E。;Olivares-Nadal,A.V。;Ramñrez-Cobob,P.,通过收紧线性回归模型提高可解释性(2017年)
[4] 钟,S。;帕克,Y.W。;Cheong,T.,《综合多元线性回归子集选择和验证的数学规划方法》(2017),arXiv预印本arXiv:1712.04543
[5] D.Dua,C.Graff,UCI机器学习库,2017年。
[6] Eicker,F.,线性回归族最小二乘估计的渐近正态性和一致性,《数学年鉴》。Stat.,34,2,447-456(1963年)·Zbl 0111.34003号
[7] Hocking,R.R.,生物特征邀请论文。线性回归中变量的分析和选择,生物统计学,32,1,1-49(1976)·Zbl 0328.62042号
[8] Lazaridis,A.,关于条件数的注释:伪多重共线性和潜在多重共线性的情况,Qual。数量。,41, 1, 123-135 (2007)
[9] 曼斯菲尔德,E.R。;赫尔姆斯,B.P.,《检测多重共线性》,艾默尔。统计学。,36、3a、158-160(1982)
[10] O'brien,R.M.,关于方差通货膨胀因子经验法则的警告,Qual。数量。,第41页,第5673-690页(2007年)
[11] R.Tamura,K.Kobayashi,Y.Takano,R.Miyashiro,K.Nakata,T.Matsui,基于方差膨胀因子消除多重共线性的混合整数二次优化公式。在线优化,在线优化,2016年·Zbl 1421.90093号
[12] Tamura,R。;Kobayashi,K。;Y.Takano。;Miyashiro,R。;Nakata,K。;松井,T.,消除多重共线性的最佳子集选择,J.Oper。日本皇家学会,60,3,321-336(2017)·Zbl 1382.90068号
[13] Tibshirani,R.,《通过套索进行回归收缩和选择》,J.R.Stat.Soc.Ser。B统计方法。,58, 1, 267-288 (1996) ·Zbl 0850.62538号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。