×

计算大规模问题最佳子集回归模型的有效算法。 (英语) 兹比尔1452.62497

总结:提出了几种计算最佳子集回归模型的策略。其中一些算法是现有回归树方法的修改版本,而其他算法是新的。第一种算法选择给定大小范围内的最佳子集模型。它使用的搜索空间较小,并且在计算上优于现有的分枝定界算法。详细讨论了该算法的特性和计算方面。第二种新算法对回归树中的变量进行预排序。定义半径是为了测量节点到树根的距离。该算法将预排序应用于距离小于给定半径的所有节点。采用了一种有效的变量预排序方法。实验结果表明,当预排序的半径为变量数的四分之一到三分之一时,该算法的性能最佳。该算法已应用于处理常规穷举选择方法认为在计算上不可行的大规模子选择问题。提出了一类新的启发式策略。其中最重要的是为每个子集模型大小指定不同的公差值。这种具有不同容差的策略等价于所有穷举和启发式子选择策略。此外,该策略可用于研究具有非连续尺寸范围的子模型。它的实现为处理大规模模型提供了一个灵活的工具。

MSC公司:

62J05型 线性回归;混合模型
62-08 统计学相关问题的计算方法
90C57型 多面体组合学,分支与绑定,分支与切割
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Breiman,L.,使用非负garrote进行更好的子集回归,技术计量学,37373-384(1995)·Zbl 0862.62059号
[2] Clarke,M.R.B.,《统计算法:算法AS 163:一种Givens算法,用于在不返回数据的情况下从一个线性模型移动到另一个线性模型》,J.Roy。统计师。Soc.序列号。C申请。统计人员。,30, 198-203 (1981)
[3] 范,J。;Li,R.,通过非冲突惩罚似然进行变量选择及其预言性质,J.Amer。统计师。协会,961348-1360(2001)·Zbl 1073.62547号
[4] Furnival,G。;Wilson,R.,《跨越式回归》,《技术计量学》,第16期,第499-511页(1974年)·Zbl 0294.62079号
[5] 加图,C。;Kontoghiorghes,E.J.,使用QR分解计算所有可能子集回归模型的并行算法,并行计算。,29, 505-521 (2003)
[6] 加图,C。;Kontoghiorghes,E.J.,导出子集VAR模型的有效策略,计算。管理。科学。,2, 253-278 (2005) ·兹比尔1089.62106
[7] 加图,C。;Kontoghiorghes,E.J.,计算最佳子集回归模型的分枝定界算法,J.Compute。图表。统计人员。,15, 139-156 (2006)
[8] Gatu,C.,Yanev,P.,Kontoghiorghes,E.J.,2007年。生成所有可能回归子模型的图形方法。计算。统计师。数据分析。出版时,doi:10.1016/j.csda.2007.02.018;Gatu,C.,Yanev,P.,Kontoghiorghes,E.J.,2007年。生成所有可能回归子模型的图形方法。计算。统计师。数据分析。出版中,doi:10.1016/j.csda.2007.02.018·Zbl 1452.62061号
[9] Golub,G.H。;Van Loan,C.F.,《矩阵计算》。约翰·霍普金斯数学科学研究(1996),约翰·霍普金森大学出版社:约翰·霍普金大学出版社,马萨诸塞州巴尔的摩·Zbl 0865.65009号
[10] 哈斯蒂,T。;Tibshirani,R。;Friedman,J.,《统计学习的要素》。Springer统计系列(2001),Springer:Springer纽约·Zbl 0973.62007号
[11] Hocking,R.R.,《线性回归中变量的分析和选择》,生物统计学,32,1-49(1976)·Zbl 0328.62042号
[12] 霍夫曼,M。;Kontoghiorghes,E.J.,管道给出了在EREW PRAM上计算QR分解的序列,并行计算。,32, 222-230 (2006)
[13] Kontoghiorghes,E.J.,《线性模型的并行算法:数值方法和估计问题》,《计算经济学进展》,第15卷(2000年),克鲁沃学术出版社:克鲁沃学术出版商波士顿·Zbl 0981.68176号
[14] A.J.Miller,2002年。统计学和应用概率回归专著中的子集选择,第95卷,第二版,查普曼和霍尔,伦敦(相关软件可在URL:\(\langle;\)找到http://users.bigpond.net.au/amiller网站/\(\rangle;\);A.J.Miller,2002年。统计学和应用概率回归专著中的子集选择,第95卷,第二版。Chapman&Hall,伦敦(相关软件可在URL:\(\langle;\)找到http://users.bigpond.net.au/amiller网站/\(\rangle;\)·兹比尔1051.62060
[15] Narendra,P.M。;Fukunaga,K.,特征子集选择的分支定界算法,IEEE Trans。计算。,26, 917-922 (1997) ·Zbl 0363.68059号
[16] R开发核心团队,2005年。R: 统计计算语言和环境。奥地利维也纳R统计计算基金会。;R开发核心团队,2005年。R: 统计计算语言和环境。R统计计算基金会,奥地利维也纳。
[17] Roberts,S.J.,《统计算法:算法AS 199:确定给定大小的最佳特征子集的分支定界算法》,Appl。统计人员。,33, 236-241 (1984)
[18] Searle,S.R.,线性模型(1971),威利:威利纽约·Zbl 0218.62071号
[19] Seber,G.A.F.,线性回归分析(1977),Wiley:Wiley New York·Zbl 0354.62055号
[20] 森,A。;Srivastava,M.,回归分析。理论、方法和应用(1990年),《施普林格:柏林施普林格出版社》·Zbl 0714.62057号
[21] 史密斯,D.M。;Bremner,J.M.,使用QR分解的所有可能子集回归,计算。统计师。数据分析。,7, 217-235 (1989) ·Zbl 0726.62115号
[22] 索莫尔,P。;普迪尔,P。;Kittler,J.,《最佳特征选择的快速分支定界算法》,IEEE Trans。模式分析。机器。智力。,26, 900-912 (2004)
[23] Tibshirani,R.J.,《通过套索进行回归收缩和选择》,J.Roy。统计师。Soc.序列号。B(统计学方法),58267-288(1996)·Zbl 0850.62538号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。