×

使用基于映射方法的新节点选择过程重构MARS算法的前向步骤。 (英语) Zbl 1299.65015号

摘要:在高维数据建模中,多元自适应回归样条(MARS)是一种流行的非参数回归技术,用于借助样条定义响应变量和预测因子之间的非线性关系。MARS使用分段线性函数进行局部拟合,并应用自适应程序选择断点(称为节点)的数量和位置。函数估计基本上是通过两步过程生成的:正向选择和反向消除。在第一步中,通过缺乏fit准则选择大量节点,获得大量局部拟合;在后一种情况下,消除了影响最小的局部配合或节点。在传统的自适应样条程序中,节点是从一组不同的数据点中选择的,这使得前向选择过程的计算成本高昂,并导致较高的局部方差。为了避免这个缺点,可以将节点限制为数据点的子集。在此背景下,提出了一种新的节点选择方法,该方法基于自组织映射等映射方法。通过该方法,可以将较少但更有代表性的数据点用作MARS前向步骤中的函数估计节点。该方法应用于许多模拟和实际数据集,结果表明,该算法在不降低模型精度和预测性能的前提下,为节点选择和模型估计提供了一种时间有效的前向步骤。

理学硕士:

65C60个 统计中的计算问题(MSC2010)
62M10个 统计学中的时间序列、自相关、回归等(GARCH)
62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Akaike,H.:信息理论和最大似然原理的扩展。参见:Petrov,B.F,Cs’aki,F.(编辑)第二届信息理论国际研讨会。布达佩斯基亚多学院(1973年)·Zbl 0283.62006号
[2] 奥尔德林,M.:改进了加性模型中惩罚斜率和曲率的预测。计算统计与数据分析50,267-284(2006)·Zbl 1431.62134号
[3] Atilgan,T.:密度估计和回归的基础选择。AT&T贝尔实验室技术备忘录(1988)·Zbl 0875.62155号
[4] Cervellera,C.,Chen,V.C.P.,Wen,A.:随机规划的神经网络和回归样条函数近似。计算。操作。第34号决议,70-90(2006年)·Zbl 1102.90040号 ·doi:10.1016/j.cor.2005.02.043
[5] Chen,V.C.P.:测量随机规划和随机动态规划的正交数组离散化的优度。SIAM J.Optim公司。12(2), 322-344 (2001) ·兹比尔1017.90067 ·doi:10.1137/S1052623498332403
[6] Chen,V.C.P.,Gunther,D.,Johnson,E.L.:通过统计学习解决最佳航空收益管理政策。J.R.统计社会服务。C 52(1),1-12(2003)·Zbl 1111.90333号 ·doi:10.1111/1467-9876.00386
[7] Chen,V.C.P.,Ruppert,D.,Shoemaker,C.A.:将实验设计和回归样条应用于高维连续状态随机动态规划。操作。第47、38-53号决议(1999年)·Zbl 0979.90094号 ·数字对象标识代码:10.1287/opre.47.1.38
[8] Cortez,P.,Cerdeira,A.,Almeida,F.,Matos,T.,Reis,J.:通过物理化学特性的数据挖掘建模葡萄酒偏好。决策支持系统47(4),547-553(2009)
[9] Craven,P.,Wahba,G.:用样条函数平滑噪声数据:通过广义交叉验证方法估计平滑的正确程度。数字数学31,377-403(1979)·Zbl 0377.65007号 ·doi:10.1007/BF01404567
[10] Crino,S.,Brown,D.E.:使用多元自适应回归样条的全局优化。IEEE传输。系统。人类网络。B部分:网络。37(2), 333-340 (2007) ·doi:10.1109/TSMCB.2006.883430
[11] De Boor,C.:样条线实用指南。施普林格,纽约(1978年)·Zbl 0406.41003号 ·doi:10.1007/978-1-4612-66333-3
[12] Deichmann,J.、Eshghi,A.、Haughton,D.、Sayek,S.、Teebagy,N.:多重自适应回归样条(MARS)在直接响应建模中的应用。J.直接市场。16, 15-27 (2002)
[13] Denison,D.G.T.,Mallick,B.K.,Smith,A.F.M.:自动贝叶斯曲线拟合。J.R.Stat.Soc.60,333-350(1998年)·Zbl 0907.62031号 ·doi:10.1111/1467-9868.00128
[14] 保罗·艾尔斯(Paul H.C.)、马克斯(Marx,B.D.):具有B样条和惩罚的灵活平滑。统计科学。11, 98-102 (1996) ·Zbl 0955.62562号 ·doi:10.1214/ss/1038425655
[15] Fox,J.:非参数回归,应用回归的R和S-PLUS伴侣。《千橡树圣人》(2002)
[16] Frank,A.,Asuncion,A.:UCI机器学习库。加利福尼亚大学信息与计算机科学学院,加利福尼亚州欧文。http://archive.ics.uci.edu/ml (2010) ·Zbl 1237.90133号
[17] Friedman,J.H.,Silverman,B.W.:灵活的节约型平滑和加性建模。《技术计量学》31,3-21(1989)·Zbl 0672.65119号 ·doi:10.1080/0401706.1989.10488470
[18] Friedman,J.H.:多元自适应回归样条曲线。Ann.Stat.19,1-67(1991)·Zbl 0765.62064号 ·doi:10.1214/aos/1176347963
[19] 弗里德曼,J.H.:《快速MARS》,斯坦福大学统计系,技术报告110(1993)
[20] Gersho,A.,Gray,R.M.:矢量量化和信号压缩。诺威尔·克鲁沃(1992)·Zbl 0782.94001号 ·doi:10.1007/978-1-4615-3626-0
[21] Gibbons,J.D.,Chakraborti,S.:非参数统计推断。马塞尔·德克尔(Marcel Dekker),纽约(2003)·Zbl 1115.62004号
[22] Green,P.H.,Silverman,B.W.:非参数回归和广义线性模型。查普曼·霍尔,博卡拉顿(1994)·Zbl 0832.62032号 ·doi:10.1007/978-1-4899-4473-3
[23] Hastie,T.J.、Tibshirani,R.J.、Friedman,J.:统计学习、数据挖掘、推断和预测的要素。施普林格,纽约(2001)·Zbl 0973.62007号
[24] Haykin,S.:《神经网络:综合基础》。新泽西州普伦蒂斯·霍尔(1999)·Zbl 0934.68076号
[25] Jekabsons,G.:ARESLab:matlab/Octave的自适应回归样条工具箱。http://www.cs.rtu.lv/jekabsons网站/ (2011)
[26] Jin,R.,Chen,W.,Simpson,T.W.:多建模标准下元建模技术的比较研究。结构。多磁盘。最佳方案。23, 1-13 (2001) ·doi:10.1007/s00158-001-0160-4
[27] Kohonen,T.:自我组织和联想记忆。纽约州施普林格市(1988年)·兹比尔0659.68100 ·doi:10.1007/978-3-662-00784-6
[28] Kubin,G.:移动无线信道的非线性预测:测量和火星模型设计。载:《IEEE声学、语音和信号处理国际会议论文集》,3月15日至19日,第2667-2670页(1999年)
[29] Leathwick,J.R.、Rowe,D.、Richardson,J.、Elith,J.和Hastie,T.:使用多元自适应回归样条预测新西兰淡水河产卵鱼类的分布。Freshw公司。生物50,2034-2052(2005)·Zbl 0377.65007号
[30] Leathwick,J.R.,Elith,J.,Hastie,T.:物种分布统计建模的广义加性模型和多元自适应回归样条的比较性能。经济。模型。199, 188-196 (2006) ·doi:10.1016/j.ecolmodel.2006.05.022
[31] Lee,T.S.,Chiu,C.C.,Chou,Y.C.,Lu,C.J.:使用分类和回归树以及多元自适应回归样条挖掘客户信用。计算。统计数据分析。50, 1113-1130 (2006) ·Zbl 1431.62645号 ·doi:10.1016/j.csda.2004.11.006
[32] Luo,Z.,Wahba,G.:混合自适应样条曲线。《美国统计协会期刊》92,107-116(1997)·兹比尔1090.62535 ·doi:10.1080/01621459.1997.10473607
[33] Mallows,C.L.:对《技术计量学下士》的一些评论15661-675(1973)·Zbl 0269.62061号
[34] Martinez,N.,Martinex,D.,Rosenberger,J.M.,Chen,V.C.P.:分段线性回归样条函数的全局优化(INFORMS会议,2011)
[35] Miyata,S.,Shen,X.:自由结样条线和自适应结选择。J.Jpn.杂志。Stat.Soc.35(2),303-324(2005)·doi:10.14490/jjss.35.303
[36] Ùzmen,A.:稳健二次二次规划在质量改进中的应用——cmar的稳健化,理学硕士。中东技术大学(2010)·Zbl 0672.65119号
[37] 奥兹曼,A.,韦伯,G.-W.,巴特马,伊利诺伊州:新的鲁棒CMARS(RCMARS)方法。摘自:第24届小型欧洲会议——金融业持续优化和信息化技术,MEC-EurOPT论文集,ISI会议记录,第362-368页(2010)
[38] Pilla,V.L.,Rosenberger,J.M.,Chen,V.C.P.,Engsuwan,N.,Siddappa,S.:求解两阶段随机规划车队分配模型的多元自适应回归样条割平面方法。欧洲药典。第216162-171号决议(2012年)·Zbl 1237.90133号 ·doi:10.1016/j.ejor.2011.07.008
[39] Pilla,V.、Rosenberger,J.、Chen,V.:航空公司机队分配的统计计算机实验方法。IIE事务处理。40, 524-537 (2008) ·doi:10.1080/07408170701759734
[40] Quinlan,R.:结合基于实例和基于模型的学习。马萨诸塞大学阿默斯特分校第十届国际机器学习会议论文集。摩根·考夫曼。236-243 (1993) ·Zbl 0907.62031号
[41] Sakamoto,W.:MARS:使用经验贝叶斯方法选择基函数和节点。计算。《法律总汇》第22卷第583-597页(2007年)·Zbl 1194.62055号 ·doi:10.1007/s00180-007-0075-7
[42] Stone,C.J.,Koo,CY.:统计学中的加法样条。摘自:《统计计算科论文集》,第45-48页。弗吉尼亚州亚历山大市美国统计协会(1985年)·兹比尔1017.90067
[43] Stone,C.,Hansen,M.,Kooperberg,C.,Troung,Y.:扩展线性建模中的多项式样条及其张量积。Ann.Stat.251371-1470(1997)·Zbl 0924.62036号 ·doi:10.1214/aos/1031594728
[44] 蔡,J.C.C.,陈,V.C.P.,陈,J.,贝克,M.B.:废水处理决策框架的随机动态规划公式。第132号决议,207-221(2004)·Zbl 1090.90152号 ·doi:10.1023/B:ANOR.000045283.86576.62
[45] Tsanas,A.,Little,M.A.,McSharry,P.E.,Ramig,L.O.:通过非侵入性言语测试准确远程监测帕金森病进展。IEEE生物医学工程学报57(4),884-894(2010)
[46] Vesanto,J.、Himberg,J.,Alhoniehmi,E.、Parhankangas,J.:Mathlab 5的SOM工具箱,报告A57。http://www.cis.hut.fi/projects/somtoolbox/ (2000)
[47] Wahba,G.:在与J.Ramsay的讨论中:单调回归样条函数的作用。统计科学。3, 425-462 (1988)
[48] 韦伯,G.W.,巴特马兹。,Köksal,G.,Taylan,P.,Yerlikaya-Øzkurt,F.:CMARS:对非参数回归的新贡献,多元自适应回归样条由连续优化支持。反向探测。科学。工程20(3),371-400(2011)·Zbl 1254.65020号 ·doi:10.1080/17415977.2011.624770
[49] Wong,C.,Kohn,R.:加性半参数回归的贝叶斯方法。《经济学杂志》。74, 209-235 (1996) ·Zbl 0864.62026号 ·doi:10.1016/0304-4076(95)01743-7
[50] Yeh,I.-C.:使用人工神经网络对高性能混凝土的强度进行建模。《水泥与混凝土研究》28(12),1797-1808(1998)
[51] Yerlikaya,F.:MARS对非线性稳健回归和分类的新贡献及其在制造业质量控制数据挖掘中的应用,理学硕士。安卡拉METU应用数学研究所的论文(2008年)
[52] York,T.P.,Eaves,L.J.,Van den Oord,E.J.C.G.:多元自适应回归样条:检测亚组间疾病风险关系差异的强大方法。Stat.Med.25(8),1355-1367(2006)
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。