×

功能数据的可解释稀疏SIR。 (英语) Zbl 1430.62079号

摘要:我们提出了一个基于切片逆回归(SIR)的半参数框架来解决函数回归中的变量选择问题。SIR是一种有效的降维方法,它在低维空间中计算预测因子的线性投影,而不会丢失回归信息。为了处理预测因子的高维性,我们考虑SIR的惩罚版本:脊和稀疏。我们扩展了为多维SIR开发的变量选择方法,以选择形成函数预测器定义域划分的区间。选择整个区间而不是单独的评价点可以提高函数框架中估计系数的可解释性。提出了一种全自动迭代过程来寻找关键(可解释)区间。该方法在模拟和实际数据上都证明是有效的。该方法在R包中实现SISIR公司CRAN上提供https://cran.r-project.org/package=SISIR.

理学硕士:

62G08号 非参数回归和分位数回归
62J07型 岭回归;收缩估计器(拉索)
62F07型 统计排名和选择程序
62-08 统计问题的计算方法
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Allen,R.G.,Pereira,L.S.,Raes,D.,Smith,M.:作物蒸发蒸腾-作物需水量计算指南-粮农组织灌溉和排水论文56。粮农组织,罗马300(9),D05109(1998)
[2] Aneiros,G.,Vieu,P.:无限维问题中的变量。统计概率。莱特。94, 12-20 (2014) ·Zbl 1320.62163号
[3] Bernard-Michel,C.,Gardes,L.,Girard,S.:关于带正则化的分段逆回归的注释。生物统计学64(3),982-986(2008)。https://doi.org/10.1111/j.1541-0420.2008.01080.x ·Zbl 1145.62351号 ·doi:10.1111/j.1541-0420.2008.01080.x
[4] Bettonvil,B.:通过顺序分叉进行因子筛选。Commun公司。统计模拟。计算。24(1), 165-185 (1995) ·Zbl 0850.62625号
[5] Biau,G.,Bunea,F.,Wegkamp,M.:希尔伯特空间中的泛函分类。IEEE传输。Inf.Theory 51,2163-2172(2005)·Zbl 1285.94015号
[6] Borggaard,C.,Thodberg,H.:光谱的最佳最小神经解释。分析。化学。64(5), 545-551 (1992)
[7] Bura,A.,Cook,R.:扩展切片反向回归:加权二次方检验。《美国统计协会期刊》96(455),996-1003(2001)·Zbl 1047.62035号
[8] Bura,E.,Yang,J.:充分降维中的维数估计:统一方法。J.多变量。分析。102(1), 130-142 (2011). https://doi.org/10.1016/j.jmva.2010.08.007 ·Zbl 1206.62107号 ·doi:10.1016/j.jmva.2010.08.007
[9] Casadebaig,P.、Guilioni,L.、Lecoeur,J.、Christophe,A.、Champolivier,L.和Debaeke,P.:Sunflo,一个模拟向日葵作物在对比环境中的基因型特异性表现的模型。农业。对于。美托洛尔。151(2), 163-178 (2011)
[10] Chen,C.,Li,K.:SIR能像多元线性回归那样流行吗?统计正弦。8, 289-316 (1998) ·Zbl 0897.62069号
[11] Chen,S.,Donoho,D.,Saunders,M.:用基团进行原子分解。SIAM J.科学。计算。20(1), 33-61 (2015) ·Zbl 0919.94002号
[12] Cook,R.:测试预测因子在充分降维中的贡献。Ann.Stat.32(3),1061-1092(2004)·Zbl 1092.62046号
[13] Cook,R.,Yin,X.:判别分析中的降维和可视化。澳大利亚。《N.Z.J.Stat.43(2)》,147-199(2001)·Zbl 0992.62056号
[14] Coudret,R.,Liquet,B.,Saracco,J.:未确定病例切片反向回归法的比较。J.Soc.Fr.Stat.155(2),72-96(2014)。http://journal-sfds.fr/index.php/J-sfds/article/view/278 ·Zbl 1316.62068号
[15] Dauxois,J.,Ferré,L.,Yao,A.:非现代半参数倒变量al-atatoire hilbertienne。Comptes Rendus数学。阿卡德。科学。巴黎327(I),947-952(2001)。https://doi.org/10.1016/S0764-4442(01)02163-2 ·兹比尔0996.62035 ·doi:10.1016/S0764-4442(01)02163-2
[16] Fauvel,M.,Deschene,C.,Zullo,A.,Ferraty,F.:用于高斯混合模型分类的高光谱图像的快速前向特征选择。IEEE J.选择。顶部。申请。地球观测遥感器第8(6)节,2824-2831(2015)。https://doi.org/10.109/JSTARS.2015.2441771 ·doi:10.1010/JSTARS.2015.24441771
[17] Ferraty,F.,Hall,P.:非线性、非参数模型选择和预测的算法。J.计算。图表。Stat.24(3),695-714(2015)。https://doi.org/101080/10618600.2014.936605 ·doi:10.1080/10618600.2014.936605
[18] Ferraty,F.、Hall,P.、Vieu,P.:功能数据预测器的大多数预测设计点。《生物特征》97(4),807-824(2010)。https://doi.org/10.1093/biomet/asq058 ·Zbl 1204.62064号 ·doi:10.1093/biomet/asq058
[19] Ferré,L.:在切片反向回归和相关方法中确定维数。《美国统计协会期刊》93(441),132-140(1998)。https://doi.org/10.1080/01621459.1998.10474095 ·Zbl 0908.62049号 ·doi:10.1080/01621459.1998.10474095
[20] Ferré,L.,Villa,N.:具有功能输入的多层感知器:逆回归方法。扫描。《美国联邦法律大全》第33卷(4),第807-823页(2006年)。https://doi.org/10.1111/j.1467-9469.2006.00496.x ·Zbl 1164.62339号 ·网址:10.1111/j.1467-9469.2006.00496.x
[21] Ferré,L.,Yao,A.:功能切片反向回归分析。统计37(6),475-488(2003)·Zbl 1032.62052号
[22] Fraiman,R.、Gimenez,Y.、Svarc,M.:功能数据的特征选择。J.多变量。分析。146, 191-208 (2016). https://doi.org/10.1016/j.jmva.2015.09.006 ·Zbl 1335.62097号 ·doi:10.1016/j.jmva.2015.09.006
[23] Friedman,J.,Hastie,T.,Tibshirani,R.:通过坐标下降的广义线性模型的正则化路径。J.统计软件。33(1), 1-22 (2010)
[24] Fromont,M.,Tuleau,C.:边缘条件下的功能分类。收录于:Lugosi,G.,Simon,H.(编辑)《第19届学习理论年会论文集》(COLT 2006),Springer(Berlin/Heidelberg),宾夕法尼亚州匹兹堡,美国,计算机科学讲义,第4005卷,第94-108页(2006)。https://doi.org/10.1007/11776420_10 ·Zbl 1143.62326号
[25] Fruth,J.,Roustant,O.,Kuhnt,S.:计算机实验中功能输入敏感性分析的顺序设计。Reliab公司。工程系统。安全系数。134, 260-267 (2015)
[26] Golub,T.、Slonim,D.、Wahba,G.:广义交叉验证作为选择良好脊参数的方法。技术计量学21(2),215-223(1979)。https://doi.org/10.2307/1268518 ·Zbl 0461.62059号 ·doi:10.2307/1268518
[27] Grollemund,P.,Abraham,C.,Baragatti,M.,Pudlo,P.:具有稀疏阶跃函数的贝叶斯函数线性回归。预印本(2018)。arXiv公司:1604.08403·Zbl 1409.62060号
[28] Hastie,T.、Tibshirani,R.、Friedman,J.:《统计学习的要素》。数据挖掘、推理和预测。施普林格,纽约(2001)·Zbl 0973.62007号
[29] Hernández,N.、Biscay,R.、Villa-Vialaneix,N.和Talavera,I.:使用功能数据进行校准的非参数方法。统计正弦。25, 1547-1566 (2015). https://doi.org/10.5705/ss.2013.242 ·Zbl 1377.62113号 ·doi:10.5705/ss.2013.242
[30] James,G.,Wang,J.,Zhu,J.:可解释的函数线性回归。《Ann.Stat.37》(5A),2083-2108(2009)。https://doi.org/10.1214/08-AOS641 ·Zbl 1171.62041号 ·doi:10.1214/08-AOS641
[31] Kneip,A.,Poß,D.,Sarda,P.:具有影响点的函数线性回归。《Ann.Stat.》44(1),1-30(2016)。https://doi.org/10.1214/15-AOS1323 ·Zbl 1331.62233号 ·doi:10.1214/15-AOS1323
[32] Li,K.:用于降维的分段逆回归。《美国统计协会期刊》86(414),316-342(1991)。http://www.jstor.org/stable/2290563 ·Zbl 0742.62044号
[33] Li,L.,Nachtsheim,C.:稀疏切片逆回归。《技术计量学》48(4),503-510(2008)
[34] Li,L.,Yin,X.:带正则化的切片逆回归。生物统计学64(1),124-131(2008)。https://doi.org/10.1111/j.1541-0420.2007.00836.x ·Zbl 1139.62055号 ·doi:10.1111/j.1541-0420.2007.00836.x
[35] Lin,Q.,Zhao,Z.,Liu,J.:关于高维切片逆回归的一致性和稀疏性。预印本(2018)。arXiv:1507.03895·Zbl 1395.62196号
[36] Liquet,B.,Saracco,J.:在SIR和SAVE方法中选择切片数量和模型尺寸的图形工具。计算。Stat.27(1),103-125(2012)·兹比尔1304.65054
[37] Matsui,H.,Konishi,S.:通过l_1正则化选择函数回归模型的变量。计算。统计数据分析。55(12), 3304-3310 (2011). https://doi.org/10.1016/j.csda.2011.06.016 ·Zbl 1271.62140号 ·doi:10.1016/j.csda.2011.06.016
[38] McKeague,I.,Sen,B.:函数线性回归中具有点影响的分形。《Ann.Stat.38》(4),2559-2586(2010)。https://doi.org/10.1214/10-AOS791 ·Zbl 1196.62116号 ·doi:10.1214/10-AOS791
[39] Meyer,D.,Dimitriadou,E.,Hornik,K.,Weingessel,A.,Leisch,F.:e1071:概率理论小组统计系的杂项功能(原名:e1071),TU Wien。R包版本1.6-7(2015)
[40] Ni,L.,Cook,D.,Tsai,C.:关于收缩切片逆回归的注释。《生物特征》92(1),242-247(2005)·Zbl 1068.62080号
[41] Park,A.、Aston,J.、Ferraty,F.:稳定和预测的功能域选择,应用于大脑图像。预印本(2016)。arXiv:1606.02186
[42] Portier,F.,Delyon,B.:通过最小二乘约束估计对矩阵秩进行Bootstrap测试。《美国统计协会期刊》109(505),160-172(2014)。https://doi.org/10.1080/01621459.2013.847841 ·Zbl 1367.62043号 ·doi:10.1080/01621459.2013.847841
[43] Rasmussen,C.,Williams,C.:机器学习的高斯过程。麻省理工学院出版社,剑桥(2006)·Zbl 1177.68165号
[44] Schott,J.:确定分段逆回归中的维数。《美国统计协会期刊》89(425),141-148(1994)·Zbl 0791.62069号
[45] Simon,N.、Friedman,J.、Hastie,T.、Tibshirani,R.:稀疏群套索。J.计算。图表。《统计》第22卷,第231-245页(2013年)。https://doi.org/101080/10618600.2012.681250 ·doi:10.1080/10618600.2012.681250
[46] Tibshirani,R.,Saunders,G.,Rosset,S.,Zhu,J.,Knight,J.:通过融合套索实现稀疏和流畅。J.R.Stat.Soc.B 67(1),91-108(2005)·Zbl 1060.62049号
[47] Zhao,Y.,Ogden,R.,Reiss,P.:函数线性回归中基于小波的LASSO。J.计算。图表。《法律总汇》第21(3)、600-617页(2012年)。https://doi.org/101080/10618600.2012.679241 ·doi:10.1080/106186002012.679241
[48] Zhu,L.,Miao,B.,Peng,H.:关于高维协变量的分层逆回归。《美国统计协会期刊》101(474),360-643(2006)·Zbl 1119.62331号
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。