×

具有平滑弹性网的自适应函数-标量回归。 (英语) Zbl 1470.62190号

摘要:本文提出了一种新的方法,称为AFSSEN,用于在具有次高斯误差的高维函数标度线性模型中同时选择重要预测因子并生成平滑估计。假设结果位于一般实可分Hilbert空间(mathbb{H})中,而参数位于被称为Cameron-Martin空间(mathbb{K})的子空间中,该子空间与再生核Hilbert空间密切相关,因此参数估计继承了特定的性质,如光滑性或周期性,没有对数据强制使用此类属性。我们提出了一种自适应弹性网惩罚形式的正则化方法,其中包括混合两种类型的函数范数,对估计模型中的平滑和变量选择提供微调控制。渐近理论是以函数预言属性的形式提供的,本文最后通过仿真研究证明了使用AFSSEN在预测误差和变量选择方面优于现有方法。

MSC公司:

62兰特 功能数据分析
62甲12 多元分析中的估计
62G08号 非参数回归和分位数回归
46 E22型 具有再生核的希尔伯特空间(=(适当的)函数希尔伯特空间,包括de Branges-Rovnyak和其他结构空间)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] R: 统计计算语言与环境(2018),R统计计算基金会:R统计计算基础,奥地利维也纳
[2] Algamal,Z.Y。;Lee,M.H.,高维癌症分类中基因选择的调整自适应弹性网正则逻辑回归,计算机。生物医学,67,136-145(2015)
[3] Antonini,R.G.,希尔伯特空间中的次高斯随机变量,Rend。塞明。帕多瓦马特大学,98,89-99(1997)·Zbl 0892.60049号
[4] 巴伯,R.F。;Reimherr,M。;Schill,T.,标量套索上的函数及其在纵向GWAS中的应用,电子。J.Stat.,11351-1389(2017)·Zbl 1362.62084号
[5] 巴布,V。;Precupanu,T.,《巴拿赫空间中的凸性和优化》(2012),Springer科学与商业媒体:Springer科技与商业媒体纽约·Zbl 1244.49001号
[6] Bauschke,H.H。;Combettes,P.L.,Hilbert空间中的凸分析和单调算子理论(2011),施普林格科学与商业媒体:施普林格科学与商业媒体纽约·Zbl 1218.47001号
[7] Bawa,R.K.,线性奇摄动边值问题的基于样条线的计算技术,应用。数学。计算。,167, 225-236 (2005) ·Zbl 1083.65513号
[8] Berlinet,A。;Thomas-Agnan,C.,《概率统计中的核希尔伯特空间再现》(2011),施普林格科学与商业媒体:施普林格科技与商业媒体纽约
[9] Bierut,L.J。;Madden,P.A。;北布雷斯劳。;E.O.约翰逊。;Hatsukami,D。;Pomerleau,O.F。;Swan,G.E。;Rutter,J。;贝塔森,S。;Fox,L.,《尼古丁依赖高密度全基因组关联研究中发现的新基因》,《人类分子遗传学》。,16, 24-35 (2006)
[10] Bogachev,V.I.,高斯度量(1998),美国数学学会:美国数学学会纽约·Zbl 0938.28010号
[11] 博伊德,S。;Vandenberghe,L.,《凸优化》(2004),剑桥大学出版社:剑桥大学出版社,纽约·Zbl 1058.90049号
[12] Buldygin,V.V。;Kozachenko,Y.V.,亚高斯随机变量,Ukr。数学。公牛。,32, 483-489 (1980) ·Zbl 0479.60012号
[13] 陈,Y。;戈德史密斯,J。;Ogden,R.T.,函数-尺度回归中的变量选择,Stat,588-101(2016)
[14] Craig,S.J。;布兰肯伯格,D。;帕罗迪,A.C.L。;保罗,I.M。;Birch,L.L。;萨维奇,J.S。;马里尼,M.E。;斯托克斯,J.L。;Nekrutenko,A。;Reimherr,M.,《与口腔微生物组成相关的儿童体重增长轨迹科学报告》,14030(2018)
[15] Craig,S.J.C。;肯尼,A.M。;林,J。;保罗,I.M。;伯奇。;萨维奇,J。;马里尼,M.E。;奇亚罗蒙特,F。;Reimherr,M.L。;Makova,K.D.,基于增重轨迹的多基因风险评分是儿童肥胖的一个强有力的预测因素,(BioRxiv(2020)),第606277页。
[16] Dunford,N。;Schwartz,J.T.,《线性算子:第二部分:谱理论:希尔伯特空间中的自伴算子》(1963),跨学科出版社:纽约跨学科出版社·Zbl 0128.34803号
[17] Eddelbuettel,D。;Francoiş,R.,Rcpp:无缝R和C++集成,J.Stat.Softw。,40, 1-18 (2011)
[18] 范,Y。;詹姆斯·G·M。;Radchenko,P.,函数加性回归,Ann.Statist。,43, 2296-2325 (2015) ·Zbl 1327.62252号
[19] 风扇,Z。;Reimherr,M.,《尺度回归的高维自适应函数》,经济学。统计,1167-183(2017)
[20] Feng,Y。;Lv,S.-G。;Hang,H。;Suykens,J.A.,核化弹性网正则化:泛化边界和稀疏恢复,神经计算。,28, 525-562 (2016) ·Zbl 1474.62124号
[21] Gerthiss,J。;Maity,A。;Staicu,A.-M.,广义函数线性模型中的变量选择,Stat.,286-101(2013)
[22] 希比里,M。;Van De Geer,S.,《平滑法和其他l1+l2化方法》,电子。J.Stat.,5,1184-1226(2011)·兹比尔1274.62443
[23] 兴,T。;Eubank,R.,《函数数据分析的理论基础,线性算子简介》(2015),John Wiley&Sons:John Willey&Sons纽约·Zbl 1338.62009号
[24] 徐,D。;卡卡德,S.M。;Zhang,T.,亚高斯随机向量二次型的尾部不等式,电子。Commun公司。概率。,17, 1-6 (2012) ·Zbl 1309.60017号
[25] 黄,J。;马,S。;Zhang,C.-H.,稀疏高维回归模型的自适应套索,Statist。Sinica,18,1603-1618(2008)·Zbl 1255.62198号
[26] S.G.Johnson,《nlopt非线性优化包》,2014年。
[27] Kokoszka,P。;Reimherr,M.,《功能数据分析导论》(2017),查普曼和霍尔/CRC:查普曼与霍尔/CRC博卡拉顿,佛罗里达·Zbl 1411.62004号
[28] Lian,H.,多元函数回归的收缩率估计和选择,统计学。Sinica,23,51-74(2013)·Zbl 1257.62041号
[29] 松井,H。;Konishi,S.,通过l1正则化选择函数回归模型的变量,计算。统计人员。数据分析。,55, 3304-3310 (2011) ·Zbl 1271.62140号
[30] Morris,J.S.,《函数回归》,年。修订状态申请。,2, 321-359 (2015)
[31] 帕罗迪,A。;Reimherr,M.,高维函数标度回归的同时变量选择和平滑,电子。J.Stat.,124602-4639(2018)·Zbl 1433.62111号
[32] J.O.拉姆齐。;Silverman,B.W.,《应用功能数据分析:方法和案例研究》(2007),Springer:Springer New York·Zbl 1011.62002号
[33] 莱斯,P.T。;黄,L。;Mennes,M.,带惩罚基展开的快速函数标度回归,国际生物统计杂志。,6, 1-28 (2010)
[34] Repapi,E。;塞耶斯,I。;Wain,L.V。;P.R.伯顿。;约翰逊,T。;Obeida,M。;赵,J.H。;Ramasamy,A。;翟,G。;Vitart,V.,《自然遗传学》,全基因组关联研究确定了五个与肺功能相关的基因座。,42, 36 (2010)
[35] 斯科特·L·J。;莫尔克,K.L。;邦尼卡斯尔。;威勒,C.J。;李,Y。;杜伦,W.L。;鄂尔多斯,M.R。;斯特林厄姆·H·M。;中国,P.S。;Jackson,A.U.,《芬兰人2型糖尿病全基因组关联研究检测出多种易感性变体》,《科学》,3161341-1345(2007)
[36] Shor,N.Z.,《不可微函数的最小化方法》,第3卷(2012),Springer科学与商业媒体:Springer科技与商业媒体纽约
[37] Stein,M.L.,《空间数据插值:克里金的一些理论》(2012),施普林格科学与商业媒体:施普林格科技与商业媒体纽约
[38] 袁,M。;蔡东东,《函数线性回归的再生核希尔伯特空间方法》,《统计年鉴》。,38, 3412-3444 (2010) ·Zbl 1204.62074号
[39] 张春华,极小极大凹惩罚下的几乎无偏变量选择,安统计学家。,38, 894-942 (2010) ·Zbl 1183.62120号
[40] 赵,P。;Yu,B.,关于套索的模型选择一致性,J.Mach。学习。第72541-2563号决议(2006年)·Zbl 1222.62008年
[41] Zou,H.,《自适应套索及其预言属性》,J.Amer。统计人员。协会,101,1418-1429(2006)·Zbl 1171.62326号
[42] 邹,H。;Hastie,T.,《通过弹性网进行正则化和变量选择》,J.R.Stat.Soc.Ser。B统计方法。,67, 301-320 (2005) ·Zbl 1069.62054号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。