×

高阶相互作用模型中变量选择和预测的两阶段正则化方法。 (英语) Zbl 1407.62339号

摘要:由于研究人员逐渐注意到加性线性模型不足以进行准确的预测,因此具有高阶交互作用的预测模型在许多应用中变得流行起来。然而,模型中样本量较小的变量数量过多,对预测准确性构成了严峻挑战。为了同时提高预测精度和训练速度,可解释模型在知识恢复中至关重要。为了处理超高维,本文研究了高阶交互模型中要求稀疏性的两阶段过程。在每个阶段,应用平方根硬脊(SRHR)方法来发现相关变量。平方根损失函数的应用有助于参数调整工作。另一方面,硬脊惩罚函数能够处理高复共线性和选择不一致性。实际数据实验表明,该方法优于其他比较方法。

MSC公司:

62M20型 随机过程推断和预测
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 范,J。;Li,R.,《高维统计挑战:知识发现中的特征选择》,《国际数学家大会论文集》,595-622(2006)·Zbl 1117.62137号
[2] Jiang,H.,高维数据中基于平方根非凸优化的稀疏估计,神经计算,282122-135(2018)
[3] 姜浩,基于正交贪婪算法的两阶段特征选择程序的模型预测,应用软计算,63,110-123(2017)·doi:10.1016/j.asoc.2017年11月47日
[4] 施温德,H。;Ickstadt,K.,使用逻辑回归识别SNP相互作用,生物统计学,9,1,187-198(2008)·Zbl 1274.62872号 ·doi:10.1093/biostatistics/kxm024
[5] 化验,E。;文森特·J·P。;科尔斯,R。;Pluess,M.,《基因-环境相互作用与精神疾病:回顾与未来方向》,《细胞与发育生物学研讨会》,77,133-143(2017)·doi:10.1016/j.semcdb2017.10.016
[6] Akaike,H.,统计模型识别的新视角,IEEE自动控制汇刊,19716-723(1974)·Zbl 0314.62039号 ·doi:10.1109/TAC.1974.1100705
[7] Schwarz,G.,估算模型的维度,《统计年鉴》,6,2,461-464(1978)·兹伯利0379.62005 ·doi:10.1214/aos/1176344136
[8] Mallows,C.L.,关于Cp的一些评论,Technometrics,42,1,87-94(2000)·doi:10.1080/00401706.2000.10485984
[9] 陈S.S。;多诺霍,D.L。;Saunders,M.A.,通过基追踪进行原子分解,SIAM科学计算杂志,20,1,33-61(1998)·兹比尔0919.94002 ·doi:10.1137/S1064827596304010
[10] Friedman,J.H.,《快速稀疏回归和分类》,《国际预测杂志》,28,3,722-738(2012)·doi:10.1016/j.ijforecast.2012.05.001
[11] Antoniadis,A.,《统计学中的小波:综述》,统计方法与应用,6,2,97-130(1997)·Zbl 1454.62113号 ·doi:10.1007/bf03178905
[12] Zhang,C.H.,最小最大凹惩罚下的几乎无偏变量选择,《统计年鉴》,38,2,894-942(2010)·Zbl 1183.62120号 ·doi:10.1214/09-AOS729
[13] 她,Y。;Wang,J。;李,H。;Wu,D.,用于超分辨率稀疏谱选择的群迭代谱阈值,IEEE信号处理学报,61,24,6371-6386(2013)·Zbl 1394.94521号 ·doi:10.1109/TSP.2013.2281303
[14] 姜浩。;Dong,Y.,基于惩罚核支持向量机模型的降维,基于知识的系统,138,79-90(2017)·doi:10.1016/j.knosys.2017.09.041
[15] Ye,Y.-F。;Shao,Y.-H。;邓,N.-Y。;李,C.-N。;Hua,X.-Y.,稳健\(lp\)-带特征选择的范数最小二乘支持向量回归,应用数学与计算,305,32-52(2017)·Zbl 1411.62195号 ·doi:10.1016/j.ac.2017.01.062
[16] Bach,F.,用分层多核学习探索大特征空间,第22届神经信息处理系统年会论文集,NIPS 2008
[17] 赵,P。;罗查,G。;Yu,B.,分组和分层变量选择的复合绝对惩罚族,《统计年鉴》,37,6,3468-3497(2009)·Zbl 1369.62164号 ·doi:10.1214/07-AOS584
[18] 新罕布什尔州Choi。;李伟(Li,W.)。;朱杰,强遗传约束变量选择及其预言性质,美国统计协会杂志,105,489,354-364(2010)·Zbl 1320.62171号 ·doi:10.1198/jasa.2010.tm08281
[19] Bickel,P.J。;Ritov,Y。;Tsybakov,A.B.,稀疏高维回归中变量的层次选择,借入强度:理论驱动应用——劳伦斯·D·布朗的一场盛会,56-59(2010),数理统计研究所
[20] 吴杰。;德夫林,B。;林奎斯特,S。;特鲁克,M。;Roeder,K.,Screen and clean:a tool for identification interactions in genome wide association studies,Genetic Epidemiology,34,3,275-285(2010),《筛查和清洁:全基因组关联研究中识别相互作用的工具》·doi:10.1002/gepi.20459
[21] 拉德琴科,P。;James,G.M.,高维自适应非线性交互结构变量选择,美国统计协会杂志,105,492,1541-1553(2010)·Zbl 1388.62212号 ·doi:10.1198/jasa.2010.tm10130
[22] 比恩,J。;泰勒,J。;Tibshirani,R.,《层级互动套索》,《统计年鉴》,第41、3、1111-1141页(2013年)·Zbl 1292.62109号 ·doi:10.1214/13-aos1096
[23] 她,Y。;王,Z。;Jiang,H.,Group regulated estimation under structural hierarchy,Journal of the American Statistical Association,113,521,445-454(2018),结构层次下的集团正则化估计,美国统计协会杂志·Zbl 1398.62138号 ·doi:10.1080/01621459.2016.1260470
[24] 郝,N。;Zhang,H.H.,超高维数据的交互筛选,美国统计协会杂志,109,507,1285-1301(2014)·Zbl 1368.62193号 ·doi:10.1080/01621459.2014.881741
[25] 林,M。;Hastie,T.,《通过分层群-随机正则化学习交互》,《计算与图形统计杂志》,24,3,627-654(2015)·doi:10.1080/10618600.2014.938812
[26] 严,X。;Bien,J.,《分层稀疏建模:两组套索公式的选择》,《统计科学》。《数理统计研究所评论期刊》,32,4,531-560(2017)·Zbl 1442.62162号 ·doi:10.1214/17-STS622
[27] 贝洛尼,A。;切尔诺朱科夫,V。;Wang,L.,方形套索:通过圆锥编程实现稀疏信号的关键恢复,Biometrika,98,4,791-806(2011)·Zbl 1228.62083号 ·doi:10.1093/biomet/asr043
[28] 陈,J。;Chen,Z.,《大模型空间模型选择的扩展贝叶斯信息准则》,Biometrika,95,3,759-771(2008)·Zbl 1437.62415号 ·doi:10.1093/biomet/asn034
[29] Ing,C.-K.公司。;Lai,T.L.,高维稀疏线性模型的逐步回归方法和一致模型选择,《统计学》,21,4,1473-1513(2011)·Zbl 1225.62095号
[30] 博伊德,S。;北卡罗来纳州帕里赫。;朱,E。;Peleato,B。;Eckstein,J.,《通过交替方向乘数法进行分布式优化和统计学习》,《机器学习的基础和趋势》,3,1,1-122(2011)·Zbl 1229.90122号 ·doi:10.1561/220000016
[31] Nesterov,Y.,《最小化复合目标函数的梯度方法》(2007),卢万天主教大学,运筹学和计量经济学中心
[32] Bickel,P.J。;Ritov,Y。;Tsybakov,A.B.,《套索和Dantzig选择器的同时分析》,《统计年鉴》,第37、4、1705-1732页(2009年)·Zbl 1173.62022号 ·doi:10.1214/08-AOS620
[33] Lounici,K.,Lasso和Dantzig估计量的超形式收敛速度和符号集中特性,《电子统计杂志》,第2期,第90-102页(2008年)·Zbl 1306.62155号 ·doi:10.1214/08-EJS177
[34] van de Geer,S.A。;Buhlmann,P.,《关于为Lasso证明预言结果的条件》,《电子统计杂志》,31360-1392(2009)·Zbl 1327.62425号 ·doi:10.1214/09-EJS506
[35] Ye,F。;Zhang,C.-H.,lr球lq损失的套索和dantzig选择器的最小速率,机器学习研究杂志,11,3519-3540(2010)·Zbl 1242.62074号
[36] 张,C.-H。;Zhang,T.,高维稀疏估计问题的凹正则化一般理论,统计科学,27,47576-593(2012)·Zbl 1331.62353号 ·doi:10.1214/12-sts399
[37] Stucky,B。;van de Geer,S.,平方根正则化的Sharp oracle不等式,机器学习研究杂志,18,67,1-29(2017)·Zbl 1441.62188号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。