文件Zbl 1407.62339-zbMATH打开

高阶相互作用模型中变量选择和预测的两阶段正则化方法。（英语） Zbl 1407.62339号

复杂性 2018年，文章ID 2032987，12 p.（2018）.

摘要：由于研究人员逐渐注意到加性线性模型不足以进行准确的预测，因此具有高阶交互作用的预测模型在许多应用中变得流行起来。然而，模型中样本量较小的变量数量过多，对预测准确性构成了严峻挑战。为了同时提高预测精度和训练速度，可解释模型在知识恢复中至关重要。为了处理超高维，本文研究了高阶交互模型中要求稀疏性的两阶段过程。在每个阶段，应用平方根硬脊（SRHR）方法来发现相关变量。平方根损失函数的应用有助于参数调整工作。另一方面，硬脊惩罚函数能够处理高复共线性和选择不一致性。实际数据实验表明，该方法优于其他比较方法。

MSC公司：

62M20型

随机过程推断和预测

软件：

PDCO公司；格林特网；高级网络

PDF格式 BibTeX公司 XML格式引用

全文：内政部

参考文献：

[1]	范，J。；Li，R.，《高维统计挑战：知识发现中的特征选择》，《国际数学家大会论文集》，595-622（2006）·Zbl 1117.62137号
[2]	Jiang，H.，高维数据中基于平方根非凸优化的稀疏估计，神经计算，282122-135（2018）
[3]	姜浩，基于正交贪婪算法的两阶段特征选择程序的模型预测，应用软计算，63，110-123（2017）·doi:10.1016/j.asoc.2017年11月47日
[4]	施温德，H。；Ickstadt，K.，使用逻辑回归识别SNP相互作用，生物统计学，9，1，187-198（2008）·Zbl 1274.62872号 ·doi:10.1093/biostatistics/kxm024
[5]	化验，E。；文森特·J·P。；科尔斯，R。；Pluess，M.，《基因-环境相互作用与精神疾病：回顾与未来方向》，《细胞与发育生物学研讨会》，77，133-143（2017）·doi:10.1016/j.semcdb2017.10.016
[6]	Akaike，H.，统计模型识别的新视角，IEEE自动控制汇刊，19716-723（1974）·Zbl 0314.62039号 ·doi:10.1109/TAC.1974.1100705
[7]	Schwarz，G.，估算模型的维度，《统计年鉴》，6，2，461-464（1978）·兹伯利0379.62005 ·doi:10.1214/aos/1176344136
[8]	Mallows，C.L.，关于Cp的一些评论，Technometrics，42，1，87-94（2000）·doi:10.1080/00401706.2000.10485984
[9]	陈S.S。；多诺霍，D.L。；Saunders，M.A.，通过基追踪进行原子分解，SIAM科学计算杂志，20，1，33-61（1998）·兹比尔0919.94002 ·doi:10.1137/S1064827596304010
[10]	Friedman，J.H.，《快速稀疏回归和分类》，《国际预测杂志》，28，3，722-738（2012）·doi:10.1016/j.ijforecast.2012.05.001
[11]	Antoniadis，A.，《统计学中的小波：综述》，统计方法与应用，6，2，97-130（1997）·Zbl 1454.62113号 ·doi:10.1007/bf03178905
[12]	Zhang，C.H.，最小最大凹惩罚下的几乎无偏变量选择，《统计年鉴》，38，2，894-942（2010）·Zbl 1183.62120号 ·doi:10.1214/09-AOS729
[13]	她，Y。；Wang，J。；李，H。；Wu，D.，用于超分辨率稀疏谱选择的群迭代谱阈值，IEEE信号处理学报，61，24，6371-6386（2013）·Zbl 1394.94521号 ·doi:10.1109/TSP.2013.2281303
[14]	姜浩。；Dong，Y.，基于惩罚核支持向量机模型的降维，基于知识的系统，138，79-90（2017）·doi:10.1016/j.knosys.2017.09.041
[15]	Ye，Y.-F。；Shao，Y.-H。；邓，N.-Y。；李，C.-N。；Hua，X.-Y.，稳健\（lp\）-带特征选择的范数最小二乘支持向量回归，应用数学与计算，305，32-52（2017）·Zbl 1411.62195号 ·doi:10.1016/j.ac.2017.01.062
[16]	Bach，F.，用分层多核学习探索大特征空间，第22届神经信息处理系统年会论文集，NIPS 2008
[17]	赵，P。；罗查，G。；Yu，B.，分组和分层变量选择的复合绝对惩罚族，《统计年鉴》，37，6，3468-3497（2009）·Zbl 1369.62164号 ·doi:10.1214/07-AOS584
[18]	新罕布什尔州Choi。；李伟（Li，W.）。；朱杰，强遗传约束变量选择及其预言性质，美国统计协会杂志，105，489，354-364（2010）·Zbl 1320.62171号 ·doi:10.1198/jasa.2010.tm08281
[19]	Bickel，P.J。；Ritov，Y。；Tsybakov，A.B.，稀疏高维回归中变量的层次选择，借入强度：理论驱动应用——劳伦斯·D·布朗的一场盛会，56-59（2010），数理统计研究所
[20]	吴杰。；德夫林，B。；林奎斯特，S。；特鲁克，M。；Roeder，K.，Screen and clean:a tool for identification interactions in genome wide association studies，Genetic Epidemiology，34，3，275-285（2010），《筛查和清洁：全基因组关联研究中识别相互作用的工具》·doi:10.1002/gepi.20459
[21]	拉德琴科，P。；James，G.M.，高维自适应非线性交互结构变量选择，美国统计协会杂志，105，492，1541-1553（2010）·Zbl 1388.62212号 ·doi:10.1198/jasa.2010.tm10130
[22]	比恩，J。；泰勒，J。；Tibshirani，R.，《层级互动套索》，《统计年鉴》，第41、3、1111-1141页（2013年）·Zbl 1292.62109号 ·doi:10.1214/13-aos1096
[23]	她，Y。；王，Z。；Jiang，H.，Group regulated estimation under structural hierarchy，Journal of the American Statistical Association，113，521，445-454（2018），结构层次下的集团正则化估计，美国统计协会杂志·Zbl 1398.62138号 ·doi:10.1080/01621459.2016.1260470
[24]	郝，N。；Zhang，H.H.，超高维数据的交互筛选，美国统计协会杂志，109，507，1285-1301（2014）·Zbl 1368.62193号 ·doi:10.1080/01621459.2014.881741
[25]	林，M。；Hastie，T.，《通过分层群-随机正则化学习交互》，《计算与图形统计杂志》，24，3，627-654（2015）·doi:10.1080/10618600.2014.938812
[26]	严，X。；Bien，J.，《分层稀疏建模：两组套索公式的选择》，《统计科学》。《数理统计研究所评论期刊》，32，4，531-560（2017）·Zbl 1442.62162号 ·doi:10.1214/17-STS622
[27]	贝洛尼，A。；切尔诺朱科夫，V。；Wang，L.，方形套索：通过圆锥编程实现稀疏信号的关键恢复，Biometrika，98，4，791-806（2011）·Zbl 1228.62083号 ·doi:10.1093/biomet/asr043
[28]	陈，J。；Chen，Z.，《大模型空间模型选择的扩展贝叶斯信息准则》，Biometrika，95，3，759-771（2008）·Zbl 1437.62415号 ·doi:10.1093/biomet/asn034
[29]	Ing，C.-K.公司。；Lai，T.L.，高维稀疏线性模型的逐步回归方法和一致模型选择，《统计学》，21，4，1473-1513（2011）·Zbl 1225.62095号
[30]	博伊德，S。；北卡罗来纳州帕里赫。；朱，E。；Peleato，B。；Eckstein，J.，《通过交替方向乘数法进行分布式优化和统计学习》，《机器学习的基础和趋势》，3，1，1-122（2011）·Zbl 1229.90122号 ·doi:10.1561/220000016
[31]	Nesterov，Y.，《最小化复合目标函数的梯度方法》（2007），卢万天主教大学，运筹学和计量经济学中心
[32]	Bickel，P.J。；Ritov，Y。；Tsybakov，A.B.，《套索和Dantzig选择器的同时分析》，《统计年鉴》，第37、4、1705-1732页（2009年）·Zbl 1173.62022号 ·doi:10.1214/08-AOS620
[33]	Lounici，K.，Lasso和Dantzig估计量的超形式收敛速度和符号集中特性，《电子统计杂志》，第2期，第90-102页（2008年）·Zbl 1306.62155号 ·doi:10.1214/08-EJS177
[34]	van de Geer，S.A。；Buhlmann，P.，《关于为Lasso证明预言结果的条件》，《电子统计杂志》，31360-1392（2009）·Zbl 1327.62425号 ·doi:10.1214/09-EJS506
[35]	Ye，F。；Zhang，C.-H.，lr球lq损失的套索和dantzig选择器的最小速率，机器学习研究杂志，11，3519-3540（2010）·Zbl 1242.62074号
[36]	张，C.-H。；Zhang，T.，高维稀疏估计问题的凹正则化一般理论，统计科学，27，47576-593（2012）·Zbl 1331.62353号 ·doi:10.1214/12-sts399
[37]	Stucky，B。；van de Geer，S.，平方根正则化的Sharp oracle不等式，机器学习研究杂志，18，67，1-29（2017）·Zbl 1441.62188号

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
实验室	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!实验室	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

高阶相互作用模型中变量选择和预测的两阶段正则化方法。（英语） Zbl 1407.62339号

MSC公司：

软件：

参考文献：

示例

领域

操作员

高阶相互作用模型中变量选择和预测的两阶段正则化方法。 （英语） Zbl 1407.62339号

MSC公司：

软件：

参考文献：

高阶相互作用模型中变量选择和预测的两阶段正则化方法。（英语） Zbl 1407.62339号