×

克梅内特:一种用于条件主效应的双层变量选择的新方法。 (英语) Zbl 1420.62339号

摘要:本文介绍了一种新的选择主效应的方法和一组称为条件主效应(CME)的重新参数化效应,它捕获了一个因子在另一个因子的固定水平上的条件效应。CME代表了在工程、社会科学和基因组学中广泛应用的可解释、领域特定的现象。关键挑战在于将CME的隐式分组结构纳入变量选择程序本身。我们提出了一种新方法,克梅内特它采用CME耦合和CME约简两个原则来有效导航选择算法。仿真研究表明,改进的CME选择性能克梅内特超过更多的通用选择方法。应用于飞翼形状的基因关联研究,克梅内特与标准的双因素相互作用分析方法相比,不仅产生了更简约的模型和改进的预测性能,而且揭示了对基因激活行为的重要见解,可用于指导进一步的实验。R包中提供了我们算法的高效实现克梅内特CRAN中。

MSC公司:

62K15型 因子统计设计
62-04 统计相关问题的软件、源代码等
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 比恩,J。;泰勒,J。;Tibshirani,R.,《层级互动的套索》,《统计年鉴》,第41期,第1111-1141页(2013年)·兹比尔1292.62109
[2] Breheny,P.,《双水平变量选择的群指数拉索》,生物统计学,71,731-740(2015)·Zbl 1419.62316号
[3] Breheny,P。;Huang,J.,双层变量选择的惩罚方法,统计学及其接口,2369-380(2009)·Zbl 1245.62034号
[4] 查里,S。;德沃金,I.,《遗传相互作用的条件性质:野生型背景对基因组侧修饰筛选中突变相互作用的影响》,《公共科学图书馆·遗传学》,第9期,e1003661页(2013年)
[5] Cordell,H.J.,《检测人类疾病背后的基因相互作用》,《自然评论遗传学》,2009年第10期,第392-404页
[6] De Moor,M.H。;Berg,S.M。;Verweij,K.J。;Krueger,R.F。;卢西亚诺,M。;Vasquez,A.A。;Matteson,L.K。;德林格,J。;Esko,T。;Amin,N.,《神经质全基因组关联研究的Meta-Analysis of Genome-Wide Association Studies for Neurostism,and the Polygene Associations with Major Depressive Disorder》,JAMA精神病学,72,642-650(2015)
[7] Donoho,D.L.,《软阈值去噪》,IEEE信息理论汇刊,41613-627(1995)·Zbl 0820.62002号
[8] 范,J。;Li,R.,《基于非关联惩罚可能性的变量选择及其Oracle属性》,美国统计协会杂志,96,1348-1360(2001)·Zbl 1073.62547号
[9] Finney,D.,因子安排的分数复制,优生学年鉴,12,291-303(1945)·Zbl 0063.01376号
[10] 弗兰克,I.E。;Friedman,J.H.,《一些化学计量学回归工具的统计观点》,技术计量学,35,109-135(1993)·Zbl 0775.62288号
[11] 弗里德曼,J。;哈斯蒂,T。;Höfling,H。;Tibshirani,R.,路径坐标优化,应用统计学年鉴,1,302-332(2007)·Zbl 1378.90064号
[12] 弗里德曼,J。;哈斯蒂,T。;Tibshirani,R.,《统计学习的要素》(2001),纽约:施普林格出版社,纽约·Zbl 0973.62007号
[13] GLMNET:Lasso和Elastic-Net正则化广义线性模型,R包版本1(2009)
[14] ---,通过坐标下降的广义线性模型的正则化路径,统计软件杂志,33,1(2010)
[15] Fu,W.J.,《惩罚回归:桥梁与拉索》,《计算与图形统计杂志》,第7397-416页(1998年)
[16] 雅各布·L。;Obozinski,G。;Vert,J.-P.,Group Lasso with Overlap and Graph Lasso,第26届机器学习国际年会论文集,433-440(2009)
[17] Lange,K.,《统计学家数值分析》(2010),纽约:Springer Science&Business Media·兹比尔1258.62003
[18] Lee,S。;Breheny,P.,《非凸惩罚的强规则及其对高维回归高效算法的影响》,《计算与图形统计杂志》,241074-1091(2015)
[19] Lekivetz,R。;Jones,B.,《非矩形区域的快速柔性空间填充设计》,国际质量与可靠性工程,31829-837(2015)
[20] 马克·S。;Joseph,V.R.,使用聚类的Minimax和Minimax投影设计,计算与图形统计杂志,27,166-178(2017)·Zbl 07498976号
[21] Mazumder,R。;弗里德曼,J.H。;Hastie,T.,《SparseNet:协调下降与非凸惩罚》,《美国统计协会杂志》,1061125-1138(2011)·Zbl 1229.62091号
[22] Mazumder,R。;哈斯蒂,T。;Friedman,J.,《稀疏:通过非凸优化拟合稀疏线性回归模型》,R包第1版(2012年)
[23] Meier,L。;Van De Geer,S。;Bühlmann,P.,The Group Lasso for Logistic Regression,英国皇家统计学会杂志,70,53-71(2008)·Zbl 1400.62276号
[24] 蒙哥马利,D.C.,实验设计与分析(2008),纽约:威利,纽约
[25] Rosenbloom,A.L。;Joe,J.R。;Young,R.S。;Winter,W.E.,《青少年中新出现的2型糖尿病流行》,糖尿病护理,22,345-354(1999)
[26] 西蒙,N。;弗里德曼,J。;哈斯蒂,T。;Tibshirani,R.,《稀疏群拉索》,《计算与图形统计杂志》,22,231-245(2013)
[27] 苏,H。;Wu,C.F.J.,CME分析:一种在二级分数析因实验中消除重叠效应的新方法,质量技术杂志,49,1-10(2017)
[28] Tibshirani,R.,《通过拉索进行回归收缩和选择》,《皇家统计学会杂志》,58267-288(1996)·Zbl 0850.62538号
[29] ---,Cox模型中变量选择的Lasso方法,医学统计学,16385-395(1997)
[30] Tibshirani,R。;比恩,J。;弗里德曼,J。;哈斯蒂,T。;西蒙,N。;泰勒,J。;Tibshirani,R.J.,《拉索型问题中丢弃预测因子的强规则》,英国皇家统计学会杂志,74245-266(2012)·Zbl 1411.62213号
[31] 韦伯,K。;艾斯曼,R。;希金斯,S。;莫雷,L。;A.帕蒂。;陶斯克,M。;曾振白,果蝇2号染色体上影响翅膀形状的多基因分析,遗传学,1591045-1057(2001)
[32] Wu,C.F.J.,《后费希尔实验:从物理到虚拟》,美国统计协会杂志,110,612-620(2015)·Zbl 1373.62589号
[33] 吴长凤。;Hamada,M.S.,《实验:规划、分析和优化》(2009),纽约:威利·Zbl 1229.62100号
[34] Wu,T.T。;Lange,K.,拉索惩罚回归的坐标下降算法,应用统计年鉴,224-244(2008)·Zbl 1137.62045号
[35] 袁,M。;Lin,Y.,分组变量回归中的模型选择和估计,《皇家统计学会杂志》,68,49-67(2006)·Zbl 1141.62030号
[36] Zhang,C.-H.,极小极大凹罚下的几乎无偏变量选择,《统计学年鉴》,38894-942(2010)·Zbl 1183.62120号
[37] 赵,P。;Yu,B.,关于Lasso的模型选择一致性,机器学习研究杂志,7,2541-2563(2006)·Zbl 1222.62008年
[38] 邹,H。;Hastie,T.,《通过弹性网进行正则化和变量选择》,《皇家统计学会杂志》,67301-320(2005)·Zbl 1069.62054号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。