×

与暴露变量进行高维交互的稀疏加性模型。 (英语) Zbl 07708440号

摘要:新疾病发病的概念范式通常被认为是整个生物网络发生变化的结果,其状态受到遗传和环境因素的复杂交互作用的影响。然而,当将相关表型建模为高维测量的函数时,估计相互作用的能力很低,可能的相互作用数量可能巨大,其影响可能是非线性的。提出了一种检测高维环境中关键环境或暴露变量与强或弱遗传约束非线性相互作用的方法。已经证明,渐近地,它具有预言性质,即,它的性能与预先知道真实模型时的性能一样好。提出了一种计算效率高的拟合算法,该算法具有自动调整参数选择功能,可扩展到高维数据集。仿真结果表明,当与暴露变量存在非线性交互作用时,在预测精度和支持恢复方面,该方法优于现有的惩罚回归方法。应用于检测基因之间的非线性相互作用,以及对4岁儿童认知能力的产前心理社会干预计划。结果表明,在基因上倾向于教育程度较低的人是那些从干预中受益最多的人。所提出的算法在CRAN上可用的R包中实现(https://cran.r-project.org/web/packages/sail/index.html).

MSC公司:

62-08 统计问题的计算方法
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] 巴赫,F。;Jenatton,R。;Mairal,J。;Obozinski,G.,《通过凸优化实现结构化稀疏性》,《统计科学》。,27, 450-468 (2012) ·Zbl 1331.90050号
[2] 巴特纳加,S.R。;Yang,Y。;Khundrakpam,B。;埃文斯,A.C。;布兰切特,M。;Bouchard,L。;Greenwood,C.M.,《暴露交互作用下高维数据中可解释预测模型的分析方法》,Genet。流行病。,42, 233-249 (2018)
[3] Bien,J。;泰勒,J。;Tibshirani,R.,《层级互动套索》,《Ann.Stat.》,第41期,第1111-1141页(2013年)·Zbl 1292.62109号
[4] Bühlmann,P。;Van De Geer,S.,《高维数据统计:方法、理论和应用》(2011),施普林格科学与商业媒体·Zbl 1273.62015年
[5] Buuren,S.v.公司。;Groothuis-Oudshoorn,K.,《小鼠:通过r中的链式方程进行多元插补》,J.Stat.Softw。,1-68 (2010)
[6] F.A.坎贝尔。;Ramey,C.T.,《早期干预对智力和学术成就的影响:低收入家庭儿童的后续研究》,《儿童发展》,65,684-698(1994)
[7] Chipman,H.,具有相关预测因子的贝叶斯变量选择,加拿大。J.Stat.,24,17-36(1996)·Zbl 0849.62032号
[8] 新罕布什尔州Choi。;李伟(Li,W.)。;朱杰,强遗传约束变量选择及其预言性,美国统计学会,105,354-364(2010)·Zbl 1320.62171号
[9] Chouldechova,A。;Hastie,T.,广义加性模型选择(2015),arXiv预印本
[10] 康纳斯,A.F。;道森,N.V。;Desbiens,N.A。;Fulkerson,W.J。;Goldman,L。;Knaus,W.A。;Lynn,J。;Oye,R.K。;伯格纳,M。;Damiano,A.,改善严重iii住院患者护理的对照试验:了解预后和对治疗结果和风险的偏好的研究(支持),美国医学会杂志,2741591-1598(1995)
[11] Cox,D.R.,《相互作用》,《国际统计评论》,1-24(1984)·Zbl 0562.62061号
[12] 范,J。;Han,F。;刘浩,大数据分析的挑战,自然科学。第1版,293-314(2014)
[13] 范,J。;Li,R.,《通过非一致惩罚似然进行变量选择及其预言属性》,美国统计协会,96,1348-1360(2001)·兹比尔1073.62547
[14] 弗里德曼,J。;哈斯蒂,T。;Tibshirani,R.,通过坐标下降广义线性模型的正则化路径,J.Stat.Softw。,33, 1 (2010)
[15] 郝,N。;Feng,Y。;Zhang,H.H.,通过正则化选择高维二次回归模型,美国统计协会,113,615-625(2018)·Zbl 1398.62176号
[16] A.哈里斯。;肖杰,A。;Simon,N.,通过凸层次惩罚自适应截断的非参数回归,Biometrika,106,87-107(2019)·Zbl 1506.62281号
[17] A.哈里斯。;维滕,D。;Simon,N.,强遗传相互作用的凸模型,J.Compute。图表。统计,25,981-1004(2016)
[18] 哈斯蒂,T。;Tibshirani,R。;Wainwright,M.,《稀疏的统计学习:套索和泛化》(2015),CRC出版社·Zbl 1319.68003号
[19] Huang,J。;霍洛维茨,J.L。;Wei,F.,非参数加性模型中的变量选择,《Ann.Stat.》,38,2282-2313(2010)·Zbl 1202.62051号
[20] 林,M。;Hastie,T.,《通过分层群-群正则化学习交互》,J.Compute。图表。统计,24,627-654(2015)
[21] Lin,Y。;Zhang,H.H.,多元非参数回归中的成分选择与平滑,《统计年鉴》,342272-2297(2006)·Zbl 1106.62041号
[22] McCullagh,P。;Nelder,J.A.,《广义线性模型》,第37卷(1989年),CRC出版社·Zbl 0744.62098号
[23] Nardi,Y。;Rinaldo,A.,关于线性模型的群套索估计器的渐近性质,电子。J.Stat.,第2605-633页(2008年)·Zbl 1320.62167号
[24] 奥克贝,A。;波尚,J.P。;Fontana,医学硕士。;Lee,J.J。;Pers,T.H。;里特维尔,C.A。;特雷,P。;陈光斌。;埃米尔森,V。;Meddens,S.F.W.,《全基因组关联研究确定了74个与教育程度相关的基因座》,《自然》,533,539(2016)
[25] 奥尔兹,D。;亨德森·C·R。;科尔,R。;Eckenrode,J。;Kitzman,H。;Luckey,D。;佩蒂特,L。;Sidora,K。;莫里斯,P。;Powers,J.,护士家访对儿童犯罪和反社会行为的长期影响:一项随机对照试验的15年随访,美国医学会杂志,2801238-1244(1998)
[26] R: 《统计计算的语言和环境》(2017),R统计计算基金会:R奥地利维也纳统计计算基金
[27] 拉德琴科,P。;James,G.M.,《高维自适应非线性交互结构变量选择》,美国统计协会,105,1541-1553(2010)·Zbl 1388.62212号
[28] 拉维库马尔,P。;Lafferty,J。;刘,H。;Wasserman,L.,稀疏加性模型,J.R.Stat.Soc.,Ser。B、 统计方法。,71, 1009-1030 (2009) ·Zbl 1411.62107号
[29] 里特维尔,C.A。;梅德兰,S.E。;德林格,J。;杨,J。;Esko,T。;N.W.马丁。;韦斯特拉,H.J。;沙赫巴佐夫,K。;Abdellaoui,A。;Agrawal,A.,Gwas126559人鉴定了与教育程度相关的遗传变异,《科学》,3401467-1471(2013)
[30] Shah,R.D.,用回溯法模拟高维数据中的相互作用,J.Mach。学习。决议,17,1-31(2016)·Zbl 1434.62158号
[31] 她,Y。;Jiang,H.,《结构层次下的集团正则化估计》(2014),arXiv预印本
[32] Tibshirani,R.,《通过套索进行回归收缩和选择》,J.R.Stat.Soc.B,267-288(1996)·Zbl 0850.62538号
[33] Wang,H。;李·G。;Tsai,C.L.,回归系数和自回归阶数收缩以及通过套索选择,J.R.Stat.Soc.,Ser。B、 统计方法。,69, 63-78 (2007) ·Zbl 07555350号
[34] 赵,P。;罗查,G。;Yu,B.,分组和分级变量选择的复合绝对惩罚家族,Ann.Stat.,3468-3497(2009)·Zbl 1369.62164号
[35] Zou,H.,《自适应套索及其预言属性》,美国统计协会,101,1418-1429(2006)·Zbl 1171.62326号
[36] 邹,H。;Zhang,H.H.,关于参数发散的自适应弹性网,《统计年鉴》,37,1733-1751(2009)·兹比尔1168.62064
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。