×

高维协变量非线性相互作用广义可加系数模型中的估计和推断。 (英语) Zbl 1323.62033号

摘要:在低维情况下,由李雪(L.Xue)L.Yang(杨利伟)【Stat.Sin.16,No.4,1432-1446(2006年;Zbl 1109.62030号)]已被证明是研究变量非线性相互作用效应的有力工具。在本文中,我们提出了当变量的维数较高时GACM的估计和推理过程。具体地说,我们提出了一种基于分组惩罚的程序来区分“大(p)小(n)”设置的重要协变量。该程序与模型结构识别一致。此外,我们基于改进的两步样条估计,为所选模型中的系数函数同时构造置信带。我们还讨论了如何选择调谐参数。为了估计函数估计量的标准偏差,我们采用了平滑bootstrap方法。我们进行了模拟实验,以评估所提方法的数值性能,并分析了一个来自全基因组关联研究的肥胖数据集作为示例。

MSC公司:

62G08号 非参数回归和分位数回归
62G10型 非参数假设检验
6220国集团 非参数推理的渐近性质
62J02型 一般非线性回归
62J12型 广义线性模型(逻辑模型)
2012年12月62日 参数估计量的渐近性质
62页第10页 统计学在生物学和医学中的应用;元分析
92D10型 遗传学和表观遗传学

软件:

PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Carroll,R.J.、Fan,J.、Gijbels,I.和Wand,M.P.(1997年)。广义部分线性单指数模型。J.Amer。统计师。协会92 477-489·Zbl 0890.62053号 ·doi:10.2307/2965697
[2] Chen,J.和Chen,Z.(2008)。大模型空间模型选择的扩展贝叶斯信息准则。生物特征95 759-771·Zbl 1437.62415号 ·doi:10.1093/biomet/asn034
[3] Cheverud,J.M.(2001)。一种简单的校正方法,用于区间绘图基因组扫描中的多次比较。遗传(爱丁堡)87 52-58。
[4] Claeskens,G.和Van Keilegom,I.(2003年)。回归曲线及其导数的Bootstrap置信带。安。统计师。31 1852-1884. ·Zbl 1042.62044号 ·doi:10.1214/aos/1074290329
[5] Cörgő,M.和Révész,P.(1981)。概率统计中的强逼近。纽约学术出版社·Zbl 0539.60029号
[6] Dawber,T.R.、Meadors,G.F.和Moore,F.E.(1951年)。心脏病流行病学方法:Framingham 660研究。美国公共卫生杂志41 279-286。
[7] de Boor,C.(2001)。样条线实用指南,修订版,应用数学科学27。施普林格,纽约·Zbl 0987.65015号
[8] DeVore,R.A.和Lorentz,G.G.(1993)。构造近似。Grundlehren der Mathematischen Wissenschaften数学研究所303。柏林施普林格·Zbl 0797.41016号
[9] Efron,B.(2014)。模型选择后的估计和准确性。J.Amer。统计师。协会109 991-1007·Zbl 1368.62071号 ·doi:10.1080/01621459.2013.823775
[10] Fan,J.和Li,R.(2001)。通过非冲突惩罚似然及其oracle属性进行变量选择。J.Amer。统计师。协会96 1348-1360·Zbl 1073.62547号 ·doi:10.1198/016214501753382273
[11] Fan,Y.和Tang,C.Y.(2013)。高维惩罚似然中的调整参数选择。J.R.统计社会服务。B.统计方法。75 531-552. ·doi:10.1111/rssb.12001
[12] Hall,P.和Titterington,D.M.(1988)。非参数密度估计和回归中的置信带。《多元分析杂志》。27 228-254. ·Zbl 0664.62046号 ·doi:10.1016/0047-259X(88)90127-3
[13] Härdle,W.和Marron,J.S.(1991年)。非参数回归的Bootstrap同步误差条。安。统计师。19 778-796. ·兹比尔0725.62037 ·doi:10.1214操作系统/1176348120
[14] Horowitz,J.、Klemelä,J.和Mammen,E.(2006年)。加性回归模型中的最优估计。伯努利12 271-298·Zbl 1098.62043号 ·doi:10.3150/bj/1145993975
[15] Horowitz,J.L.和Mammen,E.(2004)。具有链接函数的可加性模型的非参数估计。安。统计师。32 2412-2443. ·Zbl 1069.62035号 ·doi:10.1214/009053604000000814
[16] 黄建中(2003)。多项式样条回归的局部渐近性。安。统计师。31 1600-1635. ·Zbl 1042.62035号 ·doi:10.1214/aos/1065705120
[17] Huang,J.、Horowitz,J.L.和Wei,F.(2010)。非参数可加模型中的变量选择。安。统计师。38 2282-2313. ·Zbl 1202.62051号 ·doi:10.1214/09-AOS781
[18] Jiang,B.和Liu,J.S.(2014)。通过分段逆回归选择一般指数模型的变量。安。统计师。42 1751-1786. ·Zbl 1305.62234号 ·doi:10.1214/14-AOS1233
[19] Knutson,K.L.(2012)。睡眠不足是否会导致肥胖?美国人体生物学杂志。24 361-371.
[20] Lam,C.和Fan,J.(2008)。参数发散数的轮廓核似然推断。安。统计师。36 2232-2260. ·Zbl 1274.62289号 ·doi:10.1214/07-AOS544
[21] Lee,Y.K.、Mammen,E.和Park,B.U.(2012年)。灵活的广义变系数回归模型。安。统计师。40 1906-1933. ·Zbl 1257.62040号 ·doi:10.1214/12-AOS1026
[22] Lian,H.(2012)。高维广义变系数模型的变量选择。统计师。中国22 1563-1588·Zbl 1253.62027号
[23] Liu,R.和Yang,L.(2010)。加性系数模型的样条拟合核平滑。计量经济学理论26 29-59·Zbl 1186.62134号 ·doi:10.1017/S0266466609090604
[24] Liu,R.、Yang,L.和Härdle,W.K.(2013)。广义可加模型的口头有效两步估计。J.Amer。统计师。协会108 619-631·Zbl 1534.62054号 ·doi:10.1080/01621459.2013.763726
[25] Ma,S.和Yang,L.(2011年a)。基于样条估计的跳转检测过程。J.非参数。统计数据23 67-81·Zbl 1359.62132号 ·doi:10.1080/10485250903571978
[26] Ma,S.和Yang,L.(2011年b)。部分线性可加模型的样条拟合核平滑。J.统计。计划。推断141 204-219·Zbl 1197.62130号 ·doi:10.1016/j.jspi.2010.05.028
[27] Ma,S.,Yang,L.和Carroll,R.J.(2012)。稀疏纵向回归的同时置信带。统计师。中国22 95-122·Zbl 1417.62088号
[28] Ma,S.、Carroll,R.J.、Liang,H.和Xu,S.(2015)。补充“高维协变量非线性相互作用的广义可加系数模型的估计和推断”·Zbl 1323.62033号 ·doi:10.1214/15-AOS1344
[29] Meier,L.和Bühlmann,P.(2007)。高维时程数据的平滑(l_{1})惩罚估计量。电子。《美国联邦法律大全》第1卷第597-615页·Zbl 1140.62054号 ·doi:10.1214/07-EJS103
[30] Meier,L.、van de Geer,S.和Bühlmann,P.(2009)。高维加性建模。安。统计师。37 3779-3821·Zbl 1360.62186号 ·doi:10.1214/09-AOS692
[31] Murcray,C.E.、Lewinger,J.P.和Gauderman,W.J.(2009)。全基因组关联研究中的基因-环境相互作用。美国流行病学杂志。169 219-226.
[32] Nyholt,D.R.(2004)。单核苷酸多态性连锁不平衡多重检测的简单修正。Am.J.Hum.遗传学。74 765-769之间。
[33] Randall,J.C.、Winkler,T.M.、Kutalik,Z.、Berndt,S.I.、Jackson,A.U.等人(2013年)。包括270000名个体的性别分层全基因组关联研究显示,人体测量特征的遗传位点存在性别二型性。PLOS遗传学9 e1003500。
[34] Ravikumar,P.、Lafferty,J.、Liu,H.和Wasserman,L.(2009年)。稀疏加性模型。J.R.统计社会服务。B.统计方法。71 1009-1030. ·文件编号:10.1111/j.1467-9868.2009.00718.x
[35] Wang,H.,Li,R.和Tsai,C.-L.(2007)。调整平滑剪裁绝对偏差方法的参数选择器。生物特征94 553-568·Zbl 1135.62058号 ·doi:10.1093/biomet/asm053
[36] Wang,L.,Xue,L.、Qu,A.和Liang,H.(2014)。协变量发散数相关数据广义加性部分线性模型的估计和模型选择。安。统计师。42 592-624. ·Zbl 1309.62077号 ·doi:10.1214/13-AOS1194
[37] Wareham,N.J.、van Sluijs,E.M.F.和Ekelund,U.(2005年)。体育活动与肥胖预防:当前证据综述。Proc Nutr Soc公司64 229-247。
[38] Xue,L.和Liang,H.(2010)。广义可加系数模型的多项式样条估计。扫描。《美国联邦法律大全》第37卷第26-46页·Zbl 1223.62134号 ·网址:10.1111/j.1467-9469.2009.00655.x
[39] Xue,L.和Yang,L.(2006)。基于多项式样条的可加系数建模。统计师。Sinica 16 1423-1446年·兹比尔1109.62030
[40] Zhou,S.、Shen,X.和Wolfe,D.A.(1998年)。回归样条和置信区域的局部渐近性。安。统计师。26 1760-1782. ·Zbl 0929.62052号 ·doi:10.1214操作系统/1024691356
[41] 邹华(2006)。自适应套索及其oracle属性。J.Amer。统计师。协会101 1418-1429·Zbl 1171.62326号 ·doi:10.1198/016214500000735
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。