×

分层病例组设计加性风险模型中的正则化变量选择过程。 (英语) Zbl 1468.62362号

小结:病例-对照设计通常用于大型流行病学研究,以降低与协变量测量相关的成本。在许多这样的研究中,协变量的数量非常大。对于只在样本子集中观察到协变量的病例组研究,需要一种有效的变量选择方法。目前关于这一主题的文献主要集中在比例风险模型上。然而,在许多研究中,相加风险模型优于比例风险模型,这是因为违反了比例风险假设,或者相加风险模式为研究问题提供了更多相关信息。受一项此类研究——社区动脉粥样硬化风险(ARIC)研究的启发,我们在一个具有发散参数的加性风险模型下,研究了分层病例组设计中正则化变量选择过程的性质。我们建立了惩罚估计量的一致性和渐近正态性,并证明了它的预言性质。采用改进的交叉验证调谐参数选择方法进行了仿真研究,以评估所提方法的有限样本性能。我们将变量选择程序应用于ARIC研究,以证明其实际应用。

MSC公司:

62号02 生存分析和删失数据中的估计
62J07型 岭回归;收缩估计器(拉索)
62页第10页 统计学在生物学和医学中的应用;元分析
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Aalen O(1980)计数过程的非参数回归分析模型。统计学课堂讲稿2。施普林格,纽约·Zbl 0445.62095号 ·doi:10.1007/978-1-4615-7397-5_1
[2] Akaike,H,高斯自回归滑动平均模型的最大似然识别,生物统计学,60255-265,(1973)·Zbl 0318.62075号 ·doi:10.1093/biomet/60.2.255
[3] Ballantyne,CM;胡格芬,RC;砰,H;科雷什,J;福尔森,AR;海斯,G;Sharrett,AR,脂蛋白相关磷脂酶a2,高敏c-反应蛋白,以及社区动脉粥样硬化风险(ARIC)研究中中年男性和女性冠心病发病风险,《循环》,109837-842,(2004)·doi:10.1161/01.CIR.0000116763.91992.F1
[4] 博根,O;兰霍兹,B;萨缪尔森,SO;戈尔茨坦,L;Pogoda,J,暴露分层病例组设计,寿命数据分析,6,39-58,(2000)·Zbl 0948.62069号 ·doi:10.1023/A:1009661900674
[5] Cox,DR,回归模型和生命表,J R Stat Soc Ser B,34187-220,(1972)·兹比尔0243.62041
[6] 克雷文,P;Wahba,G,用样条函数平滑噪声数据:用广义交叉验证方法估计平滑的正确程度,数值数学,31377-403,(1979)·Zbl 0377.65007号 ·doi:10.1007/BF01404567
[7] 风扇,J;Li,R,通过非冲突惩罚似然选择变量及其预言性质,美国统计协会,96,1348-1360,(2001)·Zbl 1073.62547号 ·doi:10.1198/016214501753382273
[8] Hastie T、Tibshirani R、Friedman J(2009)《统计学习的要素:数据挖掘、推理和预测》,第2版。纽约州施普林格·Zbl 1273.62005年 ·doi:10.1007/978-0-387-84858-7
[9] Huber,PJ,《稳健回归:渐近、猜想和蒙特卡罗》,《Ann Stat》,第1799-821页,(1973)·Zbl 0289.62033号 ·doi:10.1214/aos/1176342503
[10] 康,S;蔡,J;Chambless,L,具有多种疾病结局的病例组研究的边际加性风险模型:在社区动脉粥样硬化风险研究中的应用,生物统计学,14,28-41,(2013)·doi:10.1093/biostatistics/kxs025
[11] 库利希,M;Lin,D,病例组研究的加性危险回归,生物统计学,87,73-87,(2000)·Zbl 0974.62104号 ·doi:10.1093/biomet/87.1.73
[12] 林,D;Ying,Z,加性风险模型的半参数分析,Biometrika,81,61-71,(1994)·Zbl 0796.62099号 ·doi:10.1093/biomet/81.1.61
[13] 林,W;Lv,J,高维稀疏加性风险回归,美国统计协会,108,247-264,(2013)·Zbl 06158340号 ·doi:10.1080/01621459.2012.746068
[14] 马丁努森,T;Scheike,TH,半参数加性风险模型的协变量选择,Scand J Stat,36,602-619,(2009)·Zbl 1224.62104号 ·doi:10.1111/j.1467-9469.2009.00650.x
[15] 镍,A;蔡,J;Zeng,D,失败时间结果的病例组研究变量选择,Biometrika,103,547-562,(2016)·兹比尔1506.62453 ·doi:10.1093/biomet/asw027
[16] Prentice,RL,《流行病学队列研究和疾病预防试验的病例组设计》,Biometrika,73,1-11,(1986)·Zbl 0595.62111号 ·doi:10.1093/biomet/73.1.1
[17] Tibshirani,R,通过套索进行回归收缩和选择,J R Stat Soc Ser B,58267-288,(1996)·Zbl 0850.62538号
[18] 元,M;Lin,Y,分组变量回归中的模型选择和估计,J R Stat Soc Ser B,68,49-67,(2006)·Zbl 1141.62030号 ·doi:10.1111/j.1467-9868.2005302.x
[19] 曾,L;谢,J,通过scad-l2选择组变量,统计学,48,49-66,(2014)·Zbl 1367.62222号 ·doi:10.1080/02331888.2012.719513
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。