×

生存分析中的低维混杂调整和高维惩罚估计。 (英语) Zbl 1372.62089号

摘要:高通量分析现在在生物医学研究中很常见。在本文中,我们考虑了由失败时间响应和基因表达测量组成的病因学研究的布局。在目前的实践中,一种被广泛采用的方法是根据初步边缘筛选和后续惩罚回归来选择基因,以建立模型。混淆因素,包括例如临床风险因素和环境暴露,通常存在,需要适当解释。我们提出了加速失效时间模型下的协变量调整筛选和变量选择程序。在惩罚高维系数以获得简约模型形式的同时,我们的程序还适当调整低维混杂效应以实现更准确的回归系数估计。我们建立了我们提出的方法的渐近性质,并进行了仿真研究以评估有限样本性能。我们的方法已说明通过真实的基因表达数据分析,适当调整混杂因素会产生更有意义的结果。

MSC公司:

62页第10页 统计学在生物学和医学中的应用;元分析
62G08号 非参数回归和分位数回归
6220国集团 非参数推理的渐近性质
62纳米02 生存分析和删失数据中的估计
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Cai T,Huang J,Tian L(2009)加速失效时间模型的正则化估计。生物统计学65:394-404·兹比尔1274.62736 ·doi:10.1111/j.1541-0420.2008.01074.x
[2] Cheng MY,Zhang W,Chen LH(2009)广义多参数似然模型的统计估计。美国统计协会杂志104:1179-1191·Zbl 1388.62160号 ·doi:10.1198/jasa.2009.tm08430
[3] Cheng MY,Honda T,Zhang JT(2015)稀疏超高维变系数模型的正向变量选择。美国统计协会期刊:1410.6556·Zbl 1162.62037号
[4] Fan J,Li R(2001)基于非倒谱惩罚似然的变量选择及其预言性质。美国统计学会杂志96:1348-1360·Zbl 1073.62547号 ·doi:10.1198/016214501753382273
[5] Fan J,Lv J(2008)超高维特征空间的确定独立筛选。J R Stat Soc B系列70:849-911·Zbl 1411.62187号 ·doi:10.1111/j.1467-9868.2008.00674.x
[6] Gordis L(2008)《流行病学》,第4版。费城桑德斯
[7] Huang J,Ma S,Xie H(2006)高维协变量加速失效时间模型中的正则化估计。生物统计学62:813-820·Zbl 1111.62090号 ·文件编号:10.1111/j.1541-0420.2006.00562.x
[8] Johnson BA,Lin DY,Zeng D(2008)半参数回归模型中的惩罚估计函数和变量选择。美国统计协会期刊103:672-680·Zbl 1471.62330号 ·doi:10.1198/0162145000000184
[9] Li J,Ma S(2010)重复测量和治愈亚组的间隔相关数据。应用统计59:693-705
[10] Lian H,Li J,Tang X(2014)具有超高维线性部分的加性部分线性比例风险模型中的SCAD惩罚回归。多变量分析杂志125:50-64·Zbl 1359.62130号 ·doi:10.1016/j.jmva.2013.12.002
[11] Lu Y,Lemon W等人(2006年)基因表达特征可预测状态i非小细胞肺癌患者的生存率。《公共科学图书馆·医学》3:2229-2243·doi:10.1371/journal.pmed.0030467
[12] Shao F,Li J,Ma S,Lee M-LT(2014)具有治愈比例的区间删失数据的半参数变系数模型。统计医学33:1700-1712·数字对象标识代码:10.1002/sim.6054
[13] Stute W(1993)存在协变量时随机审查下的一致估计。多变量分析杂志45:89-103·Zbl 0767.62036号 ·doi:10.1006/jmva.1993.1028
[14] VanderWeele TJ,Shpitser I(2013),关于混杂因素的定义。Ann统计41:196-220·Zbl 1347.62017年 ·doi:10.1214/12-AOS1058
[15] Xie Y,Huang J(2009)高维部分线性模型中的SCAD惩罚回归。安统计37:673-696·Zbl 1162.62037号 ·doi:10.1214/07-AOS580
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。