×

一种弱信号辅助的变量选择和统计推断程序,带有信息子样本。 (英语) Zbl 1520.62191号

摘要:本文的动机来自一项HIV-1耐药性研究,在该研究中,我们遇到了三个分析挑战:用信息子样本分析数据,考虑弱信号,检测重要信号,并进行统计推断。我们从一种初始估计方法开始,该方法采用惩罚的两两条件似然方法进行变量选择。该初始估计器包含了信息性子样本问题。为了解释弱信号的影响,我们使用了偏岭回归的关键思想。我们还提出了对每个信号系数的一步估计方法,然后相应地构造置信区间。我们将该方法应用于斯坦福HIV-1耐药性研究,并将结果与现有方法进行比较。我们还进行了全面的仿真研究,以证明我们提出的方法的优越性能。
{©2020国际生物识别学会}

MSC公司:

62页第10页 统计学在生物学和医学中的应用;元分析
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Abraham,A.G.,Lau,B.,Deeks,S.,Moore,R.D.,Zhang,J.,Eron,J.等人(2011年)北美抗逆转录病毒药物治疗患者中累积人体免疫缺陷病毒耐药性流行率估计缺失数据。《美国流行病学杂志》,174727-735。
[2] Abzug,M.J.、Qin,M.、Levin,M.J..、Fenton,T.、Beeler,J.A.、Bellini,W.J.等人(2012年)接受高效抗逆转录病毒治疗的HIV感染儿童麻疹再次接种后的免疫原性、免疫记忆和安全性。《传染病杂志》,206,512-522。
[3] Bickel,P.J.(1975)线性模型中的一步Huber估计。美国统计协会杂志,70428-434·Zbl 0322.62038号
[4] Cai,T.和Liu,W.(2011)稀疏线性判别分析的直接估计方法。美国统计协会杂志,106,1566-1577·Zbl 1233.62129号
[5] Candes,E.和Tao,T.(2007)Dantzig选择器:当p远大于n时的统计估计。《统计年鉴》,35,2313-2351·Zbl 1139.62019号
[6] Clavel,F.和Hance,A.J.(2004)艾滋病毒耐药性。《新英格兰医学杂志》,3501023-1035。
[7] Crum‐Cianflone,N.F.和Wallace,M.R.(2014)艾滋病毒感染成人的疫苗接种。艾滋病患者护理和性病,28397-410。
[8] Donoho,D.和Jin,J.(2008)更高的批评阈值:当有用的特征很少且较弱时的最佳特征选择。《美国国家科学院院刊》,105,14790-14795·Zbl 1357.62212号
[9] Efron,B.(2014)模型选择后的估计和准确性。美国统计协会杂志,109991-1007·Zbl 1368.62071号
[10] Fan,J.和Li,R.(2001)通过非洞穴惩罚似然的变量选择及其预言性质。美国统计协会杂志,96,1348-1360·Zbl 1073.62547号
[11] Gao,X.、Ahmed,S.和Feng,Y.(2017)高维数据分析的选择后收缩估计(含讨论)。《商业和工业中的应用随机模型》,33,97-135·Zbl 1411.62200号
[12] Javanmard,A.和Montanari,A.(2014)高维回归的置信区间和假设检验。机器学习研究杂志,152869-2909·Zbl 1319.62145号
[13] K.K.奈特和W.傅(2000)拉索型估计量的渐近性。《统计年鉴》第1356-1378页·Zbl 1105.62357号
[14] Lee,J.D.、Sun,D.L.、Sun,Y.和Taylor,J.E.(2016)《精确的选择后推断,以及对拉索的应用》。《统计年鉴》,44907-927·Zbl 1341.62061号
[15] Li,Y.,Hong,H.G.,Ahmed,S.E.和Li,Y(2019)高维回归中的弱信号:检测、估计和预测。商业和工业中的应用随机模型,35283-298·Zbl 1436.62341号
[16] Liang,K.-Y。和Qin,J.(2000)非标准情况下的回归分析:成对伪似然方法。英国皇家统计学会杂志:B辑(统计方法),62773-786·Zbl 0963.62068号
[17] Lockhart,R.、Taylor,J.、Tibshirani,R.J.和Tibshilani,R.(2014)拉索的显著性检验。统计年鉴,42413·Zbl 1305.62254号
[18] Markman,M.和Bookman,M.A.(2000)卵巢癌二线治疗。肿瘤学家,5,26-35。
[19] Minnier,J.、Tian,L.和Cai,T.(2011)正则回归估计推断的扰动方法。美国统计协会杂志,1061371-1382·Zbl 1323.62076号
[20] Ning,Y.和Liu,H.(2017)稀疏高维模型的假设检验和置信区的一般理论。《统计年鉴》,45158-195·Zbl 1364.62128号
[21] Rhee,S.‐Y。,Gonzales,M.J.、Kantor,R.、Betts,B.J.、Ravela,J.和Shafer,R.W.(2003)人类免疫缺陷病毒逆转录酶和蛋白酶序列数据库。核酸研究,31298-303。
[22] Rhee,S.‐Y。,Taylor,J.、Wadhera,G.、Ben‐Hur,A.、Brutlag,D.L.和Shafer,R.W.(2006)人类免疫缺陷病毒1型耐药性的基因型预测因子。《美国国家科学院院刊》,103,17355-17360。
[23] Shafer,R.W.(2006)公共HIV耐药性数据库的原理和使用。传染病杂志,194,S51-S58。
[24] Shi,P.和Qu,A.(2017)惩罚模型选择中的弱信号识别和推理。《统计年鉴》,第45期,第1214-1253页·Zbl 1371.62025号
[25] Teles,R.、Benecha,H.K.、Preisser,J.S.、Moss,K.、Starr,J.R.、Corby,P.等(2016)对临床附着丧失的变化进行建模,以对牙周疾病进展进行分类。临床牙周病学杂志,43426-434。
[26] Tibshirani,R.(1996)通过Lasso回归收缩和选择。英国皇家统计学会杂志。B系列(方法学),58267-288·Zbl 0850.62538号
[27] Tibshirani,R.J.、Taylor,J.、Lockhart,R.和Tibshilani,R.(2016)序列回归程序的精确选择后推断。美国统计协会杂志,111600-620。
[28] Van de Geer,S.,Bühlmann,P.,Ritov,Y.和Dezeure,R.(2014)关于高维模型的渐近最优置信区和检验。《统计年鉴》,第42期,第1166-1202页·兹比尔1305.62259
[29] Weng,H.、Feng,Y.和Qiao,X.(2019)超高维线性回归模型中保留后的正则化。中国统计局,29387-407·Zbl 1412.62098号
[30] Wensing,A.M.、Calvez,V.、Günthard,H.F.、Johnson,V.A.、Paredes,R.、Pillay,D.、Shafer,R.W.和Richman,D.D.(2017)2017年HIV‐1耐药突变更新。抗病毒医学专题,24132-133。
[31] Wesolowski,R.、Lee,C.和Kim,R.(2009)二线化疗在晚期胃癌中有作用吗?《柳叶刀肿瘤学》,10903-912。
[32] Wu,M.(2009)。LASSO正则回归中回归系数的参数置换检验。马萨诸塞州波士顿哈佛公共卫生学院生物统计系博士论文。
[33] Zhang,C.‐H。(2010)极小极大凹惩罚下的几乎无偏变量选择。《统计年鉴》,38894-942·Zbl 1183.62120号
[34] Zhang,C.‐H。Zhang,S.S.(2014)高维线性模型中低维参数的置信区间。英国皇家统计学会杂志:B辑(统计方法),76217-242·Zbl 1411.62196号
[35] Zhao,J.和邵,J.(2017)具有一般缺失数据机制的广义线性模型的近似条件似然。系统科学与复杂性杂志,30139-153·Zbl 1370.93265号
[36] 赵,J.,杨,Y.和宁,Y.(2018)不可忽略缺失数据变量选择的惩罚配对伪似然。中国统计局,282125-2148·Zbl 1406.62078号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。