×

当部分观察到真实事件数据时,一种用于估计竞争风险环境中错误分类概率的伪似然方法。 (英语) Zbl 1464.62470号

总结:结果错误分类在二元结果研究中经常发生,并可能导致对数量的偏差估计,如发病率、患病率、特定原因危害、累积发病率函数等。已经提出了一些补救措施,以解决此类数据中结果的潜在错误分类。这些补救措施大多在于错误分类概率的估计,而错误分类概率反过来又用于调整结果错误分类的分析。许多作者主张对研究内部的样本使用金标准程序,以了解错误分类的程度。通过这种类型的内部验证,量化错误分类的问题也成为了一个缺失数据的问题,因为通过设计,真正的结果只能在整个研究样本的子集上确定。尽管估计误分类概率的过程在概念上看起来很简单,但迄今为止提出的估计方法在方法和实践上都存在一些缺陷。大多数方法依赖于缺失的结果数据完全随机缺失(MCAR),这是一个相当严格的假设,在实践中不太可能成立。现有的一些方法也往往是计算密集型的。为了解决这些问题,我们在具有可用内部验证样本的研究中,提出了一种在随机缺失(MAR)假设下误分类概率的计算效率高、易于实现的伪似然估计。我们通过具有竞争风险结果的研究来呈现估计器,尽管估计器超出了这种设置。我们描述了所得估计的相合性和渐近分布性质,并导出了其方差的闭式估计。通过仿真评估了该估计器的有限样本性能。使用来自具有竞争风险结果的真实世界研究的数据,我们说明了如何使用所提出的方法来估计误分类概率。我们还展示了如何在外部研究中使用估计的误分类概率来调整建模累积关联函数时可能的误分类偏差。

理学硕士:

62页第10页 统计学在生物学和医学中的应用;元分析
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] An,M.W.、Frangakis,C.E.、Musick,B.S.和Yiannoutsos,C.T.(2009年)。生存研究中双抽样设计的必要性:监测PEPFAR的应用。生物统计学,65(1),301-306·兹比尔1159.62329
[2] Bakoyannis,G.、Siannis,F.和Touloumi,G.(2010年)。用缺失的故障原因对竞争风险数据进行建模。医学统计学,29(30),3172-3185。
[3] Bakoyannis,G.和Touloumi,G.(2012年)。竞争风险数据的实用方法:综述。医学研究中的统计方法,21(3),257-272·Zbl 1242.62116号
[4] Bakoyannis,G.和Yiannoutsos,C.T.(2015)。累积发病率估计中结果错误分类的影响和纠正。《公共科学图书馆·综合》,10(9),e0137544。
[5] Bakoyannis,G.、Zhang,Y.和Yiannoutsos,C.T.(2019年)。缺失吸收状态马尔可夫过程的非参数推断。中国统计,29(4),2083-2104。https://doi.org/10.5705/ss.202017.0175 ·Zbl 1434.62036号 ·doi:10.5705/ss.202017.0175
[6] Bakoyannis,G.、Zhang,Y.和Yiannoutsos,C.T.(2020年)。失效原因缺失下竞争风险数据的半参数回归和风险预测。终身数据分析。https://doi.org/10.1007/s10985‐020‐09494‐1 ·Zbl 1457.62305号 ·doi:10.1007/s10985‐020‐09494‐1
[7] Barron,B.A.(1977年)。错误分类对相对风险估计的影响。生物统计学,33(2),414-418·Zbl 0361.92012号
[8] Beyersmann,J.、Latouche,A.、Buchholz,A.和Schumacher,M.(2009年)。在生存分析中模拟竞争风险数据。医学统计学,28(6),956-971。
[9] Brinkhof,M.W.G.、Spycher,B.D.、Yiannoutsos,C.、Weigel,R.、Wood,R.和Messou,E.…国际流行病学数据库评估艾滋病(IeDEA)(2010年)。根据损失调整死亡率以进行跟进:对撒哈拉以南非洲五个艺术项目的分析。《公共科学图书馆·综合》,5(11),e14149。
[10] 布罗斯,I.(1954)。2 x 2表格中的错误分类。生物统计学,10(4),478-486·Zbl 0058.13103号
[11] Carroll,R.J.、Ruppert,D.、Stefanski,L.A.和Crainiceanu,C.(2006年)。非线性模型中的测量误差:现代视角。美国佛罗里达州博卡拉顿,CRC出版社·Zbl 1119.62063号
[12] Chen,Y.‐H。(2000). 杂项。替代结果数据的稳健插补方法。《生物特征》,87(3),711-716·Zbl 0956.62049号
[13] Dempster,A.P.、Laird,N.M.和Rubin,D.B.(1977年)。通过EM算法从不完整数据中获得最大似然。英国皇家统计学会杂志。B系列(方法学),39(1),1-22·Zbl 0364.62022号
[14] Edwards,J.K.、Bakoyannis,G.、Yiannoutsos,C.T.、Mburu,M.W.和Cole,S.R.(2019年)。使用外部验证数据对结果错误分类下的累积发病率函数进行非参数估计。医学统计学,38(29),5429-5564。
[15] Edwards,J.K.、Cole,S.R.、Troester,M.A.和Richardson,D.B.(2013)。利用多重插补和内部验证数据解释二元回归模型中的错误分类结果。美国流行病学杂志,177(9),904-912。
[16] Egger,M.、Spycher,B.D.、Sidle,J.、Weigel,R.、Geng,E.H.、Fox,M.P.…《国际环境与经济研究所》(IeDEA East)、非洲、西非和南部非洲(2011)。校正因随访损失导致的死亡率:撒哈拉以南非洲抗逆转录病毒治疗计划的列线图。《公共科学图书馆医学》,8(1),e1000390。
[17] Geng,E.H.、Emenyonu,N.、Bwana,M.B.、Glidden,D.V.和Martin,J.N.(2008)。基于抽样的方法,用于确定在非洲抗逆转录病毒治疗扩大计划中失去随访的患者的结果。JAMA,300(5),506-507。
[18] Gong,G.和Samaniego,F.J.(1981年)。伪最大似然估计:理论与应用。《统计年鉴》,9(4),861-869·Zbl 0471.62032号
[19] 格陵兰,S.(1988)。错误分类下流行病学效应估计的方差估计。医学统计学,7(7),745-757。
[20] Hardt,J.、Herke,M.和Leonhart,R.(2012)。缺失X的回归中多重插补的辅助变量:小样本研究中包含过多辅助变量的警告。BMC医学研究方法,12(1),第184条。
[21] Lin,D.Y.,Wei,L.J.,&Ying,Z.(2002)。基于累积残差的模型检查技术。生物统计学,58(1),1-12·Zbl 1209.62168号
[22] Little,R.J.A.和Rubin,D.B.(2014)。缺失数据的统计分析(第333卷)。纽约州纽约市:Wiley。
[23] Lu,K.和Tsiatis,A.A.(2001年)。在失效原因缺失的竞争风险模型中估计回归系数的多重插补方法。生物统计学,57(4),1191-197·Zbl 1209.62223号
[24] Lyles,R.H.和Lin,J.(2010年)。通过似然法和预测值加权对逻辑回归中的误分类进行敏感性分析。医学统计,29(22),2297-2309。
[25] Lyles,R.H.、Tang,L.、Superak,H.M.、King,C.C.、Celentano,D.D.、Lo,Y.和Sobel,J.D.(2011)。逻辑回归中基于验证数据的结果错误分类调整:一个示例。流行病学,22(4),589-597。
[26] Magder,L.S.和Hughes,J.P.(1997年)。用不确定性衡量结果时的逻辑回归。《美国流行病学杂志》,146(2),195-203。
[27] 孟,X.‐L。(1994). 输入来源不一致的多重插补推断。统计科学,9(4),538-558。
[28] Neuhaus,J.M.(1999)。二元回归中因错误分类响应导致的偏差和效率损失。《生物特征》,86(4),843-855·Zbl 0942.62074号
[29] Parke,W.R.(1986)。伪最大似然估计:渐近分布。《统计年鉴》,14(1),355-357·Zbl 0588.62030号
[30] Pepe,M.S.(1992年)。使用替代结果数据和验证样本进行推断。《生物统计学》,79(2),355-365·Zbl 0751.62049号
[31] Putter,H.、Fiocco,M.和Geskus,R.B.(2007年)。生物统计教程:竞争风险和多状态模型。医学统计学,26(11),2389-2430。
[32] Robins,J.M.和Wang,N.(2000年)。插补估计量的推论。《生物特征》,87(1),113-124·Zbl 0974.62016
[33] 鲁宾,D.B.(1976年)。推断和缺失数据。《生物特征》,63(3),581-592·Zbl 0344.62034号
[34] Spiegelman,D.(2010年)。环境流行病学中暴露评估的不确定性方法。《公共卫生年度回顾》,31(1),149-163。
[35] Tang,L.、Lyles,R.H.、King,C.C.、Celentano,D.D.和Lo,Y.(2015)。二元回归与不同的错误分类反应和暴露变量。医学统计学,34(9),1605-1620。
[36] Tenenbein,A.(1970年)。一种双采样方案,用于从有误分类的二项式数据进行估计。美国统计协会杂志,65(331),1350-1361。
[37] Tilling,K.、Williamson,E.J.、Spratt,M.、Sterne,J.A.C.和Carpenter,J.R.(2016)。需要适当纳入相互作用,以避免多重插补中的偏见。临床流行病学杂志,80,107-115。
[38] Touloumis,A.(2016)。在边际模型规范下模拟相关的二进制和多项式响应:simcormultres包。R期刊,8,79-91。
[39] Wacholder,S.(1996)。设计缺失数据的病例对照研究:估计风险差异。流行病学,7(2),144-150。
[40] Yiannoutsos,C.T.,An,M.‐W。,Frangakis,C.E.、Musick,B.S.、Braitstein,P.、Wools‐Kaloustian,K.…Kimaiy,S.(2008)。改进辍学患者死亡率估计的基于抽样的方法:肯尼亚西部一个由PEPFAR资助的大型项目的经验。《公共科学图书馆·综合》,3(12),e3843。
[41] Zhang,G.和Little,R.(2009年)。惩罚样条倾向预测插补方法的推广。生物统计学,65(3),911-918·Zbl 1172.62071号
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。