总结

在对时间到事件数据的医学研究中,在估计治疗效果时,非比例危险和依赖性审查是非常常见的问题。处理时间依赖性处理效果的传统方法是对时间依赖性进行参数化建模。这种方法的局限性包括难以验证特定功能形式的正确性,以及在存在随时间变化的治疗效果的情况下,研究人员通常对累积效应而非瞬时效应感兴趣。在许多应用程序中,审查时间并不独立于事件时间。因此,我们提出了在存在非比例危害和相依审查的情况下估计累积治疗效果的方法。对于每个度量,我们提出了一个双逆加权估计器,该估计器首先使用逆处理概率加权(IPTW)来平衡特定于处理的协变量分布,然后使用逆截尾概率加权(IPCW)来克服依赖截尾。所提出的估计量被证明是一致的和渐近正态的。我们通过模拟研究了它们的有限样本性质。所提出的方法用于按种族比较肾脏等待期死亡率。

1.简介

在生存数据的临床和流行病学研究中,治疗效果不随时间变化是很常见的。在存在非比例危险的情况下考克斯(1972)模型经常被修改,从而假定处理效果随时间的特定函数而变化。然而,所选择的功能形式可能不正确。此外,研究人员通常对治疗效果依赖于时间的环境中的累积治疗效果更感兴趣。在不指定治疗效果的功能形式的情况下,可以使用Nelson–Aalen比较生存率或累积危险曲线(纳尔逊,1972年阿伦,1978年)估计员或Kaplan–Meier(卡普兰和迈耶,1958年)估计器。当治疗存在混杂因素时,这些估计值可能会导致有偏差的结果,这在观察性研究中经常发生。当审查时间取决于事件预测因素时,事件和审查时间通过这些因素关联。如果这些预后因素具有时间依赖性,并且如果它们不仅是事件的风险因素,而且受到治疗的影响,则协变量调整的标准方法可能会产生有偏见的治疗效果。如果对基线值而不是时间相关因素进行调整,标准回归方法仍然无效,因为事件和审查时间将因其与时间相关因素的相互关系而相关。

本研究旨在比较终末期肾病患者的等待生存期。种族(白种人与非裔美国人)对生存的影响值得关注,并且可能随时间而变化。存在需要调整的时间常数协变量(例如年龄、肾脏诊断)。此外,患者的住院史是等待期死亡率的预测因素,也会影响移植概率,因为住院次数越多的患者接受肾移植的可能性越小。尽管在肾移植后可能会观察到患者的死亡,但接受移植确实会审查等待期死亡率。因此,除非模型根据住院史进行调整,否则死亡率和审查将是相关的。然而,人们通常不想调整住院病史(例如,通过时间相关Cox模型),因为通过这种方法获得的种族效应没有很好的解释,可能比利益的边际种族效应更接近零。因此,在这种分析中有必要处理依赖性审查。注意,也可以通过G计算算法通过与时间相关的方法获得边际效应(罗宾斯,1986年,1987).

当前的方法在评估存在删失数据的累积治疗效果时,通常侧重于生存率或累积风险函数。然而,平均寿命往往是最相关的数量,尤其是因为临床医生经常根据患者的预期寿命来描述患者的预后。Zucker(1998)Chen和Tsiatis(2001)使用Cox比例风险模型比较了两个治疗组的限制平均寿命。通过对样本中所有受试者的平均值来评估各组的生存功能。这些方法要求对每个调整协变量保持相称性。

在不指定调整协变量影响的函数形式的情况下,可以应用治疗权重的逆概率(IPTW)来平衡调整协变量在治疗组之间的分布。Hernan、Brumback和Robins(2000年,2001)Robins、Hernan和Brumback(2000)使用边际结构模型估计与时间相关的暴露的因果效应。应用反向加权调整受先前治疗影响的时间依赖性混杂因素。在生存分析的背景下,作者假设风险在不同的治疗中是成比例的。关于相关的非参数方法,谢和刘(2005)假设事件时间和审查时间是独立的,开发了一个调整后的Kaplan–Meier曲线,使用反向加权处理潜在的混杂因素。

审查权重的逆概率(IPCW),由提出罗宾斯和罗特尼茨基(1992)罗宾斯(1993)在许多应用中,已被用于克服相关删失。假设事件时间为Cox比例风险模型,同时将删失权重的逆概率应用于Cox模型得分方程。权重可以看作是未检测剩余概率的倒数,可以用非参数或半参数的方法进行估计。罗宾斯和芬克尔斯坦(2000)描述了IPCW在处理依赖性审查方面的应用,该审查是通过将转换治疗的患者视为受审查的患者而引发的,与激发我们当前工作的数据集并无不同。IPCW方法已应用于其他各种情况(吉田、松山和大石,2007年松山和山口,2008年).

我们提出了在没有随机化和存在依赖性审查的情况下量化治疗累积效应的方法。开发了三种累积治疗效应度量:累积危险比、相对风险和限制平均寿命差异。建议的估计量是通过双重反加权计算的,其中IPTW用于平衡特定于处理的基线调整协变量分布,IPCW同时用于处理因时变因素而导致的不进行调整的相关删失。在对观测数据应用双重反权重后,对累积治疗效果的估计以非参数方式进行,从而消除了为治疗或调整协变量的效果指定函数形式的需要。

本文的其余部分组织如下。我们将在下一节中描述我们提出的方法。第3节,我们导出了我们提出的估计量的渐近性质;其证明见Web附录。我们在第4节.英寸第5节,我们将这些方法应用于从国家器官衰竭登记处获得的肾脏等待列表数据。讨论内容见第6节.

2.建议的方法

假设n个受试者包括在数据集中。D类是活动时间和C类是主题审查时间.让论坛论坛哪里(一个)是一个指示函数,当条件为一个保持,否则为0。观察到的事件和审查计数过程定义为论坛论坛分别是。风险指示器表示为论坛.让j个作为治疗组的指标(论坛),和组j个=0表示与其余治疗组进行比较的参考类别。G公司表示受试者的治疗组并设置G公司ij公司=(G公司=j个)。相应地,我们设置论坛论坛.观测数据包括n个独立且相同分布的向量,论坛,其中论坛Z(t吨)是一个论坛通常包含一些时间相关元素的协变量向量。我们让Z(0)表示基线时的协变量值。

我们假设没有未测量的基线(t吨=0)群体成员和死亡的预测因素,条件是Z(0). 我们还假设死亡和审查过程是有条件独立的,给定群体成员身份和论坛更具体地说,具有对象的死亡和审查危险功能定义为

我们分别假设

(1)
(2)

此外,我们假设审查没有未测量的混杂因素,

(3)

也就是说,审查的特定原因风险并不进一步取决于可能未观察到的死亡时间。在以时间相关协变量为特征的标准生存分析中,类似于(1)通常是假设的。我们需要条件(3)因为我们提出的方法需要建模论坛,稍后将介绍。

这种非测量混淆假设的合理性取决于手头数据的性质。在非随机治疗的环境中,这种情况可能永远不会准确发生。然而,如果协变量论坛足够丰富(例如,已收集到重要风险因素),则假设可能成立;至少在可以实现有意义推理的程度上。

请注意,我们这里使用的术语“治疗”相当笼统。实际上,G公司可以表示任何感兴趣的基线分类因子,包括一个未明确指定的因子。例如,在激励我们工作的例子中,感兴趣的因素是种族。事实上,种族不是随机(甚至分配)的因素,这引入了我们在中讨论的问题第6节现在,请注意我们的目标是获得有效的关联(而不是因果)推理。

在以下情况下Z(t吨)事件和审查不仅影响事件时间,也影响审查,除非Z(t吨)对事件进行显式建模。然而,人们通常倾向于调整Z(0),而不是Z(t吨)何时Z(t吨)至少部分是治疗的结果。描述治疗效果的一种常用方式是比较治疗后的平均存活率j个(与参考治疗相反)分配给整个人群。在治疗的环境中j个分配给所有受试者,平均生存函数如下所示S公司j个(t吨)=电子{S公司(t吨 | G公司=j个,Z(0))}. 预期是关于Z(0),以便对所有J型+1个治疗组。

比较治疗的累积效果j个针对参考处理,提出了三项措施。第一个建议的度量是累积危害的比率,

(4)

哪里论坛是当时的累积危险t吨.当治疗特定危害成比例时,论坛等于熟悉的危险比。第二个建议的度量是累积分布函数的比率,

(5)

哪里F类j个(t吨)=1−S公司j个(t吨)是按时间计算的平均死亡概率t吨,治疗时j个已分配。措施右后j个(t吨)是相对风险的过程版本,这是流行病学研究中经常估计的一个量。第三个建议的措施是限制平均寿命的差异,

(6)

哪里论坛是生存曲线(限制平均寿命)超过(0,t吨]. 这个论坛测量值等于治疗后生存曲线之间的面积j个(与治疗组0相比)分配给人群中的所有受试者。

论坛哪里论坛是1 by(j个−1)(第页+1) 元素为0的矩阵,用于论坛我们假设治疗分配遵循广义logits模型

哪里论坛。该模型可以扩展到包括交互项。最大似然估计论坛,表示为论坛,是的根论坛,其中

(7)

因为最好调整Z(0)而不是Z(t吨)事件和审查过程通过其与{Z(t吨):t吨>0}. 我们应用截尾权重的逆概率来处理相关截尾C类遵循带有危险函数的Cox模型

(8)

哪里论坛包含表示G公司Z(t吨)。时间的反向审查权重t吨表示为论坛,其中论坛.数量论坛估计依据为论坛,其中

论坛对于=0,1,2论坛、和论坛对于向量.数量论坛是的Breslow-Aalen估计量论坛.参数论坛通过部分似然估计(考克斯,1975年)由论坛,分数方程的解,论坛,其中

(9)

注意,如果治疗特定的审查风险不成比例,则为治疗批准版本的模型(8)可以应用。

措施论坛估计依据为

哪里

具有论坛相对风险度量,右后j个(t吨),由估算

哪里论坛论坛.限制平均寿命差的估计量,论坛,由给出

哪里论坛.

措施论坛右后j个(t吨)按时间间隔考虑[t吨L(左),t吨U型],同时论坛在时间间隔[0,t吨U型],其中t吨L(左)选择以避免被0除t吨U型是为了避免观测时间分布尾部的公认不稳定性。

IPTW重量,论坛用于平衡各治疗组之间的协变量分布。申请后论坛给我们的估算师,J型+创建了1个具有治疗特异性的伪种群Z(0)分布等于整个人口的分布。例如,对于限制的平均寿命论坛,期望是关于Z(0),以便对所有J型+1个治疗组。IPCW权重,论坛,用于处理相关删失。在应用建议的双重反向加权后,每个建议的度量收敛到适用于随机治疗且未发生删失的人群的值。

3.渐近性质

我们在以下定理中总结了所提出估计的渐近性质。Web附录中列出了一组假定的正则性条件,而Web附录中提供了定理的证明。

定理1: 附录,论坛 几乎必然一致地收敛到 论坛 对于 论坛, 论坛 渐近收敛到具有协方差函数的零米高斯过程 论坛,哪里

哪里论坛论坛分别是Cox和logistic模型的影响函数(在附录);论坛、和小时j个(t吨),ij公司(t吨),j个(t吨)、和(f)j个(t吨)定义在附录.

一致性论坛通过一致性证明论坛论坛连续映射定理和一致强大数定律(USLLN)。渐近正态性的证明涉及分解论坛进入之内论坛,其中

数量论坛然后可以将其渐近地写成独立且同分布的均值0变量的和。多元中心极限定理可以用来证明渐近正态性,而根据经验过程理论的各种结果收敛到高斯过程(波拉德,1990年Bilias、Gu和Ying,1997年)。Web附录中提供了定理1的证明。

定理2:在条件(a)至(f)下,论坛 几乎肯定会收敛到 论坛 对于 论坛, 论坛 渐近收敛到具有协方差函数的零米高斯过程 论坛,哪里

具有 论坛 如定理1所示。

定理2的证明(在Web附录中提供)涉及将定理1和泛函增量法相结合。通过将所有极限值替换为其经验对应值,可以一致地估计协方差函数。

定理三:在假定的规则性条件下,论坛 几乎必然一致地收敛到 右后j个(t吨)对于 论坛, 论坛 渐近收敛到具有协方差函数的零米高斯过程 论坛,哪里

(10)

具有 论坛 定义见定理1.

定理3的证明(Web附录)在结构上与定理2的证明非常相似。

定理4:在假定的规则性条件下,论坛 几乎必然一致地收敛到 论坛 对于 论坛,虽然 论坛渐近收敛到具有协方差函数的零米高斯过程 论坛,哪里

(11)

具有 论坛 如定理1所定义.

证明从表达开始论坛作为独立和相同分布的零位变量的总和论坛(Andersen等人,1993年)。然后将泛函增量法与定理1相结合。

对于大型数据集,方差估计可能需要大量计算,在这种情况下,bootstrap是一种有用的替代方法。虽然bootstrap通常不是为了减少计算时间而建议的,但在点估计量可以快速计算但渐近方差计算缓慢的情况下,它可以实现这样的目标。在数据集的大小排除了标准引导的情况下属于n个可以应用bootstrap,以便重新采样大小(<n个)然后将估计方差乘以/n个.

4.仿真研究

我们通过一系列仿真研究评估了所提出估计量的有限样本性质。对于每个n个受试者,协变量Z1作为值为0或1的二进制变量生成,并且公共关系(Z1=1)=0.5. 治疗指标,G公司,由带参数的伯努利分布生成论坛。我们选择了论坛论坛这样的话公共关系(Z1=1 | G公司=1)=0.75和公共关系(Z1=1 | G公司=0)=0.25. 什么时候?G公司=1,我们生成了一个变量Z2作为具有概率的分段常数P(P)(Z2=k个)=P(P)(Z2=k个+1) 跨时间间隔=0.5(k个,k个+1] ,用于论坛.何时G公司=0,Z2作为二进制变量(0或1)生成公共关系(Z2=1)=0.5. 事件时间由带有危险函数的Cox模型生成

而审查时间是由带有风险函数的Cox模型生成的

的各种值论坛、和论坛用于Cox模型。对于每组参数,通过改变基线死亡率和审查风险来调查审查的几个百分比。审查时间被截断为t吨=5.

样本大小n个=500和n个检查了=200,每个设置总共使用了1000个模拟。对于前两个度量,我们使用对数转换来确保置信区间界限在有效范围内。为了评估我们提出的方法的有限样本性能,在时间点评估了三个估计量中每个估计量的偏差t吨=1,t吨=2,以及t吨=3.引导程序标准错误的评估时间为t吨=2,样本量n个=200,每个模拟100个引导重采样。

对于n个=200,我们的估计值似乎大体上是无偏的(表1).

表1

模拟结果:检查不同时间点的偏差(n个=200)

t吨= 1t吨= 2t吨= 3
设置C类%论坛BIAS公司论坛BIAS公司论坛BIAS公司
论坛23%00.0040.2830.0170.5840.008
40%00.0190.2830.0220.584−0.007
13%0.4960.0130.7780.0041.0760.009
33%0.4960.0370.7780.0221.0760.017
28%0.4960.0380.7780.0181.0760.012
46%0.4960.0580.7780.0241.0760.006
设置C类%日志右后1(t吨)BIAS公司日志右后1(t吨)BIAS公司日志右后1(t吨)BIAS公司
论坛23%00.0040.2380.0150.4290.008
40%00.0190.2380.0190.429−0.004
13%0.4510.0140.6190.0070.7150.011
33%0.4510.0360.6190.0210.7150.016
28%0.4510.0370.6190.0170.7150.011
46%0.4510.0560.6190.0240.7150.011
设置C类%论坛BIAS公司论坛BIAS公司论坛BIAS公司
论坛23%00.001−0.036−0.002−0.171−0.002
40%0−0.001−0.036−0.004−0.171−0.003
13%−0.0420.001−0.1970.005−0.502磅0.009
33%−0.042−0.001−0.197−0.002−0.5020.001
28%−0.042−0.001−0.197−0.002−0.5020.001
46%−0.042−0.001−0.197−0.001−0.5020.005
t吨= 1t吨= 2t吨= 3
设置C类%论坛BIAS公司论坛BIAS公司论坛偏差
论坛23%00.0040.2830.0170.5840.008
40%00.0190.2830.0220.584−0.007
13%0.4960.0130.7780.0041.0760.009
33%0.4960.0370.7780.0221.0760.017
28%0.4960.0380.7780.0181.0760.012
46%0.4960.0580.7780.0241.0760.006
设置C类%日志右后1(t吨)BIAS公司日志右后1(t吨)BIAS公司日志右后1(t吨)BIAS公司
论坛23%00.0040.2380.0150.4290.008
40%00.0190.2380.0190.429−0.004
13%0.4510.0140.6190.0070.7150.011
33%0.4510.0360.6190.0210.7150.016
28%0.4510.0370.6190.0170.7150.011
46%0.4510.0560.6190.0240.7150.011
设置C类%论坛BIAS公司论坛BIAS公司论坛偏差
论坛23%00.001−0.036−0.002−0.171−0.002
40%0−0.001−0.036−0.004−0.171−0.003
13%−0.0420.001−0.1970.005−0.5020.009
33%−0.042−0.001−0.197−0.002−0.5020.001
28%−0.042−0.001−0.197−0.002−0.5020.001
46%−0.042−0.001−0.197−0.001−0.5020.005

设置I:论坛.

设置II:论坛.

设置III:论坛.

表1

模拟结果:检查不同时间点的偏差(n个=200)

t吨= 1t吨= 2t吨= 3
设置C类%论坛BIAS公司论坛BIAS公司论坛偏差
论坛23%00.0040.2830.0170.5840.008
40%00.0190.2830.0220.584−0.007
13%0.4960.0130.7780.0041.0760.009
33%0.4960.0370.7780.0221.0760.017
28%0.4960.0380.7780.0181.0760.012
46%0.4960.0580.7780.0241.0760.006
设置C类%日志右后1(t吨)BIAS公司日志右后1(t吨)BIAS公司日志右后1(t吨)BIAS公司
论坛23%00.0040.2380.0150.4290.008
40%00.0190.2380.0190.429−0.004
13%0.4510.0140.6190.0070.7150.011
33%0.4510.0360.6190.0210.7150.016
28%0.4510.0370.6190.0170.7150.011
46%0.4510.0560.6190.0240.7150.011
设置C类%论坛BIAS公司论坛BIAS公司论坛BIAS公司
论坛23%00.001−0.036−0.002−0.171−0.002
40%0−0.001−0.036−0.004−0.171−0.003
13%−0.0420.001−0.1970.005−0.5020.009
33%−0.042−0.001−0.197−0.002−0.5020.001
28%−0.042−0.001−0.197−0.002−0.5020.001
46%−0.042−0.001−0.197−0.001−0.5020.005
t吨= 1t吨= 2t吨= 3
设置C类%论坛BIAS公司论坛BIAS公司论坛BIAS公司
论坛23%00.0040.2830.0170.5840.008
40%00.0190.2830.0220.584−0.007
13%0.4960.0130.7780.0041.0760.009
33%0.4960.0370.7780.0221.0760.017
28%0.4960.0380.7780.0181.0760.012
46%0.4960.0580.7780.0241.0760.006
设置C类%日志右后1(t吨)BIAS公司日志右后1(t吨)BIAS公司日志右后1(t吨)BIAS公司
论坛23%00.0040.2380.0150.4290.008
40%00.0190.2380.0190.429−0.004
13%0.4510.0140.6190.0070.7150.011
33%0.4510.0360.6190.0210.7150.016
28%0.4510.0370.6190.0170.7150.011
46%0.4510.0560.6190.0240.7150.011
设置C类%论坛BIAS公司论坛BIAS公司论坛BIAS公司
论坛23%00.001−0.036−0.002−0.171−0.002
40%0−0.001−0.036−0.004−0.171−0.003
13%−0.0420.001−0.1970.005−0.5020.009
33%−0.042−0.001−0.197−0.002−0.5020.001
28%−0.042−0.001−0.197−0.002−0.5020.001
46%−0.042−0.001−0.197−0.001−0.502磅0.005

设置I:论坛.

设置II:论坛.

设置III:论坛.

当样本量增加到n个=500(腹板表1)。样本量的平均自举标准差(ASE)通常接近经验标准差(ESD)n个=200 (表2)相应地,经验覆盖概率(CP)相当接近名义值0.95。

表2

模拟结果:检查引导程序标准错误(t吨=2,n个=200)

设置C类%论坛BIAS公司ASE公司静电放电人物配对关系
论坛23%0.2830.0170.3310.3170.96
40%0.0220.3440.3370.96
13%0.7780.0040.3090.3200.94
33%0.0220.3230.3320.95
28%0.7780.0170.3210.3260.95
46%0.0240.3470.3560.95
设置C类%日志右后1(t吨)BIAS公司ASE公司静电放电人物配对关系
论坛23%0.2380.0150.2830.2700.96
40%0.0190.2930.2860.96
13%0.6190.0070.2550.2640.94
33%0.0210.2670.2740.95
28%0.6190.0170.2650.2690.96
46%0.0240.2880.2970.95
设置C类%论坛BIAS公司ASE公司静电放电人物配对关系
论坛23%−0.036−0.0020.0870.0870.95
40%−0.0040.0890.0900.94
13%−0.1960.0050.0950.1000.93
33%−0.0020.0960.0990.93
28%−0.196−0.0020.0960.0990.94
46%−0.0010.0990.1020.94
设置C类%论坛BIAS公司ASE公司静电放电人物配对关系
论坛23%0.2830.0170.3310.3170.96
40%0.0220.3440.3370.96
13%0.7780.0040.3090.3200.94
33%0.0220.3230.3320.95
28%0.7780.0170.3210.3260.95
46%0.0240.3470.3560.95
设置C类%日志右后1(t吨)BIAS公司ASE公司静电放电人物配对关系
论坛23%0.2380.0150.2830.2700.96
40%0.0190.2930.2860.96
13%0.6190.0070.2550.2640.94
33%0.0210.2670.2740.95
28%0.6190.0170.2650.2690.96
46%0.0240.2880.2970.95
设置C类%论坛BIAS公司ASE公司静电放电人物配对关系
论坛23%−0.036−0.0020.0870.0870.95
40%−0.0040.0890.0900.94
13%−0.1960.0050.0950.1000.93
33%−0.0020.0960.0990.93
28%−0.196−0.0020.0960.0990.94
46%−0.0010.0990.1020.94

设置I:论坛.

设置II:论坛.

设置III:论坛.

表2

模拟结果:检查引导程序标准错误(t吨=2,n个=200)

设置C类%论坛BIAS公司ASE公司静电放电人物配对关系
论坛23%0.2830.0170.3310.3170.96
40%0.0220.3440.3370.96
13%0.7780.0040.3090.3200.94
33%0.0220.3230.3320.95
28%0.7780.0170.3210.3260.95
46%0.0240.3470.3560.95
设置C类%日志右后1(t吨)BIAS公司ASE公司静电放电人物配对关系
论坛23%0.2380.0150.2830.2700.96
40%0.0190.2930.2860.96
13%0.6190.0070.2550.2640.94
33%0.0210.2670.2740.95
28%0.6190.0170.2650.2690.96
46%0.0240.2880.2970.95
设置C类%论坛BIAS公司ASE公司静电放电人物配对关系
论坛23%−0.036−0.0020.0870.0870.95
40%−0.0040.0890.0900.94
13%−0.1960.0050.0950.1000.93
33%−0.0020.0960.0990.93
28%−0.196−0.0020.0960.0990.94
46%−0.0010.0990.1020.94
设置C类%论坛BIAS公司ASE公司静电放电人物配对关系
论坛23%0.2830.0170.3310.3170.96
40%0.0220.3440.3370.96
13%0.7780.0040.3090.3200.94
33%0.0220.3230.3320.95
28%0.7780.0170.3210.3260.95
46%0.0240.3470.3560.95
设置C类%日志右后1(t吨)BIAS公司ASE公司静电放电人物配对关系
论坛23%0.2380.0150.2830.2700.96
40%0.0190.2930.2860.96
13%0.6190.0070.2550.2640.94
33%0.0210.2670.2740.95
28%0.6190.0170.2650.2690.96
46%0.0240.2880.2970.95
设置C类%论坛BIAS公司ASE公司静电放电人物配对关系
论坛23%−0.036−0.0020.0870.0870.95
40%−0.0040.0890.0900.94
13%−0.1960.0050.0950.1000.93
33%−0.0020.0960.0990.93
28%−0.196−0.0020.0960.0990.94
46%−0.0010.0990.1020.94

设置I:论坛.

设置II:论坛.

设置III:论坛.

5.数据分析

我们应用所建议的方法分析了终末期肾病患者的等待生存期,其中种族(白人与非裔美国人)的影响很重要。数据来自移植受者科学登记处(SRTR),并由器官采购和移植网络(OPTN)收集。住院数据来自医疗保险和医疗补助服务中心(CMS)。只有主要支付医疗保险的患者才被纳入分析。数据包括n个=7110名2000日历年被列入肾移植等待名单的白人和非裔美国人。从患者被列入肾移植等待名单的时间开始,到死亡、移植、失访或研究结束的最早时间(2005年12月31日),对患者进行随访。在2975名非裔美国人中,27%死亡,45%接受肾移植。在4135名白人中,27%死亡,54%接受移植。

此前有报道称,非裔美国人的肾脏等待死亡率低于白人。然而,白人的肾移植率也高于非裔美国人。与肝、肺和心脏移植不同,患者健康状况不佳是肾移植的禁忌症。尽管供肾并非专门针对健康的患者,但人们普遍认为健康较差的患者接受肾移植的可能性较小。很有可能,最健康的患者从等待名单上被移植的比率,高加索人高于非裔美国人。因此,我们怀疑肾脏等待期死亡率的依赖性审查是通过患者健康发生的。我们使用与时间相关的住院史作为患者健康的替代指标。请注意,住院史不适合作为患者等待列表存活率的调整协变量。既往住院次数较多的患者有更大的死亡率风险,入院可被视为从等待列表到死亡的中间终点。以前按种族对等待名单死亡率的比较并没有根据依赖性审查进行调整。此外,大多数以前对高加索人和非裔美国人的比较都假设种族的影响随着时间的推移是恒定的。

根据年龄、性别、诊断(糖尿病、高血压、肾小球肾炎、多囊肾病等)、体重指数和慢性阻塞性肺病(是或否),采用Logistic回归对患者为白种人的概率进行建模。拟合了按种族分层的Cox模型,以估计调整上述协变量的逆概率审查权重,以及与时间相关的既往住院次数。每多住院一次,移植风险显著降低8%(Web表2)。IPTW重量范围为1.04至21.39,IPCW重量范围为1.0至33.07。

由于数据集的大小,标准误差估计基于属于n个引导以减少计算时间。具体地说,我们反复进行替换取样=1000名来自n个=研究人群中的7110名患者,然后将bootstrap标准误差乘以论坛共绘制了5000个引导重采样。

我们评估了[0,70]个月间隔期间的比赛效果。在等待名单公布后大约一个月内,白人的累积死亡风险显著低于非裔美国人(图1).

按种族对等待期死亡率的分析:累积危险函数比率的估计值和95%逐点置信区间(白人/非裔美国人)。此图在本文的电子版中以彩色显示。
图1

按种族对等待期死亡率的分析:累积危险函数比率的估计值和95%点态置信区间(白人/非裔美国人),论坛。此图以彩色显示在本文的电子版中。

与非裔美国人相比,白种人在随访开始时的累积危险性较低,但在大约11个月后,其累积危险性比率显著高于论坛论坛估计相对风险的模式与累积危害的比率相似(图2).

按种族对等待期死亡率的分析:风险比(白种人/非裔美国人)RR1(t)的估计值和95%逐点置信区间。此图在本文的电子版中以彩色显示。
图2

按种族对等待期死亡率的分析:风险比率的估计值和95%的逐点置信区间(白人/非裔美国人),右后1(t吨)。此图在本文的电子版中以彩色显示。

图3根据等待后的前8个月,白种人的限制平均寿命比非裔美国人短。等待18个月后,限制平均寿命差异显著,估计差异范围为论坛个月到论坛将白人与非裔美国人进行比较。

按种族对等待期死亡率的分析:限制平均寿命差异的估计值和95%点态置信区间(白人-非裔美国人)。此图在本文的电子版中以彩色显示。
图3

按种族对等待期死亡率的分析:限制平均寿命差异的估计值和95%逐点置信区间(白人-非裔美国人),论坛。此图在本文电子版中以彩色显示。

Web附录中提供了补充分析。我们检查了每个论坛(Web图1),右后1(t吨)(Web图2)、和论坛(Web图3):建议的IPTW/IPCW估计器(用实线表示);IPTW估计器(长划线);IPTW估计器仅针对年龄进行调整(短划线);以及未经调整的估计器(虚线)。IPTW/IPCW和IPTW估计量之间没有太大差异,这意味着依赖性审查不强。未经调整和IPTW估计值之间存在显著差异,表明大量混杂因素由基线调整协变量控制,Z(0). Z(0)和年龄调整的IPTW估计量,表明大多数协变量调整是由于Z(0)实际上只经历了一个年龄段。比较网络图1-3,四个估计值之间的差异在以下方面最为显著论坛。虽然两者都有道理论坛右后1(t吨)本质上是累积的,论坛包括对每个变量的数量进行积分。

6.讨论

在本文中,我们提出了当比例风险假设不成立时,估算累积治疗效果的方法。通过双重逆加权,所提出的估计量可针对特定处理基线协变量分布的差异进行调整,并克服相关删失。仿真研究表明,所提出估计量近似无偏,且bootstrap标准误差在有限样本中表现良好。

我们提出的方法的另一种选择是G计算方法(罗宾斯,1986年,1987)。这种方法需要为纵向协变量过程指定一个模型,这在纵向协变量没有内在利益或难以建模的情况下可能被视为一个缺点。我们提出的方法的一个平行缺点是需要对依赖的审查过程进行建模。由于此类建模的方法已经建立,因此此类建模通常很简单。然而,独立审查过程可能没有什么意义。此外,反向加权可能会导致不稳定,这是G计算方法中没有类似现象的现象。注意,在许多实际应用中,纵向和相关审查过程的模型实际上具有临床相关性。例如,关于分析的终末期肾病数据第5节住院史代表了一个重要的结果,可以说,这在肾脏病文献中没有得到足够的重视。此外,由于对影响移植率的因素发表的严格分析相对较少,所以移植前时间模型很有意义。

将我们的方法应用于肾脏等待列表生存数据,我们发现种族(白人vs.非裔美国人)的影响具有时间依赖性。与非裔美国人相比,白人在等待列表后11个月的累积危险和死亡风险明显更高,而白人在等待后70个月的限制平均寿命显著缩短(缩短3.39个月)。限制平均寿命的差异在长期内具有统计学意义,但并不具有临床重要性。

种族可能与预测肾脏等待死亡的未测量因素有关,因此,我们对种族效应的估计可能会受到残余偏差的影响。然而,在这方面有几点很重要。首先,我们没有试图将与种族相关的生物/遗传因素与社会经济因素分开。所提出的方法旨在引出群体特定对比的有效估计值(可能是关联估计值,而不是因果估计值)。第二,未测量混杂因素的威胁可能比比较普通人群中的种族组要小。由于研究人群的所有成员都患有终末期肾病,因此死亡率风险因素的变异性可能比普通人群的变异性小。第三,尽管SRTR数据库没有关于每个死亡风险因素的信息,但它有最重要的因素(如年龄、糖尿病状况)。患者收集的信息的性质并不是随意决定的,因为SRTR数据库用于建立模型,将中心特异性死亡率与全国平均死亡率进行比较。第四,任何缺失的死亡率预测因子与种族之间的关联程度(即,调整测量的基线协变量后)值得怀疑;调整种族和Z(0). 第五,补充分析显示,大多数混杂因素通过Z(0)仅通过年龄。尽管远未证明其缺失,但由于“常见疑点”导致的混淆仅随年龄而调整,因此由于未测量混淆而产生有意义偏见的假设被削弱。

正如前一段所暗示的那样,我们对残余混杂因素的补充分析是基于测量的协变量至少与未测量协变量一样强的混杂因素。目前已有更正式的方法来评估未测量的混杂因素,敏感性分析领域在过去十年中受到了相当大的关注。例如,Lin、Psaty和Kronmal(1998年)发展了logistic回归和Cox回归的方法,通过这些方法,可以从未修正的对应项中计算出经偏差修正的回归参数估计量。Robins、Rotnitzky和Scharfstein(1999)边际结构模型的拟议敏感性分析方法(另请参阅Brumback等人,2004年)。这些方法包括通过反应变量的偏差修正版本消除未测量混杂因素的影响。千叶(2010)提出如果正在估计因果风险比(与风险差异相反),则不同的技术适用于偏差修正。Klungsöyr等人(2009年)开发了通过边际结构考克斯模型估计因果风险比的敏感性分析方法;这些方法包括作为治疗特定抵消的偏差校正。可能的是Klungsöyr等人(2009年)可以应用于我们的设置,在这种情况下,偏差校正偏移量将用于计算校正后的加权Nelson–Aalen估计量。还有其他几种形式的敏感性分析。Brumback等人(2004年)将上述方法的使用描述为全面贝叶斯分析的初步步骤(例如。,格陵兰,2005年)。此外,McCandless、Gustafson和Levy(2007)通过在假定的先验分布中正式纳入不确定性,描述了另一层敏感性分析。

本文提出的估计量的一致性要求双反权的一致性。因此,治疗的逻辑模型或审查的比例风险模型的指定错误可能会导致治疗效果估计值的偏差。有人建议,用于IPTW和IPCW的模型包含一组丰富的协变量,比较忽略重要协变量和包含非重要协变量的陷阱。模型错误指定导致的偏差大小取决于错误建模的协变量数量、它们与治疗和失败时间的关联强度以及它们在研究人群中的可变性。错误指定IPCW模型的影响还取决于被审查对象的百分比。在实践中,当样本中的受试者很少被审查时,使用IPCW可能不值得,因为权重估计器的精度很低,并且由于依赖但不频繁的审查会导致很少的偏差。逻辑模型的诊断方法已经很好地建立(Hosmer和Lemeshow,1989年)和考克斯模型(Klein和Moeschberger,2003年).

在建议的反权重中,IPTW和IPCW分量是不稳定的版本。通常形式的稳定(例如。,Hernan等人,2000年Robins等人,2000年)在我们的设置中可能不可行,因为估计量不以基线协变量为条件,Z(0),其中稳定系数通常是函数。然而,有可能沿着以下路线开发增广估计器Robins、Rotnitzsky和Zhao(1994)这可以提高效率和鲁棒性。

在某些特定时间点或一小组时间点上的推断可以基于我们提出的逐点置信区间。我们将每个估计器作为一个过程来呈现的理由是为了满足不同的研究人员,他们可能对适当的截断时间有不同的意见。如果需要同时推断,可以像前面几篇文章中那样构造置信带,包括Wei和Schaubel(2008).

7.补充资料

Web附录、图和表可在“论文信息”链接下找到,网址为生物计量学网站http://www.biometrics.tibs.org.

鸣谢

这项研究得到了美国国立卫生研究院R01 DK-70869(DES)的部分资助。作者感谢移植受者科学注册中心(SRTR)和器官采购和移植网络(OPTN)访问器官衰竭数据库,感谢医疗保险和医疗补助服务中心(CMS)访问住院数据。SRTR由美国卫生与公共服务部卫生资源与服务管理局(HRSA)的合同资助。作者还感谢编辑、副主编和一位裁判,他的建设性意见使手稿有了很大的改进。

工具书类

阿伦
,
订单。
(
1978
).
一类计数过程的非参数推理
.
统计年鉴
 
6
,
701
726
.

安徒生
,
P.K.公司。
,
博根
,
O。
,
,
右侧。
、和
基丁
,
N。
(
1993
).
基于计数过程的统计模型
.
纽约
:
施普林格
.

比利亚斯
,
年。
,
,
M。
、和
,
Z.公司。
(
1997
).
具有交错入口的Cox模型的一般渐近理论
.
统计年鉴
 
25
,
662
682
.

布伦巴克
,
学士。
,
埃尔南
,
文学硕士。
,
哈努斯
,
S.J.P.A.公司。
、和
罗宾斯
,
J·M·。
(
2004
).
假设重复测量的边际结构模型对未测量混杂的敏感性分析
.
医学统计学
 
23
,
749
767
.

,
第页。
齐亚提斯
,
答:A。
(
2001
).
两组受限制平均寿命差异的因果推断
.
生物计量学
 
57
,
1030
1038
.

千叶
,
年。
(
2010
).
应用边际结构模型对因果风险比未测量混杂因素的敏感性分析
.
统计学中的传播——理论与方法
 
39
,
65
76
.

考克斯
,
D.R.公司。
(
1972
).
回归模型和生命表
.
英国皇家统计学会杂志B辑
 
34
,
187
202
.

考克斯
,
D.R.公司。
(
1975
).
部分可能性
.
生物特征
 
62
,
269
276
.

格陵兰岛
,
美国。
(
2005
).
观测数据分析的多偏差建模(讨论)
.
英国皇家统计学会期刊,A辑
 
168
,
267
306
.

埃尔南
,
文学硕士。
,
布伦巴克
,
B。
、和
罗宾斯
,
J·M·。
(
2000
).
估计齐多夫定对HIV阳性男性生存率因果影响的边缘结构模型
.
流行病学
 
11
,
561
570
.

埃尔南
,
文学硕士。
,
布伦巴克
,
B。
、和
罗宾斯
,
J·M·。
(
2001
).
估计非随机治疗联合因果效应的边际结构模型
.
美国统计协会杂志
 
96
,
440
448
.

霍斯默
,
D.W.公司。
Lemeshow公司
,
美国。
(
1989
).
应用Logistic回归
.
纽约
:
施普林格
.

卡普兰
,
E.升。
迈尔
,
第页。
(
1958
).
不完全观测的非参数估计
.
美国统计协会杂志
 
53
,
457
481
.

克莱因
,
J.P.公司。
莫埃什贝格尔
,
M.L.公司。
(
2003
).
生存分析:截尾和截尾数据的技术
.
纽约
:
施普林格
.

Klungsöyr公司
,
O。
,
塞克斯顿
,
J。
,
桑丹格尔
,
一、。
、和
尼奥尔德
,
J.F.公司。
(
2009
).
边际结构Cox比例风险模型中未测量混杂的敏感性分析
.
终身数据分析
 
15
,
278
294
.

,
D.Y.博士。
,
普氏
,
B.米。
、和
Kronmal公司
,
注册会计师。
(
1998
).
在观察性研究中评估回归结果对未测量混杂因素的敏感性
.
生物计量学
 
54
,
948
963
.

松山
,
年。
山口
,
T。
(
2008
).
使用截尾加权逆概率(IPCW)方法估计存在相依竞争风险时的边际生存时间
.
药物统计
 
7
,
202
214
.

麦肯德莱斯
,
拉丁美洲。
,
古斯塔夫森
,
第页。
、和
征收
,
答:。
(
2007
).
观测研究中未测量混杂因素的贝叶斯灵敏度分析
.
医学统计学
 
26
,
2331
2347
.

纳尔逊
,
重量B。
(
1972
).
删失失效数据危险度图的理论与应用
.
技术指标
 
14
,
945
965
.

波拉德
,
D。
(
1990
).
经验过程:理论与应用
.
加利福尼亚州海沃德
:
数理统计研究所
.

罗宾斯
,
J·M·。
(
1986
).
持续暴露期死亡率研究中因果推断的新方法——应用于控制健康工人幸存者效应
.
数学建模
 
7
,
1393
1512
.

罗宾斯
,
J·M·。
(
1987
).
“持续暴露期死亡率研究中因果推断的新方法——应用于控制健康工人幸存者效应”补遗
.
计算机和数学及其应用
 
14
,
923
935
.

罗宾斯
,
J·M·。
(
1993
).
使用替代标记的随机试验比例风险回归分析中的信息恢复和偏差调整
.
美国统计协会生物制药部会议记录
,
24
33
.

罗宾斯
,
J·M·。
芬克尔斯坦
,
D。
(
2000
).
艾滋病临床试验中不依从性和依赖性截尾的校正——截尾加权对数秩检验的逆概率
.
生物计量学
 
56
,
779
788
.

罗宾斯
,
J·M·。
罗特尼茨基
,
答:。
(
1992
).
使用替代标记恢复信息和调整从属审查
.英寸
艾滋病流行病学-方法学问题
,
N。
珠宝
,
英国。
迪茨
、和
五、。
永别了
(编辑),
297
331
.
波士顿
:
比克豪泽
.

罗宾斯
,
J·M·。
,
罗特尼茨基
,
答:。
、和
,
L.P.公司。
(
1994
).
当某些回归变量不总是被观测时回归系数的估计
.
美国统计协会杂志
 
89
,
846
866
.

罗宾斯
,
J·M·。
,
罗特尼茨基
,
答:。
、和
沙尔夫斯泰因
,
D.O.公司。
(
1999
).
缺失数据和因果推理模型中选择偏差和未测量混杂的敏感性分析
.英寸
流行病学中的统计模型
,
机械工程师。
哈洛兰
D。
浆果
(编辑),
1
92
.
纽约
:
施普林格
.

罗宾斯
,
J·M·。
,
埃尔南
,
文学硕士。
、和
布伦巴克
,
B。
(
2000
).
流行病学中的边缘结构模型和因果推断
.
流行病学
 
11
,
550
560
.

世界环境学会
,
G.公司。
朔贝尔
,
D.E.博士。
(
2008
).
在存在非比例危害的情况下评估累积治疗效果
.
生物计量学
 
64
,
724
732
.

,
J。
线路接口单元
,
C、。
(
2005
).
生存数据处理加权逆概率的调整Kaplan-Meier估计和log-rank检验
.
医学统计学
 
24
,
3089
3110
.

吉田
,
M。
,
松山
,
年。
、和
大桥
,
年。
(
2007
).
使用IPCW方法对依赖性审查进行调整后的治疗效果评估:应用于大型冠状动脉事件一级预防研究(MEGA研究)
.
临床试验
 
4
,
318
328
.

扎克
,
D.M.博士。
(
1998
).
具有协变量的限制平均寿命:一种有用生存分析方法的改进和扩展
.
美国统计协会杂志
 
93
,
702
709
.

附录

定理1中列出的函数

定理1中使用的函数定义如下。

本文根据牛津大学出版社标准期刊出版模式的条款出版和分发(https://academic.oup.com/journals/pages/open_access/funder_policies/chorus/standard_publication_model)