总结

人们对复发事件数据的分析越来越感兴趣(库克和劳利斯,2002年,医学研究中的统计方法 11,141–166)。在许多情况下,在随访期间可能会发生终止事件,如死亡,以避免再次发生复发事件。此外,死亡时间可能取决于复发事件历史。在本文中,我们考虑了周期性和终端事件过程的脆弱性比例风险模型。这种依赖性是通过对两种危险函数中包含的共同脆弱性的条件作用来建模的。在模型中也可以考虑协变量效应。最大似然估计和推断是通过蒙特卡罗EM算法在E步中使用Metropolis–Hastings采样器进行的。对等待透析患者的住院和死亡数据进行分析,以说明所提出的方法。文中还介绍了验证所提模型有效性的方法。该模型避免了在其他方法中遇到的困难,这些方法试图指定具有边际比例风险的相依联合分布,并得出相依程度的估计。

Résumé

L'intérít portéla L'analyse desévénements récurrents est croissant(库克和劳利斯,2002)。丹麦人的无名氏状况,联合国总决赛,德塞塞委员会,法国人民解放阵线,意大利人民解放阵亡将领,巴西人民解放阵营。Par ailleurs,le moment auquel survient le décès peut lui-méme dépendre du passéconcernant lesévénements récurrents。Dans cet文章,nous considérons un modèle de fragilitéavec taux prodictionles pour décrire le processus desévénements récurrents et de lévánement最终。依赖是一种有条件的脆弱性,包括危险的双重功能。在peut aussi,dans ce modèle,prendre en compte l’effet de covariables上。Les estimations et Les tests associes as au maximum de vraisemblance sont réalis as partir de l’algorithme EM de la méthode de Monte Carlo,avec un chantillonage de métropolis-Hastingál’étape E.l'analyse des donnes’hospitalisation et du cés,chez des sujets en attente de dialyse,est présentée pour illustrer les méthodes proposesées。德塞特霍德斯(Deséthodes),《现代建议》(pourétudier la validitédu modèle proposésés),《圣奥斯西报》(sont aussi présen es)。Ce modèle vite les haroubleés rencontrées dans les接近于替代方案:分配联合体的平稳性、平均支出和牛磺酸边际比例、必要的平均支出。

1.简介

在纵向医学研究中经常出现复发事件数据。在许多情况下,复发事件的后续行动可能会因死亡等晚期事件而停止。例如,患者可能会反复住院,并因死亡而终止。在对肾移植患者反复排斥反应的研究中,一些患者可能会出现完全排斥反应,从而阻止排斥反应的进一步发生。

实际上,复发性和晚期事件往往不是独立的。例如,严重事件(如心脏病发作)的复发通常会增加死亡风险,这反过来又使任何后续复发事件都不可能发生。这种依赖性应在复发事件和终末事件的联合建模中加以考虑。

研究重复测量环境中的依赖性辍学机制是许多研究者感兴趣的问题(De Gruttola和Tu,1994年;Little,1995年;Hogan和Laird,1997年;孙和松,2001;Xu和Zeger,2001年)。对有终末事件存在时的复发事件过程的分析与他们的研究有很大的相似性。通常采用两种方法:边际模型和脆弱性模型。

采用自然边际法Li和Lagakos(1997)他们采用了Wei、Lin和Weissfeld的边际模型(1989),并将终止事件视为每个复发事件的审查事件,或将每个复发的失败时间视为复发事件时间和生存时间的最小值。Cook和Lawless(1997)介绍了幸存者在给定时间内复发事件的平均频率/比率函数。Ghosh和Lin(2000)给出了一个非参数估计值的渐近性质,该估计值是一段时间内累积复发事件数的边际平均值。Ghosh和Lin(2002)还开发了使用IPCW(截尾加权的逆概率;罗宾斯和罗尼茨基,1992年)还有一种类似的技术,即生存概率加权反演(IPSW)。这些模型是对比例平均值/比率模型的扩展(Lin等人,2000年)基于经验过程理论,在没有依赖终止事件的情况下。

这些边际模型并没有说明复发事件与死亡之间的相关性。边际半参数模型的应用,如Ghosh和Lin(2002)由于IPCW和IPSW方法都需要严格的条件,因此受到了限制,这在现实中可能无法满足。

在此场景中应用了共享随机效应模型或脆弱性模型。Lancaster和Intrator(1998)通过一个常见的未测量的“脆弱性”参数化地建模住院和生存的联合分布。他们将住院视为泊松过程,其速率函数与生存时间的危险函数具有相同的脆弱性。考虑到脆弱性,这两个事件过程被认为是独立的。王、秦和蒋(2001)用半参数和非参数方法建立了具有信息截尾的重复事件发生率函数模型。他们通过重复事件的脆弱性假设了非平稳泊松过程。虚弱、复发和晚期事件的调节是独立的。他们将信息审查的分布和脆弱性都视为令人讨厌的参数。因此,它们的模型不能应用于对重复事件和终止事件建模都感兴趣的情况。此外,所提出的半参数模型无法处理与时间相关的协变量。

在这篇文章中,我们提出了一个联合半参数模型,用于研究重复性事件和共享γ脆弱性导致的死亡的强度函数。尼尔森等人。(1992年;另见Andersen等人,1993年,第九节)提出了一个通用脆弱性模型,该模型可以专门用于具有终末事件的复发事件数据。在该模型中,脆弱性对复发率和终末事件率的影响是相同的。这是我们模型的一个特例(γ=1),其中脆弱性对这两种危险有不同的影响。

本文的其余部分组织如下。第2节,我们引入了基本的乘法强度模型,该模型考虑了协变量信息。统计方法是在第3节将EM算法与Metropolis–Hastings E-step结合使用。仿真结果和实际数据分析如所示第4节5分别是。第6节文章最后总结了我们的结果,并对所提出的模型的推广进行了讨论。

2.型号

C类D类是主题的审查和死亡时间(=1,2…,n个)。写入X=最小值(C类,D类)作为随动时间和Δ=(D类C类),其中(·)是指示器功能。Y(Y)(t吨) =(Xt吨)成为风险指示器。表示方式N个D类*(t吨) =(D类t吨)和N个D类(t吨) =(Xt吨, Δ=1)按时间划分的实际和观察死亡指标t吨分别是。类似地,定义为N个R(右)*(t吨)和N个R(右)(t吨)实际和观察到的复发事件数量N个R(右)(t)=N个R(右)*(最小值(X,吨))分别是。写入德国R(右)*(t吨) =N个R(右)*{(t吨+日期) −}−N个R(右)*(t吨−)作为日期0和德国R(右)(t吨) =(Xt吨)德国R(右)*(t吨)。我们引入了具有观测协变量的异质性Z轴和未观察到的虚弱,可以测量与复发事件和终末事件相关的患者潜在的“健康状态”。受试者的观察O(运行)(t吨) ≡{Y(Y)(u个),N个R(右)(u个),N个D类(u个), 0 ≤u个t吨},一份及时的身份证复印件t吨整个观测数据的O(运行)={O(运行)(t吨), 0 ≤t吨X}. 定义依据论坛由(ν,Z轴)和论坛.

对基础流程进行了以下假设:

(1) 复发、终止和审查过程都具有连续分布,因此复发事件和死亡不能同时发生。我们采用了一种惯例,即死亡在间隔时间内首先发生[t吨,t吨+日期).

我们假设终端事件阻止了重复事件的进一步发生N个R(右)*(t吨)之后为常量D类这与传统的审查事件不同,传统审查事件只会阻止我们观察到更多的复发事件,但不会阻止其发生。因此,最终事件过程和复发事件过程不是独立的,甚至是以虚弱为条件的。

(2)论坛,其中d日Λ(t吨) =P(P)(德国D类*(t吨) = 1 |Z轴, ν,D类t吨).

(3)论坛,其中博士(t吨) =P(P)(德国R(右)*(t吨)=1|Z轴, ν,D类t吨).

请注意论坛通常不可估算,在此设置中为0,其中D类是一个终端事件。事件(D类<t吨)和(D类t吨)几乎可以肯定是相同的,因为D类具有连续分布。

(4) 审查是非信息性的。特别是,在类型I或行政审查情况下,审查不依赖于ν。

(5)P(P)(N个R(右)(X)>1)>0,这确保了ν和γ可以被识别。

如中所示Kalbfleisch和Prentice(2002),完全似然可以写成乘积积分

(1)

忽视独立和非信息审查的贡献,

(2)

沿着竞争风险可能性的发展,(2)可以写为给定组件的乘积(7)(8)。详细步骤如下

(3)

注意,我们采用了公约00= 1. 可以看出,对于连续的事件时间,(3)等于

(4)

我们在中扩展了模型黄和沃尔夫(2002)对于新环境下具有从属审查的集群生存,如下所示:

(5)
(6)

常见脆弱性参数ν的存在削弱了死亡对复发事件过程进行非信息审查的通常假设。我们采用伽马脆弱性函数如果θ(·)单位均值和方差θ。平均值是统一的,以避免不可识别性问题,否则,如果我们用相同的常数乘以和除以脆弱性和基线风险,可能会出现不可识别问题。当γ=0时,λ(t吨)不依赖于ν对复发事件率无信息第页(t吨)。θ=0意味着脆弱项ν的是相同的1,也就是说,复发率和终末事件率的异质性完全可以用以下公式来解释Z轴.

表示t吨ij公司成为j个的第个重复事件时间第个主题,δij公司当时复发事件的指标t吨ij公司.让x个为观察到的随访时间。可能性的第一个因素(4)

(7)

同样,(6)暗示了可能性的第二部分(4)与…成比例

(8)

论坛可以写成(7)(8)。的完整对数可能性{(O(运行), ν),= 1, …,n个}是

(9)

时间相关协变量可以纳入我们的模型。对内部时间相关协变量的分析产生了与(6.11)中相同的似然形式Kalbfleisch和Prentice(2002).我们在以下内容中写道Z轴(t吨)表示与时间相关的协变量。

3.方法

方程式(9)给出了具有“已知”脆弱性的“完整数据”的可能性,这比“观测数据可能性”更容易最大化。这使得EM算法成为参数估计的自然选择。在E步骤中,由于如果|O(运行)),Metropolis–可以使用黑斯廷斯算法生成M(M)随机数ν()(= 1, …,M(M))用于估计包含脆弱性的足够统计数据的期望值。示例如下论坛论坛Metropolis–Hastings算法的简要介绍见附录A.

在M步中,通过最大化似然获得参数估计(9)就好像脆弱的统计数据是已知的一样。β和β的偏导数的分量第页0(·)是

参数化模型第页0(t吨)可以用固定维MLE的标准渐近性质来估计。复发事件基线强度的非参数估计采用布雷斯洛估计的形式,

(10)

论坛可以通过替换来解决(10)偏导数的分量/∂β. 协变量系数β的二阶偏导数为

所有其他分数分量和二阶偏导数如所示附录B.

由于EM算法没有直接为观测数据的似然提供信息矩阵,路易斯公式(路易斯,1982年)设η=(β,α, γ, θ,第页0, λ0)。观测信息矩阵论坛由提供

所有这些项都是在EM算法的最后一次迭代时评估的,此时MLE的最后一项变为零论坛前两个期望值可以通过对涉及Metropolis–Hastings值的相应术语进行平均来计算。

4.仿真

在本节中,我们报告了三种设置的模拟研究结果,以评估拟议估算程序的性能。在每种情况下,我们考虑一个单一的二元协变量Z轴取值0或1,每个值的概率为1/2,样本量n个=100,回归系数α=1和β=1。脆弱性是由平均值为1、方差为θ=1的伽马分布产生的。复发事件和死亡的基线强度函数分别为常数2和1/2的指数。我们假设一个固定的审查时间C类=0.8,适用于所有受试者。共产生了800个重复。这些设置的唯一区别在于γ,在设置I、II和III中分别取1/2、−1/2和0。

对于设置I,受试者平均有1.8次复发事件。在受试者中,57%的人被审查,其余的人将死亡视为最终事件;40%的受试者没有任何复发事件。在设置II中,γ=−1/2时,复发事件的发生率可预防最终事件。在这种情况下,每个受试者平均有2.1次复发事件。在受试者中,42%被审查,44%没有复发事件。结果如所示表12分别是。

表1

模拟结果:设置I的参数估计

共享脆弱性模型简化模型
参数偏差东南方扫描电镜人物配对关系偏差东南方扫描电镜人物配对关系
β = 1.0−0.0090.2720.27495.1%−0.0610.2700.27394.9%
α= 1.00.0060.3600.36296.4%−0.0810.3230.33194.6%
γ = 0.50.0220.2850.27694.3%
θ = 1.0−0.0010.2440.25393.6%0.0420.2630.27694.8%
共享脆弱性模型简化模型
参数偏差东南方扫描电镜人物配对关系偏差东南方扫描电镜人物配对关系
β = 1.0−0.0090.2720.27495.1%−0.0610.2700.27394.9%
α= 1.00.0060.3600.36296.4%−0.0810.3230.33194.6%
γ = 0.50.0220.2850.27694.3%
θ = 1.0−0.0010.2440.25393.6%0.0420.2630.27694.8%

偏差是参数估计值(基于800次重复)的平均值减去真实值;SE是参数估计的抽样标准误差;SEM是标准误差估计的抽样平均值;CP是相应95%置信区间的覆盖概率。

表1

模拟结果:设置I的参数估计

共享脆弱性模型简化模型
参数偏差东南方扫描电镜人物配对关系偏差东南方扫描电镜人物配对关系
β = 1.0−0.0090.2720.27495.1%−0.0610.2700.27394.9%
α= 1.00.0060.3600.36296.4%−0.0810.3230.33194.6%
γ = 0.50.0220.2850.27694.3%
θ = 1.0−0.0010.2440.25393.6%0.0420.2630.27694.8%
共享脆弱性模型简化模型
参数偏差东南方扫描电镜人物配对关系偏差东南方扫描电镜人物配对关系
β = 1.0−0.0090.2720.27495.1%−0.0610.2700.27394.9%
α=1.00.0060.3600.36296.4%−0.0810.3230.33194.6%
γ = 0.50.0220.2850.27694.3%
θ = 1.0−0.0010.2440.25393.6%0.0420.2630.27694.8%

偏差是参数估计值(基于800次重复)的平均值减去真实值;SE是参数估计的抽样标准误差;SEM是标准误差估计的抽样平均值;CP是相应95%置信区间的覆盖概率。

表2

模拟结果:设置II的参数估计

共享脆弱性模型简化模型
参数偏差东南方扫描电镜人物配对关系偏差东南方扫描电镜人物配对关系
β=1.00.0150.2710.26493.3%0.0630.2600.24793.0%
α= 1.00.0090.3530.34194.9%−0.1340.2910.27891.1%
γ = −0.5−0.0010.2330.26595.1%
θ=1.0−0.0470.2920.30492.6%−0.2440.2270.22472.3%
共享脆弱性模型简化模型
参数偏差东南方扫描电镜人物配对关系偏差东南方扫描电镜人物配对关系
β = 1.00.0150.2710.26493.3%0.0630.2600.24793.0%
α= 1.00.0090.3530.34194.9%−0.1340.2910.27891.1%
γ = −0.5−0.0010.2330.26595.1%
θ = 1.0−0.0470.2920.30492.6%−0.2440.2270.22472.3%
表2

模拟结果:设置II的参数估计

共享脆弱性模型简化模型
参数偏差东南方扫描电镜人物配对关系偏差东南方扫描电镜人物配对关系
β = 1.00.0150.2710.26493.3%0.0630.2600.24793.0%
α= 1.00.0090.3530.34194.9%−0.1340.2910.27891.1%
γ = −0.5−0.0010.2330.26595.1%
θ = 1.0−0.0470.2920.30492.6%−0.2440.2270.22472.3%
共享脆弱性模型简化模型
参数偏差东南方扫描电镜人物配对关系偏差东南方扫描电镜人物配对关系
β = 1.00.0150.2710.26493.3%0.0630.2600.24793.0%
α= 1.00.0090.3530.34194.9%−0.1340.2910.27891.1%
γ = −0.5−0.0010.2330.26595.1%
θ = 1.0−0.0470.2920.30492.6%−0.2440.2270.22472.3%

可以看出,在环境I和环境II中,联合脆弱性模型估计值的经验偏差非常小。仅限论坛设置I和论坛设置II中的显著偏差分别为0.022和−0.047。覆盖概率也接近名义水平0.95。我们只观察到方差估计值的微小偏差,即使不可忽略。

我们还使用了一个简化模型估计器,假设复发事件和终末事件的危害不共享参数,即γ=0。我们拟合了复发事件数据(通过类似于克莱因,1992年)和生存数据(通过标准比例风险模型)。结果显示在每个表格的右侧。所得参数估计值有偏差,尤其是设定II中的θ。很明显,忽视终末事件和复发事件之间的依赖性会导致重大偏差。

在设置III中,当两个模型都有效时,我们设置γ=0来比较简化模型和完整模型的估计。在这种特殊情况下,估计值非常接近,具有相同的精度(表3).

表3

模拟结果:设置III的参数估计

共享脆弱性模型简化模型
参数偏差东南方扫描电镜人物配对关系偏差东南方扫描电镜人物配对关系
β = 1.0−0.0050.2770.26894.5%−0.0060.2770.26594.5%
α=1.00.0110.3190.31494.9%−0.0060.3120.30893.0%
γ = 00.0060.2000.20097.4%
θ = 1.0−0.0030.2630.27293.5%−0.0140.2560.26394.6%
共享脆弱性模型简化模型
参数偏差东南方扫描电镜人物配对关系偏差东南方扫描电镜人物配对关系
β = 1.0−0.0050.2770.26894.5%−0.0060.2770.26594.5%
α= 1.00.0110.3190.31494.9%−0.0060.3120.30893.0%
γ = 00.0060.2000.20097.4%
θ = 1.0−0.0030.2630.27293.5%−0.0140.2560.26394.6%
表3

模拟结果:设置III的参数估计

共享脆弱性模型简化模型
参数偏差东南方扫描电镜人物配对关系偏差东南方扫描电镜人物配对关系
β=1.0−0.0050.2770.26894.5%−0.0060.2770.26594.5%
α= 1.00.0110.3190.31494.9%−0.0060.3120.30893.0%
γ = 00.0060.2000.20097.4%
θ = 1.0−0.0030.2630.27293.5%−0.0140.2560.26394.6%
共享脆弱性模型简化模型
参数偏差东南方扫描电镜人物配对关系偏差东南方扫描电镜人物配对关系
β = 1.0−0.0050.2770.26894.5%−0.0060.2770.26594.5%
α= 1.00.0110.3190.31494.9%−0.0060.3120.30893.0%
γ = 00.0060.2000.20097.4%
θ=1.0−0.0030.2630.27293.5%−0.0140.2560.26394.6%

图1显示的直方图论坛,论坛、和论坛。在所有设置中论坛论坛近似对称且正常,而论坛向右倾斜。The distribution of论坛向其符号的方向倾斜(正或负)。

α、β、γ和θ参数估计的直方图。(a) –(d)设置I;(e) –(h)设置II;(i) –(l)设置III。
图1

参数估计的直方图α、β、γ和θ。(a) –(d)设置I;(e) –(h)设置II;(i) –(l)设置III。

图2给出了重复事件和终止事件的累积基线风险函数的估计。为了简单起见,我们只包括时间为0.1、0.2、…、0.8的点。在每个设置中,我们绘制了真实的累积基线风险函数R(右)0(t吨) = 2t吨和∧0(t吨) = 0.5t吨用于比较。可以看出论坛因为所有设置实际上都是无偏见的。论坛在设置I和设置III中也几乎没有偏差,但在设置II中向上倾斜。

R0(t)和∧0(t”)的估计值和95%置信区间。(a和b)设置I;(c和d)设置II;(e和f)设置III.每个时间点的危险函数平均值用点表示;从800个重复中获得估计的累积基线危险的逐点95%经验置信区间。
图2

估计值和95%置信区间R(右)0(t吨)和∧0(t吨)。(a和b)设置I;(c和d)设置II;(e和f)设置III。每个时间点的危险函数的平均值用一个点表示;从800次重复中获得估计的累积基线风险的逐点95%经验置信区间。

我们还绘制了假设γ=0的简化模型中累积基线风险的估计值(结果未显示)。两者都有论坛论坛在设置I中偏向向下,在设置II中偏向向上,而在设置III中没有偏向论坛这是因为简化模型错误地估计了模型中的死亡风险(6)采用边际比例风险法。偏差论坛死亡事件的独立审查结果。

5.应用

我们将所建议的方法应用于患有肾脏疾病的移植候选者的住院数据。数据来自移植受者科学注册(SRTR)数据库(梅里昂,2003)。该分析包括1999年1月1日至1999年1月份31日期间登记的所有肾移植患者。住院和生存随访于2002年12月31日结束。我们对考虑协变量信息的住院和生存事件过程的联合建模感兴趣(以天为单位)。

本研究共纳入1121名患者。其中男性646人(58%),白人743人(66%)。注册时的平均年龄为47岁。住院人数从0到33人不等,平均每位患者2.6人,而460人(41%)没有住院。住院人数的广泛性表明,受试者之间存在很大差异。在此期间,609名患者,即54%的患者进行了肾移植。研究结束时,233人死亡,375人被审查,其余人在该日期之前被审查。在下文中,我们假设审查与住院和死亡无关。为了避免出现平局,我们从均匀(0,1)分布(以天为单位)向每个患者的事件时间中添加了一个随机数。

我们从“复发事件”分类中排除了两种情况。首先,因移植而住院不算作住院。第二,如果患者在住院期间死亡,则只算作终末事件,而不算作住院。医院出院时间用作复发事件时间。

分析中的基线协变量包括年龄、种族(1=白人,0=非白人)和性别(1=男性,0=女性)。移植状态Tx(1=移植后,0=移植前)是存活的时间依赖性协变量。对于住院治疗,我们使用两个指标变量来研究移植的影响:Tx1(1=移植后180天内,0=其他)和Tx2(1=180天以上,0=其它)。

初步研究表明,种族、性别和年龄对该样本的住院风险没有显著影响。我们的最终模型是

(11)

我们将结果总结为表4.

表4

肾脏病患者住院数据分析

协变量估算东南方第页-价值人力资源
用于住院治疗
Tx1:移植后180天内0.710.069<0.00012.03
Tx2:移植后180天以上−0.220.0790.0060.80
为了生存
比赛−0.190.180.200.83
性别0.170.200.211.19
年龄0.0490.0059<0.00011.05
Tx:移植后−0.580.170.00050.56
γ0.560.078<0.00011.76
θ2.20.12
协变量估算东南方第页-价值人力资源
用于住院治疗
Tx1:移植后180天内0.710.069<0.00012.03
Tx2:移植后180天以上−0.220.0790.0060.80
为了生存
比赛−0.190.180.200.83
性别0.170.200.211.19
年龄0.0490.0059<0.00011.05
Tx:移植后−0.580.170.00050.56
γ0.560.078<0.00011.76
θ2.20.12
表4

肾脏病患者住院资料分析

协变量估算东南方第页-价值人力资源
用于住院治疗
Tx1:移植后180天内0.710.069<0.00012.03
Tx2:移植后180天以上−0.220.0790.0060.80
为了生存
比赛−0.190.180.200.83
性别0.170.200.211.19
年龄0.0490.0059<0.00011.05
Tx:移植后−0.580.170.00050.56
γ0.560.078<0.00011.76
θ2.20.12
协变量估算东南方第页-价值人力资源
用于住院治疗
Tx1:移植后180天内0.710.069<0.00012.03
Tx2:移植后180天以上−0.220.0790.0060.80
为了生存
比赛−0.190.180.200.83
性别0.170.200.211.19
年龄0.0490.0059<0.00011.05
Tx:移植后−0.580.170.00050.56
γ0.560.078<0.00011.76
θ2.20.12

在肾移植后的前180天,住院率几乎翻了一番(人力资源= 2.03,第页< 0.0001). 180天后,住院率下降20%(第页=0.005)。移植对患者的生存时间也有积极影响。它降低了44%的死亡率(第页= 0.0005). 种族和性别对生存率没有任何显著影响,而年龄每增加1年,死亡率就会增加约5%(第页< 0.0001).

患者的住院率差异很大论坛,这是由于患者住院人数的广泛性造成的。我们还观察到论坛,显著大于0(第页< 0.0001). 这意味着住院率和死亡率正相关。

我们通过评估各种分层的估计累积危险函数来检查所采用模型的充分性。首先,我们将受试者分为两个年龄组:年轻(<47岁)和老年(≥47岁)。我们用与中相同的调整变量拟合年龄分层模型(11).的绘图论坛论坛与对数的比较t吨显示在中图3a和3b分别是。两幅图中曲线的平行性表明,在调整其他协变量后,年龄比例风险模型是一个非常好的近似值。我们观察到年轻患者和老年患者在论坛这证明了年龄的排除是正当的。

年龄模型检查。(a) 对数RÉ0(t)。(b) ●●●●。(-)全部;(●)年轻;和(-)旧。
图3

模型年龄检查。(a) 日志0(t吨)。(b)论坛.(-)全部;(●)年轻;和(-)旧。

对于时间依赖性移植协变量Tx,模型检查检查时间尺度的适当选择以及比例风险假设。数据分为移植前和移植后随访期。分离移植前数据相当于在移植时审查数据。由于肾移植在很大程度上取决于外部因素,例如等待时间和供体器官的基因匹配,而不是取决于患者的情况,因此这种审查被合理地视为独立的。如下所示,移植前的速率几乎是恒定的,因此移植的简单比例危害效应将对应于恒定的移植后速率,而不依赖于移植的时间。对于移植后组,时间来源被重新定义为移植时间,以确定移植前与移植后的比率是否随移植后的时间而变化。

我们显示结果论坛论坛t吨在里面图4对于移植前组,论坛在中几乎是线性的t吨,表明事件发生率近似恒定。移植后住院率并非随时间而恒定,在180天左右斜率发生变化,这与住院风险模型中包含Tx1和Tx2相一致。图4b说明了这一点论坛移植前600天左右的斜率变化不大,而移植后死亡率几乎不变。如果有必要,一个更详细的模型可以解释这种非比例性。

移植状态Tx.(a)和(b)的模型检查。(-)全部;(…)预移植;和(-)移植后。
图4

移植状态的模型检查Tx(a)论坛和(b)论坛.(-)全部;(…)预移植;和(-)移植后。

我们还将从等待名单登记到移植的时间模型(以月为单位)作为移植后组的基线协变量。移植时间不是住院率的重要预测因素(人力资源= 1.00,第页=0.73),表明移植效果相对于移植时间是恒定的。但它是生存率的重要预测因素(人力资源= 1.03,第页=0.03),表明移植时间和移植效果之间有相互作用项的模型更适合数据(Meier-Kriesche等人,2001年)。当前的结果(显示时没有交互项)代表了此数据集中移植次数范围内移植的平均效果。

诊断结果表明,我们的模型可以通过使用Weibull模型对基线危险进行简化,如图3.

6.讨论

在这篇文章中,我们提出了一个重复事件和终结事件的共享脆弱性模型。我们的模型可以很容易地推广。脆弱性的其他功能形式可以纳入关节模型(5)(6)如死亡率强度中ν的指数函数。只需对脆弱项的(预期)函数进行微小修改,就可以很容易地调整相应的似然和估计方程。可以利用地层特定模型或脆弱性与其他协变量之间的相互作用。其他参数族可用于脆弱性分布,例如对数正态分布(黄和沃尔夫,2002)。这些模型比Lancaster和Intrator(1998),这对复发事件和死亡率都假设了常见的伽玛射线脆弱性效应。所提出的联合模型还可以包含与时间相关的协变量。可以在我们的模型中估计终端事件的参数,这与Wang等人(2001).

我们没有使用剖面似然法来估计方差,因为脆弱性分布θ方差的估计结果向下倾斜。Andersen等人(1997年)在独立审查的情况下对这一问题进行了研究,得出了相同的结论。

λ的固定维模型的使用0(t吨)和第页0(t吨)将导致标准的最大似然渐近性质。我们假设这些函数是非参数形式的,所以估计量的大样本性质不能用通常的中心极限理论来验证。然而,仿真结果表明了该方法的渐近有效性。墨菲(1995)研究了共享gamma脆弱模型在无协变量和无终止事件的简单环境下的渐近性质。帕纳(1998)将Murphy的结果推广到更一般的具有协变量的关联脆弱性模型。这些结果为建立所提出估计量的渐近性质提供了一种方法。

方程式(3)(4)在复发事件和死亡不可能同时发生的条件下是等价的。在我们的应用程序中,如果复发事件发生在死亡之前(例如住院期间死亡),我们只将其视为终末期事件,而忽略复发事件。也就是说,我们对复发事件的定义实际上是“复发而无死亡”

当我们重写时(5)作为第页(t吨)=经验(βT型Z轴+对数ν)第页0(t吨),对数ν是复发事件的比例危险协变,按比例缩放为系数1。同样,它也是存活率与系数γ的协变量。复发事件和终末事件之间的真正关系可能是一个涉及时间的复杂函数,该函数在建议的模型中进行了近似处理,以捕获由于未测量的协变量导致的关联。另一种方法是通过替换ν来假设一个鲁棒模型γ在里面(6)通过可通过非参数技术(如样条曲线)估计的函数。关于脆弱性的分布假设可以类似于格利登(1999).Oakes(1989)开发了相关模型的诊断方法。他的方法并不直接适用于我们的模型,但可以为未来的研究提供有价值的见解。其他检查所建议模型有效性的方法值得进一步研究。

致谢

作者感谢裁判和副主编的仔细阅读,感谢J.Kalbfleisch博士、D.Ghosh博士和D.Schaubel博士的有益评论。我们还感谢移植受者科学登记处准备肾脏住院数据。

参考文献

安徒生
,
P.K.公司。
,
博根
,
O。
,
,
R。
、和
基丁
,
N。
(
1993
).
基于计数过程的统计模型
.
纽约
:
施普林格
.

安徒生
,
P.K.公司。
,
克莱因
,
J。
,
努森
,
K。
、和
帕拉西奥斯
,
R。
(
1997
).
具有共享γ脆弱性的Cox回归模型的方差估计
.
生物计量学
 
53
,
1475
——
1484
.

厨师
,
R·J。
无法无天的
,
J.F.公司。
(
1997
).
复发事件和终止事件的边际分析
.
医学统计学
 
16
,
911
——
924
.

厨师
,
R·J。
无法无天的
,
J.F.公司。
(
2002
).
重复事件分析
.
医学研究中的统计方法
 
11
,
141
——
166
.

德格鲁托拉
,
五、。
,
X月。
(
1994
).
CD4+淋巴细胞计数的建模进展及其与生存时间的关系
.
生物计量学
 
50
,
1003
——
1014
.

格利登
,
直流电。
(
1999
).
多元失效时间伽马脆弱性模型的充分性检验
.
生物特征
 
86
,
381
——
393
.

高希
,
D。
,
D.Y.博士。
(
2000
).
复发事件和死亡的非参数分析
.
生物计量学
 
56
,
554
——
562
.

高希
,
D。
,
D.Y.博士。
(
2002
).
复发事件和终末事件的边际回归模型
.
中国统计局
 
12
,
663
——
688
.

霍根
,
J。
莱尔德
,
N。
(
1997
).
重复测量和事件时间联合分布的混合模型
.
医学统计学
 
16
,
239
——
257
.内政部:

,
十、。
Wolfe公司
,
注册会计师。
, (
2002
).
信息审查的脆弱模型
.
生物计量学
 
58
,
510
——
520
.

卡尔布弗雷希
,
J。
普伦蒂斯
,
R。
(
2002
).
失效时间数据的统计分析
,第2版。
纽约
:
威利
.

克莱因
,
J。
(
1992
).
基于EM算法的Cox模型随机效应的半参数估计
.
生物计量学
 
48
,
795
——
806
.

兰卡斯特
,
答:。
内部代理人
,
O。
(
1998
).
存活率的小组数据:HIV阳性患者的住院治疗
.
美国统计协会杂志
 
93
,
46
——
53
.

,
问:。
拉加科斯
,
美国。
(
1997
).
使用Wei–Lin–Weissfeld方法分析复发事件和终止事件
.
医学统计学
 
16
,
925
——
940
.内政部:

,
D.Y.博士。
,
世界环境学会
,
洛杉矶。
,
,
一、。
、和
,
Z.公司。
(
2000
).
复发事件均值和速率函数的半参数回归
.
英国皇家统计学会期刊,B辑
 
62
,
711
——
730
.内政部:

,
R。
(
1995
).
重复测量研究中的退出机制建模
.
美国统计协会杂志
 
90
,
1112
——
1121
.

路易斯
,
T。
(
1982
).
使用EM算法时发现观测信息矩阵
.
英国皇家统计学会杂志B辑
 
44
,
226
——
233
.

梅埃尔·克里什(Meier-Kriesche)
,
H.-U公司。
,
端口
,
F.K.公司。
,
奥霍
,
A.O.公司。
,
莱希特曼
,
答:B。
,
鲁季奇
,
S.M.公司。
,
阿恩多弗
,
J.A.公司。
,
打孔
,
J·D·。
、和
卡普兰
,
B。
(
2001
).
等待时间对肾移植结果的不利影响
.
移植程序
 
33
,
1204
——
1206
.内政部:

梅里昂
,
R。
(
2003
).
前言:SRTR移植状况报告
.
美国移植杂志
 
(
补充4
),
5
——
6
.内政部:

墨菲
,
美国。
(
1995
).
脆弱模型的渐近理论
.
统计年刊
 
23
,
182
——
198
.

尼尔森
,
G.公司。
,
,
R。
,
安徒生
,
第页。
、和
索伦森
,
T。
(
1992
).
脆弱模型最大似然估计的计数过程方法
.
斯堪的纳维亚统计杂志
 
19
,
25
——
43
.

橡树
,
D。
(
1989
).
脆弱性诱发的双变量生存模型
.
美国统计协会杂志
 
84
,
487
——
493
.

帕纳
,
E.公司。
(
1998
).
相关Gamma-frailty模型的渐近理论
.
统计年刊
 
28
,
183
——
214
.

罗宾斯
,
J。
罗特尼茨基
,
答:。
(
1992
).
使用替代标记恢复信息和调整从属审查
.英寸
艾滋病流行病学-方法学问题
,
N。
 
珠宝
,
K。
 
迪茨
、和
五、。
 
再会
(编辑),
297
——
331
波士顿:伯克豪斯。

太阳
,
J。
歌曲
,
第页。
(
2001
).
具有信息截尾时间的重复测量的统计分析
.
医学统计学
 
20
,
63
——
73
.内政部:

,
M。
,
,
J。
、和
蒋介石
,
C、。
(
2001
).
利用信息审查分析复发事件数据
.
美国统计协会杂志
 
96
,
1057
——
1065
.内政部:

世界环境学会
,
洛杉矶。
,
,
D.Y.博士。
、和
魏斯菲尔德
,
L。
(
1989
).
基于边际分布建模的多元不完全失效时间数据回归分析
.
美国统计协会杂志
 
84
,
1065
——
1073
.

,
J。
Zeger公司
,
美国。
(
2001
).
纵向数据的联合分析,包括重复测量和事件发生时间
.
应用统计学
 
50
,
375
——
387
.

附录A

很难直接从

哪里如果(O(运行) | ν)在中给出第2节使用Metropolis–Hastings(M–H)算法生成随机数链ν() (= 1, …,M(M))。假设我们在k个第th个E阶,当前参数估计值下标为(k个)。M–H链以初始值ν开始(1) .在我们获得ν之后() ,一个新值论坛以方差θ从伽马脆弱性中取样(k个).我们还绘制了一个独立的随机数u个来自Uniform(0,1)。ν(+ 1) 获得方式为

通知如果(O(运行) )在比率中被取消。

附录B

在M步骤中α, γ, λ0(·)和θ为

我们获得了Breslow型基线风险估计值,如下所示

的二阶导数α,γ为

哪里 ⊗0= 1, ⊗1=、和 ⊗2=aa公司T型.

信息矩阵的更多组成部分如下所示:

具有

所有其他非对角线项为零。

在平均值为1且方差为θ的伽马脆弱性的特殊情况下,我们有

其中Ψ1(·)和Ψ2(·)是digamma和trigamma函数,即log(Γ(·))的一阶和二阶导数。

本文根据牛津大学出版社标准期刊出版模式的条款出版和发行(https://academic.oup.com/journals/pages/open_access/funder_policies/chorus/standard_publication_model)