总结

在大多数癌症和艾滋病临床试验中,纵向数据和生存数据的联合建模变得越来越重要。我们提出了一种可能性方法,将纵向和生存成分扩展为多维。提出了一个多元混合效应模型,以明确捕获纵向测度随时间变化的两种不同相关性以及不同变量之间的相关性。对于联合模型的生存部分,我们引入了一个共享脆弱性,假设其具有正稳定分布,以诱导故障时间之间的相关性。提出的边际单变量生存模型二者都然后将事件发生时间的零治愈分数和非零治愈分数应用于每个边缘生存函数。当基线协变量通过特定机制指定时,所提出的多变量生存模型对人口风险有条件和边际的比例风险结构。此外,该模型能够处理具有不同治愈率结构的生存函数。该方法专门用于国际乳腺癌研究小组(IBCSG)的试验,以调查生活质量、无病生存率和总生存率之间的关系。

1.简介

通常在主要终点为事件发生时间的临床试验中,在整个随访期内,也会根据一个或多个生物终点对患者进行纵向监测。这可以通过在感染性疾病的情况下采取免疫学或病毒学措施来实现,也可以通过问卷调查来评估接受特定治疗后的生活质量(QOL)。这些纵向测量在长期随访后往往不完整,并且可能容易产生测量误差。它们很重要,因为它们可以预测存活率。因此,在大多数癌症和艾滋病临床试验中,能够同时模拟纵向和存活成分的方法变得越来越重要。

在统计文献中,一些作者研究了纵向数据和时间-事件数据的联合模型。Tsiatis、DeGruttola和Wulfsohn(1995)提出了一种两阶段程序,将纵向数据建模的估计值插入Cox比例风险模型。尽管与直接在Cox模型中使用原始协变量数据相比,他们的模型减少了偏差,但基于联合似然函数规范的似然方法可以更有效地使用数据。在给定纵向轨迹的情况下,通过假设纵向数据和生存数据的条件独立性来构建联合似然。轨迹函数表示真实的潜在纵向度量。Wulfsohn和Tsiatis(1997)福塞特和托马斯(1996)两者都假设了生存的比例风险模型,条件是具有不同估计程序的潜在轨迹函数。Wulfsohn和Tsiatis(1997)实现了一个EM算法来适应这个模型,而福塞特和托马斯(1996)采用贝叶斯马尔可夫链蒙特卡罗(MCMC)技术进行估计。亨德森、迪格尔和多布森(2000)Xu和Zeger(2001a)引入了平稳高斯过程,允许轨迹随时间变化。王和泰勒(2001)采用贝叶斯方法和集成的Ornstein–Uhlenbeck(IOU)过程来监测纵向过程中关于平稳趋势的生物波动。易卜拉欣、陈和辛哈(2004)Xu和Zeger(2001b)、和Song、Davidian和Tsiatis(2002年)所有这些都将纵向模型扩展到了多元情况。Tsiatis和Davidian(2004)易卜拉欣、陈和辛哈(2001年,第7章)详细讨论了关节建模。

统计文献中迄今为止开发的所有联合模型都侧重于单变量时间-事件数据。然而,在许多应用中,可能需要用几种失效时间随机变量联合建模纵向数据,例如两个不同器官的癌症复发时间、癌症复发和死亡时间、首次和第二次感染时间等。这些随机变量通常是相关的,检查它们与纵向标记的联合关系可能很有意义。此外,这种多变量时间-事件数据可能具有联合或边缘生存曲线,在超过一定的随访期后“稳定”(参见Ibrahim等人,2001年第5章;陈、易卜拉欣和辛哈,2002年). 因此,重要的是开发一个多变量生存模型,该模型能够容纳每个边缘生存函数的可能治愈分数,并将相关的多变量纵向标记与该模型联系起来。

国际乳腺癌研究小组(IBCSG)进行的一项临床试验主要推动了拟议联合模型的开发。他们指导了一项大型临床试验,即IBCSG试验VI,对患有结节阳性乳腺癌的绝经前妇女进行研究,以研究辅助化疗的持续时间和延迟化疗的再次引入。在这项研究中,除了辅助治疗效果外,还假设患者的生活质量可以携带预后信息并预测乳腺癌的进展。随着时间的推移,使用自我评估生活质量问卷对四项生活质量指标进行了反复评估,该问卷存在测量误差和信息缺失。在该试验中,根据两个失败时间随机变量(无病生存期(DFS)和总生存期(OS))监测癌症进展。由于现代医学的进步,DFS和OS在许多癌症(包括乳腺癌)的生存曲线上都经常出现停滞。为了证明这一现象,图1显示了观察到的所有患者的DFS和OS的Kaplan–Meier曲线。随访约12年后,DFS曲线明显出现平台,表明人群中治愈率为正。对于OS,根据给定的随访期,尚不清楚生存功能是否稳定。

观察DFS和OS的卡普兰-迈耶曲线。
图1

观察DFS和OS的卡普兰-迈耶曲线。

在本文中,我们提出了一种新的多元生存模型来捕获数据集中的这些特征。具体来说,我们提出了一种联合似然方法来联合建模多维生活质量和双变量故障时间随机变量DFS和OS。我们假设,给定潜在的QOL轨迹函数,QOL和双变量失效时间(DFS,OS)是条件独立的。对于联合模型的纵向分量,提出了一个多元混合效应模型,以明确捕获重复多维QOL测量之间的不同依赖来源。两种类型的依赖结构捕获了随时间变化的测量之间的依赖以及不同纵向标记之间的依赖,与多元纵向数据相关。

对于联合模型的生存部分,我们引入了一个共同的脆弱性(克莱顿,1978年;Hougaard,1986年;橡树1989)假设其具有正稳定分布,以诱导故障时间之间的相关性。考虑到常见的脆弱性,所有感兴趣的生存反应都被认为是独立的。边际单变量生存模型二者都然后将事件发生时间的零治愈分数和非零治愈分数应用于每个边缘生存函数。该模型源于雅科夫列夫和茨奥迪科夫(1996)在该模型中,我们提出了一种非齐次泊松过程,以一种新的方式建模并将协变量信息纳入疾病发展过程。这种对疾病动态过程的概括产生了一种适应的特征二者都生存函数中的零和非零治愈分数。

我们在这里提出的多元生存模型在几个方面都很有吸引力。首先,当基线协变量通过泊松过程的平均函数以生物方式输入时,该模型具有人口风险的比例风险结构,无论是有条件的还是边际的。第二,该模型能够处理具有不同治愈率结构的生存函数,从而适应适当和不适当生存函数的混合。第三,结合纵向数据,该模型在计算上是可行的。特别是,通过引入潜在变量,我们开发了类似于的MCMC算法Chen、Ibrahim和Sinha(2002)这使我们能够从关节后向分布中提取参数。使用改进版的折叠吉布斯技术刘(1994),我们的计算开发促进了后验分布的有效吉布斯采样方案。

在下一节中,我们将描述乳腺癌临床试验的基本数据结构。第3节,我们回顾了新模型的框架和吸引人的特性。第4节,我们进行了两组仿真研究,以说明所提出的多元生存模型的可行性和特性,并评估我们的联合模型的性能。乳腺癌数据集的详细分析也在第4节。简要讨论见第5节

2.数据结构

IBCSG对有淋巴结阳性乳腺癌的绝经前妇女进行了一项临床试验,即IBCSG试验VI,以调查辅助化疗的持续时间(口服环磷酰胺、甲氨蝶呤和氟尿嘧啶[CMF]的三个初始周期与六个初始周期)以及再次进行三个单一疗程的延迟化疗。按照2×2析因设计,每名参与者被随机分配,在连续的第1至6个月接受6个初始疗程的CMF治疗,其中包括(CMF6RE)或(CMF6)在第9、12和15个月接受3个单一疗程的CMF6治疗;或连续第1至3个月进行三次CMF初始疗程,在第6、9和12个月进行(CMF3RE)或(CMF3)三次单疗程的CMF再引入。随机分组根据参与机构、手术类型和雌激素受体(ER)状态进行分层。复发日期定义为诊断出或首次怀疑复发疾病的时间,DFS定义为从随机分组到任何复发、第二原发癌发生或死亡的时间。DFS和OS(定义为从随机化到死亡的时间)都是随着时间的推移而监测的。不同的治疗程序可能会影响DFS和OS,以及年龄、ER状态(阴性/阳性)和肿瘤阳性结节数。该试验由国际乳腺癌研究小组(1996年)

作为试验的一部分,定期向所有参与者分配生活质量问卷,其中包括四项与乳腺癌患者特别相关的健康相关生活质量指标。用单项目线性模拟自我评估量表评估身体健康(糟糕)、情绪(痛苦)、食欲(不好)和感知到的应对方式(“你为应对疾病付出了多少努力?”[非常理想])。得分在0到100之间,数字越大,表明感知的生活质量越好。测量误差可能是由于问卷的可靠性可能不完善而产生的,假设问卷的可靠性随着时间的推移而独立发生。不同的生活质量指标可能相互关联,相关性很可能为正。例如,快乐的心情大多与良好的食欲和身体健康有关,反之亦然。辅助化疗的毒性可能对患者的生活质量产生不利影响。不同年龄的患者或不同文化背景的患者对生活质量的认知可能不同。将纵向QOL测量纳入DFS和OS的双变量生存模型中,可以证明QOL对癌症进展的预后影响,并提供辅助治疗和其他辅助协变量的调整生存益处。在考虑了可能对生活质量产生的不利影响以及生活质量与DFS和OS的关系后,确定了辅助治疗的最佳持续时间和时机。患者和医生都可以在权衡生存益处和生活质量回报后,做出治疗决定。

我们分析了来自瑞士、瑞典和新西兰/澳大利亚的832名患者的数据,每个患者都有一套以上完整的生活质量评估。在研究开始时以及随机化后第3个月和第18个月评估生活质量的感知。数据集中包括2154个生活质量观察结果。图2显示三次观察时的平均生活质量分数。平均而言,患者在首次手术后18个月感觉到他们的生活质量有所改善,而这种改善对他们的情绪和感知到的应对方式最为显著。然而,随着时间的推移,感知到的情绪和应对方式比感知到的食欲和身体健康状况相对较差。DFS中位数为7.611年,审查率为46.39%,而OS中位数为9.255年,审查比率为63.10%。DFS的Kaplan–Meier曲线图1表明长期随访后治愈分数为非零。对于OS,根据给定的随访期,尚不清楚生存功能是否稳定。在这项研究中死亡的所有患者也都复发了。

随着时间的推移,生活质量得分中位数。
图2

随着时间的推移,生活质量得分中位数。

3.关节建模

在本节中,我们将回顾新模型的背景和框架。为了清晰和易于解释,我们将重点讨论一个双变量生存模型,就像IBCSG数据一样,因为对一般多元情况的扩展非常简单。Y(Y)是DFS和OS的载体,X(X)是纵向QOL测量的观察向量,Z轴是模型生存部分的基线协变量向量,以及R(右)是模型纵向分量的协变量向量(可能随时间变化)。的组件Z轴可能不同于R(右)它允许生存模型和纵向模型之间有不同的协变量信息。此外,在DFS和OS的生存模型组件中可以允许不同的协变信息,但这里不讨论这种泛化。

由于每个QOL指标对应的测量误差,我们假设一个潜在的轨迹函数X(X)*代表真实的生活质量,以及R(右)影响X(X)只有通过它对X(X)*. 在联合建模框架中,我们具体假设临床事件时间向量,Y(Y)和重复QOL测量的向量,X(X),是有条件独立给定的X(X)*. 基于这些假设,我们

(1)

完整数据的联合可能性{Y(Y)X(X)X(X)*}需要三个组件的规格,P(P)(Y(Y) | Z轴X(X)*),P(P)(X(X) | X(X)*)、和P(P)(X(X)* | R(右)). 在文献中,几位作者提出了基于这三种成分不同分布假设的方法。我们的假设[X(X) | X(X)*]和[X(X)* | R(右)]结果是一个多元纵向模型,在重复测量中具有明显不同的依赖结构,因此允许对每个结构进行直接推断。对于生存组件[Y(Y) | Z轴X(X)*],我们提出了一个能够同时容纳DFS和OS的零治愈分数和非零治愈分数的多元生存模型。

3.1多元纵向过程

随着时间的推移,测量了一个以上的生活质量指标,在对单个患者的观察中涉及两个水平的依赖结构。第一个层次涉及每个指标随时间的依赖性,而第二个层次涉及不同指标的依赖性。提出了一个多元正态混合效应模型来显式地模拟这两种依赖来源。x个伊克(t吨ij公司)是对k个第个QOL指示符当时的第个病人t吨ij公司x个*伊克(t吨ij公司)是表示其真值的相应轨迹函数,其中k个= 1, … , q个j个= 1, … , n个、和=1n个.纵向模型x个伊克(t吨ij公司)由提供

(2)

其中εijk公司表示测量误差。R(右)伊克(t吨ij公司)是协变量的向量(可能随时间变化)k个当时的第个QOL指示器t吨ij公司轨迹函数建模为

(3)

哪里W公司伊克(t吨ij公司)是随机效应设计矩阵,它是固定效应设计矩阵的子集R(右)伊克(t吨ij公司)和ηk个b条伊克是长度为k个和γk个分别为。我们假设

和εij公司·独立于b条伊克,式中εij公司·=[εij公司1, … , ε智商]T型因此,同时观察到的纵向QOL指标的测量误差可能相互关联,但在不同时间评估的观察结果之间是独立的。∑的结构表征了同时测量的生活质量指标之间的关联,并假设在不同时间段和患者之间是常见的。另一方面,引入随机效应b条伊克在轨迹函数中,为重复的QOL测量引入了一个公共因子第个病人k个th指示器。Ψ的结构k个描述了k个第个QOL指标,并假设不同指标不同。为了避免不同依赖结构模型的混淆效应,我们进一步假设轨迹函数在QOL指标之间是独立的,即:,b条伊克是独立的k个测量误差与潜在轨迹函数无关。根据这些假设,假设在不同时间点测量的生活质量指标是不相关的。

Xu和Zeger(2001b)提出了一个联合模型来评估精神分裂症临床试验中的多个替代终点。他们假设εijk公司N个(0, σ2k个)和b条N个υ(0,Ψ)独立,其中b条=[b条T型1, … , b条T型智商]T型且γ=γ1+ ⋯ +υq个.随机效应的联合分布假设b条同时对这两种依赖结构进行建模。Ψ的规范本身包含了重复测量之间依赖性的所有信息,包括不同时间点测量的标记之间的相关性。使用Xu和Zeger的模型,对不同的依赖结构进行单独的推断变得不那么简单。他们的模型和我们的模型中协方差参数的数量之间的差异是论坛,随着随机效应的维数和标记数的不断重复测量而增加。在单变量纵向过程的情况下,这两个模型是等价的。

3.2一个新的双变量生存模型

我们首先讨论了这个没有协变量信息的新模型的框架和性质。预后因素和生存时间之间的联系是通过特定的生物学机制提出的。Y(Y)= (Y(Y)1Y(Y)2)为双变量故障时间,其中Y(Y)1是癌症复发的时候了Y(Y)2是IBCSG数据集的死亡时间。在我们的方法发展中(Y(Y)1Y(Y)2)假设为无序,并在平面的上半部有支撑。考虑到共同的弱点w个Y(Y)1Y(Y)2假设是独立的,并且假设任一事件的发生分别遵循疾病过程,如下所示:受雅科夫列夫和茨奥迪科夫(1996),我们假设事件(失败)存在潜在的(未观察到的)前兆,并且任何潜在前兆发展成为真实事件都会导致观察到的事件。潜在前兆的数量,代表了事件发展的“风险”,被认为是随时间变化的。图3在DFS事件中显示了一个简单的图表来说明这个想法。在图中,有四个转移竞争性肿瘤细胞(潜在的前体)发生在5年的随访期间,患者在第四年前复发,第二年有转移能力的肿瘤细胞首先发展成为可检测的肿瘤。N个= (N个1(t吨),N个2(t吨))是潜在前兆的数量(Y(Y)1Y(Y)2)时间t吨,然后让

是事件发生时潜在前兆的相应总数Y(Y)1=1Y(Y)2=2。我们始终假设

哪里波阿斯(x个)表示平均泊松分布x个、和N个1(t吨)和N个2(t吨)考虑到脆弱性,有条件地独立w个.两者N个1(t吨)和N个2(t吨)是未观察到的潜在变量。共同因素w个诱导之间的相关性N个1(t吨)和N个2(t吨),从而在Y(Y)1Y(Y)2.泊松假设N个1(t吨)和N个2(t吨)通过添加相同的额外泊松变量来放松w个通过各自的平均值λ1(t吨)和λ2(t吨). 利用泊松过程的性质,N个*1N个*2也具有具有相应平均值的泊松分布w个Λ1(1)和w个Λ2(2),其中论坛,用于= 1, 2. 时间上准确出现前兆的共同密度t吨,给定N个*在活动时间,用于=1,2,是(t吨) =λ(t吨)/Λ().

U型1= 1, … , N个*1,是引发事件的第一个事件的潜在前兆,以及U型2=1N个*2,是引发事件的第二个事件的潜在前兆。两者都有U型1U型2是未观察到的潜在变量。鉴于N个*,用于= 1, 2, {U型毫升}假设具有相同且独立分布的分布函数F类(t吨) = 1 −S公司(t吨),独立于N个*.从生物学角度来说,假设N个*U型毫升是独立的,因为潜在前体的发生和发展可能涉及不同的机制。大量的前体总量N个*并不一定意味着个人进步过程更长(更大U型毫升)针对每个前体。联合生存功能(Y(Y)1Y(Y)2|w个)然后由给出

(4)

我们接受w个以参数ρ为指标的正稳定律分布,表示为w个稳定(ρ),其中0<ρ<1。在多元生存环境中,正稳定律分布的选择是非常有吸引力的、常见的和灵活的。此外,它将为所提出的双变量生存模型产生一些理想的性质。

以下伊布拉基莫夫和切宁(1959),的稳定(ρ)密度w个(0<ρ<1)可以表示为

(5)

哪里论坛论坛.拉普拉斯变换w个由提供E类w个[经验(−开关)]=经验(−ρ). 使用拉普拉斯变换w个,直接推导得出无条件生存函数

(6)

然后,联合固化分数由下式得出

发件人方程(6),边际生存函数为

(7)

可以表明,只要基线协变量通过λ建模,每个边际生存函数都具有比例风险特性(t吨),并且不考虑时变协变量。发件人方程式(7),边缘固化分数为

(8)

对于= 1, 2. 什么时候?论坛是有界的th边缘生存函数具有非零治愈分数,否则生存函数为方程式(7)导致适当的生存功能(即。,S公司*(∞) = 0). 每个边缘生存函数都有自己的一组条件来确定治愈分数的存在,因此联合生存函数可以容纳适当和不适当的边缘生存函数的混合。

参数ρ为Y(Y)1Y(Y)2ρ值较小表示Y(Y)1Y(Y)2,且ρ→1表示Y(Y)1Y(Y)2.以下克莱顿(1978)《橡树》(1989),我们可以计算关联的局部度量,用θ表示*(12),作为ρ的函数。这种关联度量定义为

(9)

中的度量方程(9)有条件分布的条件危险率比率的解释Y(Y)1,给定Y(Y)2=2,到的Y(Y)1鉴于Y(Y)2>2.对于中的生存二元模型方程(6), θ*(12)定义明确,由

(10)

我们看到θ*(12)减少(12). 之间的关联Y(Y)1Y(Y)2在以下情况下更大(12)都很小,关联性会随着时间的推移而降低。IBCSG数据需要这样的属性,其中Y(Y)1是时候复发了Y(Y)2是时候死了。当治愈分数在任一边缘生存函数中为正时,关联的全局度量(如Kendallτ或Pearson相关系数)没有很好的定义,因为由于生存函数不正确,时间-事件随机变量不存在矩。

合并来自两条纵向轨迹的信息x个*k个(t吨),k个= 1, … , q个和基线协变量Z轴在我们的生存模型中,我们让所有协变量都依赖于λ(t吨)通过关系

(11)

对于= 1, 2. 以这种方式输入协变量对应于泊松广义线性模型中的标准链接N个(t吨)是泊松计数。假设所有协变量都通过其对事件潜伏前兆平均数的影响影响存活率。使用方程式(11),我们可以根据失效时间随机变量的风险来解释回归系数的作用。具体来说,当相应的协变量取正值时,负回归系数导致较小的风险,而正系数导致较大的风险。

发件人方程式(3),我们注意到轨迹函数x个*k个(t吨)具有方差的正态分布W公司k个(t吨k个W公司T型k个(t吨),用于k个= 1, … , q个将这些轨迹函数作为时变协变量,如方程式(11)诱导λ之间的相关性1(t吨)和λ2(t吨). 换句话说,纵向测量不仅可以预测每个边际生存分布,而且可以在两个失效时间随机变量之间产生一定程度的相关性。因此,在联合建模框架中,脆弱性分布参数ρ和{W公司k个(t吨k个W公司T型k个(t吨),k个= 1, … , q个}共同提供了衡量Y(Y)1Y(Y)2

3.3联合可能性和先验

在本小节中,我们构造了具有特定轨迹函数选择以及提升时间分布假设的联合似然{U型1}和{U型2}. 该设置随后用于IBCSG数据的分析。X(X)={x个伊克(t吨ij公司),= 1, … , n个;j个= 1, … , n个k个= 1, … , q个},X(X)*={x个*伊克(t吨ij公司),= 1, … , n个;j个= 1, … , n个k个= 1, … , q个}、和R(右)= (R(右)1, … , R(右)n个),其中x个伊克(t吨ij公司)和x个*伊克(t吨ij公司)被观察到的是真实的吗k个第个QOL指标第th位患者t吨ij公司分别为和R(右)是纵向QOL测量的基线协变量的对应向量。对于每个QOL指标,我们将线性轨迹函数视为

其中我们以τ为层级中心伊克0=R(右)ηk个+b条伊克0和τ伊克1=b条伊克1(Gelfand、Sahu和Carlin,1996年)以促进MCMC算法的收敛。联合似然的推导主要集中在分析IBCSG数据集的线性纵向轨迹上;然而,可以进一步发展具有更一般轨迹函数的似然。这种泛化计算量大得多,为了便于说明,这里没有介绍。让τ0=(τ110, … , τ不合格0)和τ1= (τ111, … , τ不合格1). 此外,让Y(Y)= (Y(Y)1, … , Y(Y)), ν= (ν1, … , ν),N个*= (N个*1, … , N个*),Z轴= (Z轴1, … , Z轴n个)、和w个= (w个1, … , w个n个),用于=1,2,其中(Y(Y)1Y(Y)2)分别是观察到的DFS和OS第个病人,(ν1, ν2)是相应的审查指标,Z轴是DFS和OS的基线协变量向量,以及w个是脆弱的第th位患者。观测数据由下式给出D类光突发事件={n个M(M)X(X)Y(Y)1, ν1Y(Y)2, ν2R(右)Z轴}完整数据如下所示D类={D类光突发事件, τ0,τ1N个*1N个*2w个},其中论坛。如中所述方程式(1),完整数据的联合可能性需要指定三个组件,P(P)(X(X) | X(X)*),P(P)(X(X)* | R(右))、和P(P)(Y(Y) | X(X)*,Z轴). 所有三个分量都可以等效地表示为P(P)(X(X) | X(X)*)=P(P)(X(X) | τ0, τ1),P(P)(X(X)* | R(右)) =P(P)0, τ1 | R(右))、和P(P)(Y(Y) | X(X)*,Z轴) =P(P)(Y(Y) | τ0, τ1Z轴),因为所携带的信息X(X)*可以通过τ完全恢复0和τ1

分层居中后,P(P)(X(X) | τ0, τ1)由提供

(12)

其中θ1=Σ,X(X)ij公司·=[x个1(t吨ij公司) …x个智商(t吨ij公司)]T型, τ·0=[τ10…τ智商0]T型和τ·1=[τ11…τ智商1]T型.设β=(β1, … , βq个), Ψ= (Ψ1, … , Ψq个),且η=(η1, … , ηq个),其中βk个=[βk个0βk个1]T型.假设b条伊克=[b条伊克0b条伊克1]T型N个2k个, Ψk个),第二个组件,P(P)0, τ1 | R(右))由提供

(13)

其中θ2={β, Ψ, η}, τ伊克=[τ伊克0τ伊克1]T型、和μ伊克=[βk个0+R(右)ηk个βk个1]T型为了完成联合似然的最后一部分,我们进一步假设,对于每个时间到事件,潜在前兆的促进时间都是相同且独立的指数分布,即:,F类(t吨) = 1 −e(电子)αt吨,以及这些潜在前体在某一时间的平均数量t吨由提供

对于= 1, 2. 设θ={α1, α2, γ1, γ2, δ1, δ2,ρ},其中γ= (γ1, … , γmq(平方米))的= 1, 2. 与潜在的N个*1N个*2、和w个,第三个组件P(P)(Y(Y) | τ0, τ1Z轴)完整数据的联合似然由下式给出

(14)

哪里论坛、和

对于=1,2。潜在风险的引入N个*1N个*2、和w个在第三个组件中P(P)(Y(Y) | τ0, τ1Z轴)促进MCMC算法的进一步收敛。鉴于论坛表示前兆成为实时事件的条件密度函数t吨设θ=(θ1, θ2, θ)表示所有参数的集合。完整数据的联合似然由下式给出

(15)

通过总结N个*1N个*2和集成w个,用于= 1, … , n个,我们获得

(16)

哪里论坛论坛,用于= 1, 2. 该结果的证明在附录观测数据和(τ)的联合似然0, τ1)因此由下式给出

(17)

θ的先前规范如下所示。我们将接头优先级指定为

(18)

∑,{β的参数k个}, {ηk个}, {Ψk个}, {α}, {γ},{δ},和ρ假定是先验独立的。对于k个= 1, … , q个,我们对β取正常先验值k个和ηk个和Wishart之前的Ψ−1k个和∑−1.β的先验k个, ηk个,Ψk个和∑是由共轭考虑引起的。我们对γ的每个元素取一个正态先验值以及生存回归系数δ的向量,用于= 1, 2. 最后,对于=1,2,我们为α指定一个逆伽马先验和ρ的统一先验。在分析IBCSG数据时,所有参数都使用非信息性先验。

对于βk个, ηk个, Ψk个k个= 1, … , q个由于共轭,很容易获得∑,吉布斯样品。潜在的全部条件N个*1N个*2本质上是泊松分布,因此很容易获得样本。对于无闭合形式全条件分布的参数吉尔克斯与怀尔德(1992)用于获得δ的样品从它的log-convave完全条件分布。使用以下算法合并额外的Metropolis步骤吉尔克斯、贝斯特和谭(1995)获取γ样品, α,和潜在的τ,w个、和u个,其完全条件分布不是对数凹的。计算发展的技术细节见Chi和Ibrahim(2004)

4.仿真与应用

4.1模拟I

进行了一项模拟研究,以检验所提出的多元生存模型的可行性和性质。为了简单起见,我们只关注二元失效时间随机变量。在这种双变量情况下,有三种联合治愈分数结构。(i) 联合生存函数在两个失效时间随机变量中都是适当的(即任一随机变量没有治愈分数),(ii)联合生存函数仅在一个失效时间随机化变量中有治愈分数,(iii)联合生存功能在两个故障时间随机变量都有治愈分数。

在模拟中,没有考虑协变量。我们假设每个故障时间的潜在前兆平均数为

对于= 1, 2. 为了使模型可识别,不包括截取。数据生成如下。对于=1,…,500,我们首先生成w个稳定值(ρ),以及N个*惯性矩来自波阿斯(w个Λ(T型0))的=1,2,其中T型0表示随访的持续时间,设置为5。对于= 1, … , N个*惯性矩潜在前兆发生的准确时间,V(V)百万,然后根据条件密度λ生成(v(v))/Λ(T型0)对于0≤v(v)T型0、和U型百万由参数为α的指数分布生成。时间第次活动第个主题,Y(Y)惯性矩,然后计算为(V(V)百万+U型百万)总的来说∈[1,N个*惯性矩]. 如果N个*惯性矩=0或Y(Y)惯性矩>T型0,则相应的删失指示符惯性矩将设置为0,否则为ν惯性矩= 1.

表1显示了获得前面讨论的三种关节固化分数结构(i)、(ii)和(iii)的参数选择。在模拟中,正δ对应于零固化分数,而负δ对应于事件的正治愈分数。图4——6显示三种设置的观察和估计存活曲线的叠加图。对于每个后验图,实线表示生存率的Kaplan–Meier估计值,虚线表示基于所提出的多元生存模型的边际生存函数估计值。所有估计值都是通过非信息性先验获得的。在所有三种情况下,观察到的和估计的生存曲线几乎相互重叠,这表明我们的多元生存模型能够很好地处理具有不同治愈分数结构的生存函数。

表1

模拟I参数的设置

α1δ1α2δ2ρ
(i) 两者都没有固化分数0.10.50.110.5
(ii)一个具有固化分数,一个不具有固化分数0.1−1.00.10.50.5
(iii)二者都具有固化分数0.1−1.00.1−2.00.5
α1δ1α2δ2ρ
(i) 两者都没有固化分数0.10.50.110.5
(ii)一个具有固化分数,一个不具有固化分数0.1−1.00.10.50.5
(iii)二者都具有固化分数0.1−1.00.1−2.00.5
表1

模拟I参数的设置

α1δ1α2δ2ρ
(i) 两者都没有固化分数0.10.50.110.5
(ii)一个具有固化分数,一个不具有固化分数0.1−1.00.10.50.5
(iii)二者都具有固化分数0.1−1.00.1−2.00.5
α1δ1α2δ2ρ
(i) 两者都没有固化分数0.10.50.110.5
(ii)一个具有固化分数,一个不具有固化分数0.1−1.00.10.50.5
(iii)二者都具有固化分数0.1−1.00.1−2.00.5
模拟I结果:(I)两者都没有固化分数。
图4

模拟I结果:(I)两者都没有固化分数。

模拟I结果:(ii)一个有固化分数,一个没有固化分数。
图5

模拟I结果:(ii)一个有固化分数,一个没有固化分数。

模拟I结果:(iii)均具有固化分数。
图6

模拟I结果:(iii)均具有固化分数。

4.2仿真II

进行了第二次仿真研究,以评估我们的关节模型的性能。该模拟假设随着时间的推移监测了两个纵向标记,这两个标记都可以预测双变量生存时间。使用n个=800名患者,每个观察到的纵向标记x个伊克(t吨ij公司)被模拟为轨迹函数的总和x个*伊克(t吨ij公司)误差项εijk公司,用于= 1, … , 800,k个=1、2和j个=1,…,6.轨迹函数为

其中第页的是从标准正态分布中生成的,以表示纵向模型中的基线协变量。设ηk个=[ηk个0, ηk个1, ηk个2]T型b条伊克=[b条伊克0b条伊克1]T型和εij公司·=[εij公司1, εij公司2]T型.我们假设η1=[1.0, 0.5, 1.0]T型, η2=[1.0, 1.0, 2.0]T型、和

在哪儿b条伊克N个(0, Ψk个)和εij公司·N个(0, Σ). 在总共4800个纵向观察中,有10%被随机选择为缺失。对于双变量生存时间,我们假设

对于=1,2,其中z(z)是一个二元基线协变量,一半患者为零,另一半患者为一。我们选择了γ1=[−0.2, −0.4]T型, γ2=[−0.1, −0.5]T型, δ1=−1.0和δ2=−2.0,其中γ=[γ1, γ2]T型对于= 1, 2. 提升时间被假设为具有共同速率α的指数分布12=0.5,脆弱w个为稳定分布,ρ=0.5。这些选择导致了两种生存结果的治愈率结构,审查率分别为49.1%和55.1%。

我们将四种不同的模型拟合到模拟数据中。其中两个是纵向和生存结果的联合模型,另两个不是。对于联合模型,模型(I)是我们在本文中提出的模型,而模型(II)类似于模型(IY(Y)1Y(Y)2都是独立的。对于分别适合纵向模型和生存模型的非关节模型,模型(III)假设依赖于(X(X)1X(X)2)和(Y(Y)1Y(Y)2),而模型(IV)假设独立(X(X)1X(X)2)和(Y(Y)1Y(Y)2).

根据纵向系数η的估计对所有模型进行了评估12, η22,和生存系数δ1和δ2用于基线协变量。偏差信息准则(DIC),由Spiegelhalter等人(2002年)也为每个模型计算了,作为模型选择的拟合度和复杂性的贝叶斯度量。DIC越小,模型的拟合效果越好。表2总结了结果。当双变量纵向结果之间的关联时,建议的联合模型似乎优于其他三个模型(X(X)1X(X)2)和双变量生存结果(Y(Y)1Y(Y)2)非零。

表2

模拟二:基线协变量系数的后验均值(括号内为标准偏差)

η12η22δ1δ2驾驶员信息中心
真的12−1.0−2.0
模型I0.994 (0.044)1.932 (0.039)−1.142 (0.165)−2.086 (0.188)20322.3
模型II0.959 (0.043)1.895 (0.039)−1.186 (0.083)−1.662 (0.102)20797.8
模型III0.994 (0.044)1.931 (0.040)−1.009 (2.855)−0.980(2.896)22451.9
模型IV1.021 (0.045)1.931 (0.041)−0.860 (0.103)−1.369(0.115)20949.2
η12η22δ1δ2驾驶员信息中心
真的12−1.0−2.0
模型I0.994 (0.044)1.932 (0.039)−1.142 (0.165)−2.086 (0.188)20322.3
模型II0.959 (0.043)1.895 (0.039)−1.186 (0.083)−1.662 (0.102)20797.8
模型III0.994 (0.044)1.931 (0.040)−1.009 (2.855)−0.980 (2.896)22451.9
模型IV1.021 (0.045)1.931 (0.041)−0.860 (0.103)−1.369 (0.115)20949.2
表2

模拟二:基线协变量系数的后验均值(括号内为标准偏差)

η12η22δ1δ2驾驶员信息中心
真的12−1.0−2.0
模型I0.994(0.044)1.932 (0.039)−1.142 (0.165)−2.086 (0.188)20322.3
模型II0.959(0.043)1.895 (0.039)−1.186 (0.083)−1.662 (0.102)20797.8
模型III0.994 (0.044)1.931 (0.040)−1.009 (2.855)−0.980(2.896)22451.9
模型IV1.021 (0.045)1.931 (0.041)−0.860 (0.103)−1.369 (0.115)20949.2
η12η22δ1δ2驾驶员信息中心
真的12−1.0−2.0
模型I0.994 (0.044)1.932 (0.039)−1.142 (0.165)−2.086 (0.188)20322.3
模型II0.959 (0.043)1.895 (0.039)−1.186 (0.083)−1.662 (0.102)20797.8
模型III0.994(0.044)1.931 (0.040)−1.009 (2.855)−0.980 (2.896)22451.9
模型IV1.021(0.045)1.931 (0.041)−0.860 (0.103)−1.369 (0.115)20949.2

4.3 IBCSG数据的应用

我们将提出的方法应用于乳腺癌临床试验的数据,以联合调查生活质量与(DFS,OS)之间的关系。为了满足每个纵向生活质量指标的正态性假设,我们将观察到的生活质量转换为(100-QOL)1/2通过这种转换,转换后的生活质量随着时间的推移而降低,并在0到10之间进行缩放,较小的值反映更好的生活质量。对于每个转换后的指标,考虑单个线性轨迹,以说明患者对生活质量随时间的具体感知。目视检查转换后的QOL随时间的个别变化后,每个指标的线性轨迹函数似乎是一个合理的选择,特别是基于随时间最多三次观察。将相同的基线协变量(随机化后时间、辅助治疗、年龄和居住时间)纳入每个生活质量评估的预测中。居住被认为是“文化”的代表,因此可能会影响患者对生活质量的感知。对于联合生存模型(DFS,OS),转换后的QOL测量值作为时变协变量,辅助治疗、年龄、阳性淋巴结数量和ER状态作为基线协变量。引入了一个遵循正稳定分布的共享脆弱性,以诱导DFS和OS之间的相关性。联合似然的推导以及假设如所述第3.3节

我们对所有参数都使用了非信息性先验。G公司表示伽马分布和W公司表示Wishart分布,之前的规范为βk个N个2(0, 10002), ηk个N个6(0, 10006), Ψ−1k个W公司2(5, 1002), Σ−1W公司4(7, 1004), α−1G公司(0.01, 0.01), γN个4(0, 10004), δN个6(0,10006),用于k个= 1, … , 4,=1,2,以及区间(0,1)上ρ的一致先验。为了提高吉布斯采样器的效率,我们转换了α对数(α)的=1,2和ρto论坛,以及为log(α)生成的样本)和logit(ρ)。在分析中,在5000次迭代的老化之后,在所有计算中使用了50000次MCMC迭代。绘制并计算轨迹图、自相关和Gelman–Rubin统计,在5000次迭代之前观察到收敛。

表3显示与生活质量评估相关的回归系数的后验汇总统计。随着时间的推移,健康相关生活质量的所有转换指标均下降,最高概率密度(HPD)区间不包括0,这表明首次手术后生活质量有所改善。与接受六个CMF初始疗程的患者相比,接受三个CMF最初疗程的患者在应对疾病、情绪和身体健康方面的生活质量更好。由于排除了0个HPD间期,CMF的重新引入以及初始循环数和重新引入程序之间的相互作用对生活质量没有不利影响。年轻患者(40岁以下)的生活质量优于老年患者,相应的HPD间期在生活质量评估的所有方面均为0。住院率也在影响患者对生活质量的感知方面发挥作用。总的来说,澳大利亚和新西兰的患者的生活质量比瑞士或瑞典的患者好。

表3

IBCSG数据纵向模型中回归系数的后验均值(括号内为95%HPD区间)

食欲应对措施心情身体健康
拦截3.4945.2764.2783.945
(3.227, 3.764)(4.880, 5.624)(4.008, 4.544)(3.739, 4.176)
时间(年)−0.578−0.974−0.725−0.515
(−0.687, −0.465)(−1.112, −0.852)(−0.845, −0.586)(−0.637,−0.368)
#初始循环0.01730.3670.4600.268
(−0.265, 0.251)(0.045, 0.691)(0.185, 0.747)(0.027, 0.570)
再引进−0.0640.1240.182−0.059
(−0.378, 0.263)(−0.189, 0.439)(−0.097, 0.441)(−0.314, 0.212)
#初始循环×重新引入−0.025−0.278−0.403−0.054
(−0.411, 0.388)(−0.718, 0.192)(−0.772, 0.007)(−0.474, 0.322)
年龄>40岁0.4830.2950.5610.701
(0.266, 0.744)(0.016, 0.601)(0.360, 0.777)(0.497, 0.900)
住所:瑞士0.0840.3740.3040.070
(−0.144, 0.327)(0.105,0.641)(0.083, 0.527)(−0.147, 0.308)
居住地点:瑞典0.1990.5020.9930.681
(−0.080, 0.462)(0.211, 0.781)(0.733,1.243)(0.446, 0.926)
食欲应对措施心情身体健康
拦截3.4945.2764.2783.945
(3.227, 3.764)(4.880, 5.624)(4.008, 4.544)(3.739, 4.176)
时间(年)−0.578−0.974−0.725−0.515
(−0.687, −0.465)(−1.112, −0.852)(−0.845, −0.586)(−0.637, −0.368)
#初始循环0.01730.3670.4600.268
(−0.265, 0.251)(0.045, 0.691)(0.185, 0.747)(0.027,0.570)
再引进−0.0640.1240.182−0.059
(−0.378, 0.263)(−0.189, 0.439)(−0.097, 0.441)(−0.314, 0.212)
#初始循环×重新引入−0.025−0.278−0.403−0.054
(−0.411, 0.388)(−0.718, 0.192)(−0.772, 0.007)(−0.474, 0.322)
年龄>40岁0.4830.2950.5610.701
(0.266, 0.744)(0.016, 0.601)(0.360, 0.777)(0.497, 0.900)
居住地点:瑞士0.0840.3740.3040.070
(−0.144, 0.327)(0.105, 0.641)(0.083, 0.527)(−0.147,0.308)
居住地点:瑞典0.1990.5020.9930.681
(−0.080, 0.462)(0.211,0.781)(0.733, 1.243)(0.446, 0.926)
表3

IBCSG数据纵向模型中回归系数的后验均值(括号内为95%HPD区间)

食欲应对措施心情身体健康
拦截3.4945.2764.2783.945
(3.227, 3.764)(4.880, 5.624)(4.008, 4.544)(3.739, 4.176)
时间(年)−0.578−0.974−0.725−0.515
(−0.687, −0.465)(−1.112, −0.852)(−0.845, −0.586)(−0.637, −0.368)
#初始循环0.01730.3670.4600.268
(−0.265, 0.251)(0.045, 0.691)(0.185, 0.747)(0.027, 0.570)
再引进−0.0640.1240.182−0.059
(−0.378, 0.263)(−0.189, 0.439)(−0.097, 0.441)(−0.314, 0.212)
#初始周期×重新引入−0.025−0.278−0.403−0.054
(−0.411, 0.388)(−0.718, 0.192)(−0.772, 0.007)(−0.474, 0.322)
年龄>400.4830.2950.5610.701
(0.266, 0.744)(0.016, 0.601)(0.360, 0.777)(0.497, 0.900)
居住地点:瑞士0.0840.3740.3040.070
(−0.144, 0.327)(0.105, 0.641)(0.083, 0.527)(−0.147, 0.308)
居住地点:瑞典0.1990.5020.9930.681
(−0.080, 0.462)(0.211, 0.781)(0.733,1.243)(0.446, 0.926)
食欲应对措施心情身体健康
拦截3.4945.2764.2783.945
(3.227, 3.764)(4.880, 5.624)(4.008, 4.544)(3.739, 4.176)
时间(年)−0.578−0.974−0.725−0.515
(−0.687, −0.465)(−1.112, −0.852)(−0.845, −0.586)(−0.637, −0.368)
#初始循环0.01730.3670.4600.268
(−0.265, 0.251)(0.045, 0.691)(0.185, 0.747)(0.027, 0.570)
再引进−0.0640.1240.182−0.059
(−0.378, 0.263)(−0.189, 0.439)(−0.097, 0.441)(−0.314, 0.212)
#初始循环×重新引入−0.025−0.278−0.403−0.054
(−0.411, 0.388)(−0.718, 0.192)(−0.772, 0.007)(−0.474,0.322)
年龄>40岁0.4830.2950.5610.701
(0.266, 0.744)(0.016, 0.601)(0.360, 0.777)(0.497, 0.900)
住所:瑞士0.0840.3740.3040.070
(−0.144, 0.327)(0.105, 0.641)(0.083, 0.527)(−0.147, 0.308)
居住地点:瑞典0.1990.5020.9930.681
(−0.080, 0.462)(0.211, 0.781)(0.733, 1.243)(0.446, 0.926)

表4显示了与多维QOL评估相关的方差参数的后验总结。除了转换后的应对得分外,所有Ψ的后验均值12均为阴性,表明在研究开始时,当感知的生活质量较差时,随着时间的推移,生活质量得到了更多的改善。生活质量指标之间的相关性用∑表示。由于∑的后验估计的所有非对角元素均为正值,这意味着四个生活质量指标相互正相关。例如,更好的身体健康会带来更好的食欲、情绪和应对能力。最后,我们检验了独立随机效应的假设b条伊克通过计算随机效应样本之间的后验皮尔逊相关系数。两两绝对后验相关性的中位数为0.023,最小值为0.004,最大值为0.093。这表明独立性假设在IBCSG数据集的分析中可能是合理的。

表4

纵向模型中方差参数的后验均值(括号内为95%HPD区间)

食欲应对心情身体健康
Ψ111.4831.1160.7620.588
(1.132, 1.832)(0.845, 1.407)(0.497, 1.015)(0.362,0.805)
Ψ12−0.5190.127−0.213−0.289
(−0.735, −0.250)(0.015, 0.245)(−0.051, 0.286)(−0.463, −0.133)
Ψ220.1890.0220.0670.150
(0.043, 0.297)(0.001, 0.049)(0.002, 0.131)(0.041, 0.286)
3.9841.5902.4542.505
(3.680, 4.283)(1.373, 1.815)(2.217, 2.700)(2.266, 2.752)
4.0062.3902.279
(3.667, 4.328)(2.135, 2.651)(2.034, 2.533)
4.5953.286
(4.244, 4.953)(3.019, 3.551)
4.807
(4.475, 5.145)
食欲应对措施心情身体健康
Ψ111.4831.1160.7620.588
(1.132, 1.832)(0.845, 1.407)(0.497, 1.015)(0.362, 0.805)
Ψ12−0.5190.127−0.213−0.289
(−0.735, −0.250)(0.015, 0.245)(−0.051, 0.286)(−0.463, −0.133)
Ψ220.1890.0220.0670.150
(0.043, 0.297)(0.001, 0.049)(0.002, 0.131)(0.041, 0.286)
3.9841.5902.4542.505
(3.680,4.283)(1.373, 1.815)(2.217, 2.700)(2.266, 2.752)
4.0062.3902.279
(3.667, 4.328)(2.135, 2.651)(2.034, 2.533)
4.5953.286
(4.244, 4.953)(3.019, 3.551)
4.807
(4.475,5.145)
表4

纵向模型中方差参数的后验均值(括号内为95%HPD区间)

食欲应对措施心情身体健康
Ψ111.4831.1160.7620.588
(1.132, 1.832)(0.845, 1.407)(0.497, 1.015)(0.362, 0.805)
Ψ12−0.5190.127−0.213−0.289
(−0.735, −0.250)(0.015, 0.245)(−0.051, 0.286)(−0.463, −0.133)
Ψ220.1890.0220.0670.150
(0.043, 0.297)(0.001, 0.049)(0.002,0.131)(0.041, 0.286)
3.9841.5902.4542.505
(3.680,4.283)(1.373, 1.815)(2.217, 2.700)(2.266, 2.752)
4.0062.3902.279
(3.667, 4.328)(2.135, 2.651)(2.034、2.533)
4.5953.286
(4.244, 4.953)(3.019, 3.551)
4.807
(4.475, 5.145)
食欲应对措施心情身体健康
Ψ111.4831.1160.7620.588
(1.132, 1.832)(0.845, 1.407)(0.497, 1.015)(0.362, 0.805)
Ψ12−0.5190.127−0.213−0.289
(−0.735, −0.250)(0.015, 0.245)(−0.051, 0.286)(−0.463,−0.133)
Ψ220.1890.0220.0670.150
(0.043, 0.297)(0.001, 0.049)(0.002, 0.131)(0.041,0.286)
3.9841.5902.4542.505
(3.680, 4.283)(1.373, 1.815)(2.217, 2.700)(2.266, 2.752)
4.0062.3902.279
(3.667, 4.328)(2.135, 2.651)(2.034, 2.533)
4.5953.286
(4.244, 4.953)(3.019, 3.551)
4.807
(4.475, 5.145)

对于双变量生存模型,表5总结了相关参数的后验估计。转换后的生活质量测量值的正回归系数表明,生活质量较好的患者癌症复发或死亡的可能性较小;然而,这些影响的HPD间期不包括0。调整生活质量和其他基线协变量的影响后,初始CMF周期的增加或重新引入另一个周期都不会影响DFS和OS。年轻患者比老年患者更有可能复发或无法生存。癌症进展的不同机制可能适用于40岁以下和40岁以上的患者。ER阳性可降低癌症复发和死亡的风险;然而,更多的阳性节点将增加这两种风险。发件人表5,我们还注意到DFS和OS始终受到时变QOL和所有基线协变量的影响。ρ的后验平均值为0.396,95%的HPD间期为(0.352,0.439)。如中所述第3.2节,这表明这些数据的DFS和操作系统之间存在适度关联,这与预期相符。ρ的边缘后验密度图如下所示图7在图中,我们可以看到ρ的后验分布似乎相当对称,模式为0.394。

表5

生存模型参数的后验均值和95%HPD间期

DFS公司操作系统
α0.030(0.007,0.061)0.007 (0.001, 0.014)
食欲0.196 (−0.009, 0.423)0.157 (−0.087, 0.413)
应对得分0.115 (−0.095, 0.318)0.087 (−0.134, 0.290)
心情0.095 (−0.209, 0.380)0.161 (−0.178, 0.489)
身体健康0.145 (−0.283, 0.539)0.176 (−0.235, 0.581)
#初始循环0.232 (−0.438, 0.874)0.405 (−0.306, 1.155)
再引进−0.270 (−0.948, 0.412)−0.272 (−1.011, 0.474)
#初始循环×重新引入−0.314 (−1.294, 0.600)−0.157 (−1.207, 0.918)
年龄>40岁−1.185 (−1.779, −0.600)−0.957 (−1.575, −0.307)
#阳性节点>42.309 (1.750, 2.856)2.492 (1.913, 3.076)
ER(1=正)−0.060 (−0.569, 0.490)−0.436 (−1.018, 0.132)
ρ0.396 (0.352, 0.439)
DFS公司操作系统
α0.030 (0.007, 0.061)0.007(0.001,0.014)
食欲0.196 (−0.009, 0.423)0.157 (−0.087, 0.413)
应对得分0.115 (−0.095, 0.318)0.087 (−0.134, 0.290)
心情0.095(-0.209,0.380)0.161 (−0.178, 0.489)
身体健康0.145 (−0.283, 0.539)0.176 (−0.235, 0.581)
#初始循环0.232 (−0.438, 0.874)0.405 (−0.306, 1.155)
再引进−0.270 (−0.948, 0.412)−0.272(−1.011,0.474)
#初始循环×重新引入−0.314 (−1.294, 0.600)−0.157 (−1.207, 0.918)
年龄>40岁−1.185 (−1.779, −0.600)−0.957 (−1.575, −0.307)
#阳性节点>42.309 (1.750, 2.856)2.492 (1.913, 3.076)
ER(1=正)−0.060 (−0.569, 0.490)−0.436 (−1.018, 0.132)
ρ0.396 (0.352, 0.439)
表5

生存模型参数的后验均值和95%HPD间期

DFS公司操作系统
α0.030 (0.007, 0.061)0.007 (0.001, 0.014)
食欲0.196 (−0.009, 0.423)0.157 (−0.087, 0.413)
应对得分0.115 (−0.095, 0.318)0.087 (−0.134, 0.290)
心情0.095(-0.209,0.380)0.161 (−0.178, 0.489)
身体健康0.145 (−0.283, 0.539)0.176 (−0.235, 0.581)
#初始循环0.232(−0.438,0.874)0.405 (−0.306, 1.155)
再引进−0.270 (−0.948, 0.412)−0.272 (−1.011, 0.474)
#初始循环×重新引入−0.314 (−1.294, 0.600)−0.157 (−1.207, 0.918)
年龄>40岁−1.185 (−1.779, −0.600)−0.957(−1.575,−0.307)
#阳性节点>42.309 (1.750, 2.856)2.492 (1.913, 3.076)
ER(1=正)−0.060 (−0.569, 0.490)−0.436 (−1.018, 0.132)
ρ0.396 (0.352, 0.439)
DFS公司操作系统
α0.030 (0.007, 0.061)0.007 (0.001, 0.014)
食欲0.196 (−0.009, 0.423)0.157 (−0.087, 0.413)
应对得分0.115 (−0.095, 0.318)0.087 (−0.134, 0.290)
心情0.095 (−0.209, 0.380)0.161 (−0.178, 0.489)
身体健康0.145 (−0.283, 0.539)0.176 (−0.235, 0.581)
#初始循环0.232 (−0.438, 0.874)0.405(−0.306,1.155)
再引进−0.270 (−0.948, 0.412)−0.272 (−1.011, 0.474)
#初始循环×重新引入−0.314 (−1.294, 0.600)−0.157 (−1.207, 0.918)
年龄>40−1.185 (−1.779, −0.600)−0.957 (−1.575, −0.307)
#阳性节点>42.309 (1.750, 2.856)2.492 (1.913, 3.076)
ER(1=正)−0.060 (−0.569, 0.490)−0.436 (−1.018, 0.132)
ρ0.396(0.352,0.439)
IBCSG数据ρ的边缘后验密度。
图7

IBCSG数据ρ的边缘后验密度。

DFS和OS模型中转换后的QOL指标的正回归系数(随着时间的推移而降低)表明,人群中的边际治愈率和关节治愈率不为零。我们注意到,当模型中包含协变量时,每个患者都有一个单独的治愈分数。图8显示了所有患者边缘治愈分数的后验均值分布。复发时间变量的后验平均治愈分数为0.303,后验标准偏差为0.133,而死亡时间变量的后验平均治愈率为0.363,后验标偏差为0.168。平均而言,30.3%的患者治愈,因此术后不易复发,36.3%的患者术后不会死于乳腺癌进展。

所有患者的后均治愈率的箱线图。
图8

所有患者的后均治愈率的箱线图。

5.讨论

我们提出了一种新的联合多元纵向和多元生存模型,该模型可容纳零和非零治愈分数。提出了一个潜在过程模型,以显式地建模多元重复测度之间的两个依赖结构源,并允许直接推断随时间和不同变量的关联。对于多变量生存模型,引入了一个正稳定分布的共享脆弱性参数,以诱导生存结果之间的相关性。当协变量通过特定的生物路径建模时,该模型具有比例风险结构,既有条件也有边际风险。此外,生物驱动疾病过程的引入允许数据具有非零治愈率。因此,该模型能够处理具有适当和不适当生存函数的多元失效时间数据。该模型的未来工作包括开发贝叶斯假设测试、模型选择和模型充分性的方法。

工具书类

M.H.先生。
易卜拉欣
J·G·。
、和
辛哈
D。
(
2002
).
具有治愈分数的多元生存数据的贝叶斯推断
多元分析杂志
 
80
101
——
126

芝加哥
年。
易卜拉欣
J·G·。
(
2004
).
多元纵向和多元生存数据的联合模型.技术报告
北卡罗来纳大学教堂山分校
北卡罗来纳州

克莱顿
D.G.公司。
(
1978
).
双变量生命时间表的关联模型及其在慢性病家族倾向流行病学研究中的应用
生物特征
 
65
141
——
151

水龙头
C.J。
托马斯
直流电。
(
1996
).
同时建模截尾生存数据和重复测量的协变量:吉布斯抽样方法
医学统计学
 
15
1663
——
1685

盖尔芬德
答:E。
萨胡
韩国。
、和
卡林
业务伙伴。
(
1996
).
广义线性混合模型的有效参数化
贝叶斯统计
 
5
165
——
180

吉尔克斯
W.R.公司。
野生
第页。
(
1992
).
吉布斯采样的自适应抑制采样
应用统计学
 
41
337
——
348

吉尔克斯
W.R.公司。
最佳
数量。
、和
棕褐色
英国中央银行。
(
1995
).
Gibbs抽样中的自适应抑制Metropolis抽样
应用统计学
 
44
455
——
472

亨德森
R。
挖掘
第页。
、和
多布森
答:。
(
2000
).
纵向测量和事件时间数据的联合建模
生物统计学
 
4
465
——
480

霍加德
第页。
(
1986
).
一类多元失效时间分布
生物特征
 
73
671
——
678

布拉吉莫夫
I.A.公司。
切宁
英国工程师。
(
1959
).
论稳定律的单峰性
概率论及其应用
 
4
417
——
419

易卜拉欣
J·G·。
M.H.先生。
、和
辛哈
D。
(
2001
).
贝叶斯生存分析
纽约
:
Springer-Verlag公司

易卜拉欣
J·G·。
M.H.先生。
、和
辛哈
D。
(
2004
).
纵向和生存数据联合建模的贝叶斯方法及其在癌症疫苗研究中的应用
中国统计局
 
14
847
——
867

国际乳腺癌研究小组。
(
1996
).
绝经前淋巴结阳性乳腺癌患者辅助化疗的持续时间和再次应用
临床肿瘤学杂志
 
14
1885
——
1894

线路接口单元
J.S.公司。
(
1994
).
贝叶斯计算中的坍塌吉布斯采样器及其在基因调控问题中的应用
美国统计协会杂志
 
89
958
——
966

橡树
D。
(
1989
).
脆弱性诱发的双变量生存模型
美国统计协会杂志
 
84
487
——
493

歌曲
十、。
达维迪安语
M。
、和
齐亚提斯
答:A。
(
2002
).
具有多个测量误差的纵向协变量的比例风险模型的估计量
生物统计学
 
511
——
528

Spiegelhalter公司
D.J.博士。
最佳
N.G.公司。
卡林
业务伙伴。
、和
范德林德
答:。
(
2002
).
模型复杂性和拟合的贝叶斯测度
英国皇家统计学会杂志B辑
 
64
583
——
616

齐亚提斯
答:A。
达维迪安语
M。
(
2004
).
纵向数据和时间-事件数据的联合建模:概述
中国统计局
 
14
793
——
818

齐亚提斯
答:A。
德格鲁托拉
五、。
、和
Wulfsohn公司
医学硕士。
(
1995
).
通过误差测量的纵向数据建立存活率关系模型:应用于艾滋病患者的存活率和CD4计数
美国统计协会杂志
 
90
27
——
37

年。
泰勒
J·M·G。
(
2001
).
纵向和事件时间数据的联合建模及其在获得性免疫缺陷综合征中的应用
美国统计协会杂志
 
96
895
——
905

伍尔夫松
医学硕士。
齐亚提斯
答:A。
(
1997
).
生存与纵向数据的联合模型
生物计量学
 
53
330
——
339

J。
Zeger公司
S.L.公司。
(
2001年a
).
纵向数据的联合分析,包括重复测量和事件发生时间
应用统计学
 
50
375
——
387

J。
Zeger公司
S.L.公司。
(
2001亿
).
多个代理端点的评估
生物计量学
 
57
81
——
87

雅科夫列夫
A.年。
茨奥迪科夫
公元。
(
1996
).
肿瘤潜伏期的随机模型及其生物统计应用
新加坡
:
世界科学

附录

的证明 方程式(16)

在整个证明过程中,我们利用了以下事实:w个,其中w个稳定(ρ),是E类w个[经验(−开关)]=经验(−ρ). 求和后,我们首先导出似然性的表达式L(左) | D类)英寸(14)超过的可能值N个*1N个*2假设w个N个*1N个*2是条件独立的,我们得到

(A.1)

其中ν12论坛,用于= 1, 2. 我们现在考虑以下三种情况L(左) | D类光突发事件,τ0, τ1w个)与…有关w个:(i)ν=0,(ii)ν=1和(iii)ν= 2. 对于情况(i),整合w个导致

拉普拉斯变换w个也意味着

对于案例(ii),我们可以写

对于案例(iii),我们有

将这些项相乘,我们得到

其中ν12和1(ν=j个)是的指示器功能j个= 1, 2, 3. 这与方程式(16)一致,从而完成了证明。

本文根据牛津大学出版社标准期刊出版模式的条款出版和发行(https://academic.oup.com/journals/pages/open_access/funder_policies/chorus/standard_publication_model)