<trans data-src="Joint Models for Multivariate Longitudinal and Multivariate Survival Data">多元纵向和多元生存数据的联合模型

在本文中，我们提出了一种新的多元生存模型来捕获数据集中的这些特征。具体来说，我们提出了一种联合似然方法来联合建模多维生活质量和双变量故障时间随机变量DFS和OS。我们假设，给定潜在的QOL轨迹函数，QOL和双变量失效时间（DFS，OS）是条件独立的。对于联合模型的纵向分量，提出了一个多元混合效应模型，以明确捕获重复多维QOL测量之间的不同依赖来源。两种类型的依赖结构捕获了随时间变化的测量之间的依赖以及不同纵向标记之间的依赖，与多元纵向数据相关。

对于联合模型的生存部分，我们引入了一个共同的脆弱性(克莱顿，1978年;Hougaard，1986年;橡树1989)假设其具有正稳定分布，以诱导故障时间之间的相关性。考虑到常见的脆弱性，所有感兴趣的生存反应都被认为是独立的。边际单变量生存模型二者都然后将事件发生时间的零治愈分数和非零治愈分数应用于每个边缘生存函数。该模型源于雅科夫列夫和茨奥迪科夫（1996）在该模型中，我们提出了一种非齐次泊松过程，以一种新的方式建模并将协变量信息纳入疾病发展过程。这种对疾病动态过程的概括产生了一种适应的特征二者都生存函数中的零和非零治愈分数。

我们在这里提出的多元生存模型在几个方面都很有吸引力。首先，当基线协变量通过泊松过程的平均函数以生物方式输入时，该模型具有人口风险的比例风险结构，无论是有条件的还是边际的。第二，该模型能够处理具有不同治愈率结构的生存函数，从而适应适当和不适当生存函数的混合。第三，结合纵向数据，该模型在计算上是可行的。特别是，通过引入潜在变量，我们开发了类似于的MCMC算法Chen、Ibrahim和Sinha（2002）这使我们能够从关节后向分布中提取参数。使用改进版的折叠吉布斯技术刘（1994），我们的计算开发促进了后验分布的有效吉布斯采样方案。

在下一节中，我们将描述乳腺癌临床试验的基本数据结构。在第3节，我们回顾了新模型的框架和吸引人的特性。在第4节，我们进行了两组仿真研究，以说明所提出的多元生存模型的可行性和特性，并评估我们的联合模型的性能。乳腺癌数据集的详细分析也在第4节。简要讨论见第5节。

2.数据结构

IBCSG对有淋巴结阳性乳腺癌的绝经前妇女进行了一项临床试验，即IBCSG试验VI，以调查辅助化疗的持续时间（口服环磷酰胺、甲氨蝶呤和氟尿嘧啶[CMF]的三个初始周期与六个初始周期）以及再次进行三个单一疗程的延迟化疗。按照2×2析因设计，每名参与者被随机分配，在连续的第1至6个月接受6个初始疗程的CMF治疗，其中包括（CMF6RE）或（CMF6）在第9、12和15个月接受3个单一疗程的CMF6治疗；或连续第1至3个月进行三次CMF初始疗程，在第6、9和12个月进行（CMF3RE）或（CMF3）三次单疗程的CMF再引入。随机分组根据参与机构、手术类型和雌激素受体（ER）状态进行分层。复发日期定义为诊断出或首次怀疑复发疾病的时间，DFS定义为从随机分组到任何复发、第二原发癌发生或死亡的时间。DFS和OS（定义为从随机化到死亡的时间）都是随着时间的推移而监测的。不同的治疗程序可能会影响DFS和OS，以及年龄、ER状态（阴性/阳性）和肿瘤阳性结节数。该试验由国际乳腺癌研究小组（1996年）。

作为试验的一部分，定期向所有参与者分配生活质量问卷，其中包括四项与乳腺癌患者特别相关的健康相关生活质量指标。用单项目线性模拟自我评估量表评估身体健康（糟糕）、情绪（痛苦）、食欲（不好）和感知到的应对方式（“你为应对疾病付出了多少努力？”[非常理想]）。得分在0到100之间，数字越大，表明感知的生活质量越好。测量误差可能是由于问卷的可靠性可能不完善而产生的，假设问卷的可靠性随着时间的推移而独立发生。不同的生活质量指标可能相互关联，相关性很可能为正。例如，快乐的心情大多与良好的食欲和身体健康有关，反之亦然。辅助化疗的毒性可能对患者的生活质量产生不利影响。不同年龄的患者或不同文化背景的患者对生活质量的认知可能不同。将纵向QOL测量纳入DFS和OS的双变量生存模型中，可以证明QOL对癌症进展的预后影响，并提供辅助治疗和其他辅助协变量的调整生存益处。在考虑了可能对生活质量产生的不利影响以及生活质量与DFS和OS的关系后，确定了辅助治疗的最佳持续时间和时机。患者和医生都可以在权衡生存益处和生活质量回报后，做出治疗决定。

我们分析了来自瑞士、瑞典和新西兰/澳大利亚的832名患者的数据，每个患者都有一套以上完整的生活质量评估。在研究开始时以及随机化后第3个月和第18个月评估生活质量的感知。数据集中包括2154个生活质量观察结果。图2显示三次观察时的平均生活质量分数。平均而言，患者在首次手术后18个月感觉到他们的生活质量有所改善，而这种改善对他们的情绪和感知到的应对方式最为显著。然而，随着时间的推移，感知到的情绪和应对方式比感知到的食欲和身体健康状况相对较差。DFS中位数为7.611年，审查率为46.39%，而OS中位数为9.255年，审查比率为63.10%。DFS的Kaplan–Meier曲线图1表明长期随访后治愈分数为非零。对于OS，根据给定的随访期，尚不清楚生存功能是否稳定。在这项研究中死亡的所有患者也都复发了。

图2

随着时间的推移，生活质量得分中位数。

3.关节建模

在本节中，我们将回顾新模型的背景和框架。为了清晰和易于解释，我们将重点讨论一个双变量生存模型，就像IBCSG数据一样，因为对一般多元情况的扩展非常简单。让Y（Y）是DFS和OS的载体，X（X）是纵向QOL测量的观察向量，Z轴是模型生存部分的基线协变量向量，以及R（右）是模型纵向分量的协变量向量（可能随时间变化）。的组件Z轴可能不同于R（右）它允许生存模型和纵向模型之间有不同的协变量信息。此外，在DFS和OS的生存模型组件中可以允许不同的协变信息，但这里不讨论这种泛化。

由于每个QOL指标对应的测量误差，我们假设一个潜在的轨迹函数X（X）*代表真实的生活质量，以及R（右）影响X（X）只有通过它对X（X）*. 在联合建模框架中，我们具体假设临床事件时间向量，Y（Y）和重复QOL测量的向量，X（X），是有条件独立给定的X（X）*. 基于这些假设，我们

（1）

完整数据的联合可能性{Y（Y），X（X），X（X）*}需要三个组件的规格，P（P）(Y（Y） | Z轴，X（X）*),P（P）(X（X） | X（X）*)、和P（P）(X（X）* | R（右）). 在文献中，几位作者提出了基于这三种成分不同分布假设的方法。我们的假设[X（X） | X（X）*]和[X（X）* | R（右）]结果是一个多元纵向模型，在重复测量中具有明显不同的依赖结构，因此允许对每个结构进行直接推断。对于生存组件[Y（Y） | Z轴，X（X）*]，我们提出了一个能够同时容纳DFS和OS的零治愈分数和非零治愈分数的多元生存模型。

3.1多元纵向过程

随着时间的推移，测量了一个以上的生活质量指标，在对单个患者的观察中涉及两个水平的依赖结构。第一个层次涉及每个指标随时间的依赖性，而第二个层次涉及不同指标的依赖性。提出了一个多元正态混合效应模型来显式地模拟这两种依赖来源。让x个_伊克(t吨_ij公司)是对k个第个QOL指示符我当时的第个病人t吨_ij公司和x个*_伊克(t吨_ij公司)是表示其真值的相应轨迹函数，其中k个= 1, … , q个，j个= 1, … , n个_我、和我=1n个.纵向模型x个_伊克(t吨_ij公司)由提供

(2)

其中ε_ijk公司表示测量误差。让R（右）_伊克(t吨_ij公司)是协变量的向量（可能随时间变化）k个当时的第个QOL指示器t吨_ij公司轨迹函数建模为

(3)

哪里W公司_伊克(t吨_ij公司)是随机效应设计矩阵，它是固定效应设计矩阵的子集R（右）_伊克(t吨_ij公司)和η_k个和b条_伊克是长度为米_k个和γ_k个分别为。我们假设

和ε_ij公司·独立于b条_伊克，式中ε_ij公司·=[ε_ij公司1, … , ε_智商]^T型因此，同时观察到的纵向QOL指标的测量误差可能相互关联，但在不同时间评估的观察结果之间是独立的。∑的结构表征了同时测量的生活质量指标之间的关联，并假设在不同时间段和患者之间是常见的。另一方面，引入随机效应b条_伊克在轨迹函数中，为重复的QOL测量引入了一个公共因子我第个病人k个th指示器。Ψ的结构_k个描述了k个第个QOL指标，并假设不同指标不同。为了避免不同依赖结构模型的混淆效应，我们进一步假设轨迹函数在QOL指标之间是独立的，即：，b条_伊克是独立的k个测量误差与潜在轨迹函数无关。根据这些假设，假设在不同时间点测量的生活质量指标是不相关的。

Xu和Zeger（2001b）提出了一个联合模型来评估精神分裂症临床试验中的多个替代终点。他们假设ε_ijk公司∼N个(0, σ²_k个)和b条_我∼N个_υ（0，Ψ）独立，其中b条_我=[b条^T型_我1, … , b条^T型_智商]^T型且γ=γ₁+ ⋯ +υ_q个.随机效应的联合分布假设b条_我同时对这两种依赖结构进行建模。Ψ的规范本身包含了重复测量之间依赖性的所有信息，包括不同时间点测量的标记之间的相关性。使用Xu和Zeger的模型，对不同的依赖结构进行单独的推断变得不那么简单。他们的模型和我们的模型中协方差参数的数量之间的差异是⁠，随着随机效应的维数和标记数的不断重复测量而增加。在单变量纵向过程的情况下，这两个模型是等价的。

3.2一个新的双变量生存模型

我们首先讨论了这个没有协变量信息的新模型的框架和性质。预后因素和生存时间之间的联系是通过特定的生物学机制提出的。让Y（Y）= (Y（Y）₁，Y（Y）₂)为双变量故障时间，其中Y（Y）₁是癌症复发的时候了Y（Y）₂是IBCSG数据集的死亡时间。在我们的方法发展中(Y（Y）₁，Y（Y）₂)假设为无序，并在平面的上半部有支撑。考虑到共同的弱点w个，Y（Y）₁和Y（Y）₂假设是独立的，并且假设任一事件的发生分别遵循疾病过程，如下所示：受雅科夫列夫和茨奥迪科夫（1996），我们假设事件（失败）存在潜在的（未观察到的）前兆，并且任何潜在前兆发展成为真实事件都会导致观察到的事件。潜在前兆的数量，代表了事件发展的“风险”，被认为是随时间变化的。图3在DFS事件中显示了一个简单的图表来说明这个想法。在图中，有四个转移竞争性肿瘤细胞（潜在的前体）发生在5年的随访期间，患者在第四年前复发，第二年有转移能力的肿瘤细胞首先发展成为可检测的肿瘤。让N个= (N个₁(t吨),N个₂(t吨))是潜在前兆的数量(Y（Y）₁，Y（Y）₂)时间t吨，然后让

是事件发生时潜在前兆的相应总数Y（Y）₁=年₁和Y（Y）₂=年₂。我们始终假设

哪里波阿斯(x个)表示平均泊松分布x个、和N个₁(t吨)和N个₂(t吨)考虑到脆弱性，有条件地独立w个.两者N个₁(t吨)和N个₂(t吨)是未观察到的潜在变量。共同因素w个诱导之间的相关性N个₁(t吨)和N个₂(t吨)，从而在Y（Y）₁和Y（Y）₂.泊松假设N个₁(t吨)和N个₂(t吨)通过添加相同的额外泊松变量来放松w个通过各自的平均值λ₁(t吨)和λ₂(t吨). 利用泊松过程的性质，N个*₁和N个*₂也具有具有相应平均值的泊松分布w个Λ₁(年₁)和w个Λ₂(年₂)，其中⁠，用于米= 1, 2. 时间上准确出现前兆的共同密度t吨，给定N个*_米在活动时间年_米，用于米=1，2，是克_米(t吨) =λ_米(t吨)/Λ_米(年_米).

图3

疾病过程。

让U型_1我，我= 1, … , N个*₁，是我引发事件的第一个事件的潜在前兆，以及U型_2我，我=1N个*₂，是我引发事件的第二个事件的潜在前兆。两者都有U型_1我和U型_2我是未观察到的潜在变量。鉴于N个*_米，用于米= 1, 2, {U型_毫升}假设具有相同且独立分布的分布函数F类_米(t吨) = 1 −S公司_米(t吨)，独立于N个*_米.从生物学角度来说，假设N个*_米和U型_毫升是独立的，因为潜在前体的发生和发展可能涉及不同的机制。大量的前体总量N个*_米并不一定意味着个人进步过程更长（更大U型_毫升)针对每个前体。联合生存功能(Y（Y）₁，Y（Y）₂|w个)然后由给出

(4)

我们接受w个以参数ρ为指标的正稳定律分布，表示为w个稳定（ρ），其中0<ρ<1。在多元生存环境中，正稳定律分布的选择是非常有吸引力的、常见的和灵活的。此外，它将为所提出的双变量生存模型产生一些理想的性质。

以下伊布拉基莫夫和切宁（1959），的稳定（ρ）密度w个（0<ρ<1）可以表示为

(5)

哪里和⁠.拉普拉斯变换w个由提供E类_w个[经验（−开关)]=经验（−秒^ρ). 使用拉普拉斯变换w个，直接推导得出无条件生存函数

(6)

然后，联合固化分数由下式得出

发件人方程（6），边际生存函数为

（7）

可以表明，只要基线协变量通过λ建模，每个边际生存函数都具有比例风险特性_米(t吨)，并且不考虑时变协变量。发件人方程式（7），边缘固化分数为

(8)

对于米= 1, 2. 什么时候？是有界的米th边缘生存函数具有非零治愈分数，否则生存函数为方程式（7）导致适当的生存功能（即。，S公司*_米(∞) = 0). 每个边缘生存函数都有自己的一组条件来确定治愈分数的存在，因此联合生存函数可以容纳适当和不适当的边缘生存函数的混合。

参数ρ为Y（Y）₁和Y（Y）₂ρ值较小表示Y（Y）₁和Y（Y）₂，且ρ→1表示Y（Y）₁和Y（Y）₂.以下克莱顿（1978）和《橡树》（1989），我们可以计算关联的局部度量，用θ表示*(年₁，年₂)，作为ρ的函数。这种关联度量定义为

(9)

中的度量方程（9）有条件分布的条件危险率比率的解释Y（Y）₁，给定Y（Y）₂=年₂，到的Y（Y）₁鉴于Y（Y）₂>年₂.对于中的生存二元模型方程（6）, θ*(年₁，年₂)定义明确，由

(10)

我们看到θ*(年₁，年₂)减少(年₁，年₂). 之间的关联Y（Y）₁和Y（Y）₂在以下情况下更大(年₁，年₂)都很小，关联性会随着时间的推移而降低。IBCSG数据需要这样的属性，其中Y（Y）₁是时候复发了Y（Y）₂是时候死了。当治愈分数在任一边缘生存函数中为正时，关联的全局度量（如Kendallτ或Pearson相关系数）没有很好的定义，因为由于生存函数不正确，时间-事件随机变量不存在矩。

合并来自两条纵向轨迹的信息x个*_k个(t吨),k个= 1, … , q个和基线协变量Z轴在我们的生存模型中，我们让所有协变量都依赖于λ_米(t吨)通过关系

(11)

对于米= 1, 2. 以这种方式输入协变量对应于泊松广义线性模型中的标准链接N个_米(t吨)是泊松计数。假设所有协变量都通过其对事件潜伏前兆平均数的影响影响存活率。使用方程式（11），我们可以根据失效时间随机变量的风险来解释回归系数的作用。具体来说，当相应的协变量取正值时，负回归系数导致较小的风险，而正系数导致较大的风险。

发件人方程式（3），我们注意到轨迹函数x个*_k个(t吨)具有方差的正态分布W公司_k个(t吨)Ψ_k个W公司^T型_k个(t吨)，用于k个= 1, … , q个将这些轨迹函数作为时变协变量，如方程式（11）诱导λ之间的相关性₁(t吨)和λ₂(t吨). 换句话说，纵向测量不仅可以预测每个边际生存分布，而且可以在两个失效时间随机变量之间产生一定程度的相关性。因此，在联合建模框架中，脆弱性分布参数ρ和{W公司_k个(t吨)Ψ_k个W公司^T型_k个(t吨),k个= 1, … , q个}共同提供了衡量Y（Y）₁和Y（Y）₂。

3.3联合可能性和先验

在本小节中，我们构造了具有特定轨迹函数选择以及提升时间分布假设的联合似然{U型_1我}和{U型_2我}. 该设置随后用于IBCSG数据的分析。让X（X）={x个_伊克(t吨_ij公司),我= 1, … , n个;j个= 1, … , n个_我，k个= 1, … , q个},X（X）*={x个*_伊克(t吨_ij公司),我= 1, … , n个;j个= 1, … , n个_我，k个= 1, … , q个}、和R（右）= (R（右）₁, … , R（右）_n个)，其中x个_伊克(t吨_ij公司)和x个*_伊克(t吨_ij公司)被观察到的是真实的吗k个第个QOL指标我第th位患者t吨_ij公司分别为和R（右）_我是纵向QOL测量的基线协变量的对应向量。对于每个QOL指标，我们将线性轨迹函数视为

其中我们以τ为层级中心_伊克0=R（右）_我η_k个+b条_伊克0和τ_伊克1=b条_伊克1(Gelfand、Sahu和Carlin，1996年)以促进MCMC算法的收敛。联合似然的推导主要集中在分析IBCSG数据集的线性纵向轨迹上；然而，可以进一步发展具有更一般轨迹函数的似然。这种泛化计算量大得多，为了便于说明，这里没有介绍。让τ₀=（τ₁₁₀, … , τ_不合格0)和τ₁= (τ₁₁₁, … , τ_不合格1). 此外，让Y（Y）_米= (Y（Y）_米1, … , Y（Y）_锰), ν_米= (ν_米1, … , ν_锰),N个*_米= (N个*_米1, … , N个*_锰),Z轴= (Z轴₁, … , Z轴_n个)、和w个= (w个₁, … , w个_n个)，用于米=1，2，其中(Y（Y）_1我，Y（Y）_2我)分别是观察到的DFS和OS我第个病人，（ν_1我, ν_2我)是相应的审查指标，Z轴_我是DFS和OS的基线协变量向量，以及w个_我是脆弱的我第th位患者。观测数据由下式给出D类_{光突发事件}={n个，M（M），X（X），Y（Y）₁, ν₁，Y（Y）₂, ν₂，R（右），Z轴}完整数据如下所示D类={D类_{光突发事件}, τ₀，τ₁，N个*₁，N个*₂，w个}，其中⁠。如中所述方程式（1），完整数据的联合可能性需要指定三个组件，P（P）(X（X） | X（X）*),P（P）(X（X）* | R（右）)、和P（P）(Y（Y） | X（X）*,Z轴). 所有三个分量都可以等效地表示为P（P）(X（X） | X（X）*)=P（P）(X（X） | τ₀, τ₁),P（P）(X（X）* | R（右）) =P（P）(τ₀, τ₁ | R（右）)、和P（P）(Y（Y） | X（X）*,Z轴) =P（P）(Y（Y） | τ₀, τ₁，Z轴)，因为所携带的信息X（X）*可以通过τ完全恢复₀和τ₁。

分层居中后，P（P）(X（X） | τ₀, τ₁)由提供

(12)

其中θ₁=Σ,X（X）_ij公司·=[x个_我1(t吨_ij公司) …x个_智商(t吨_ij公司)]^T型, τ_我·0=[τ_我10…τ_智商0]^T型和τ_我·1=[τ_我11…τ_智商1]^T型.设β=（β₁, … , β_q个), Ψ= (Ψ₁, … , Ψ_q个)，且η=（η₁, … , η_q个)，其中β_k个=[β_k个0 β_k个1]^T型.假设b条_伊克=[b条_伊克0 b条_伊克1]^T型∼N个₂(β_k个, Ψ_k个)，第二个组件，P（P）(τ₀, τ₁ | R（右）)由提供

(13)

其中θ₂={β, Ψ, η}, τ_伊克=[τ_伊克0 τ_伊克1]^T型、和μ_伊克=[β_k个0+R（右）_我η_k个β_k个1]^T型为了完成联合似然的最后一部分，我们进一步假设，对于每个时间到事件，潜在前兆的促进时间都是相同且独立的指数分布，即：，F类_米(t吨) = 1 −e（电子） $^{− α_{米} t吨}$ ⁠，以及这些潜在前体在某一时间的平均数量t吨由提供

对于米= 1, 2. 设θ_三={α₁, α₂, γ₁, γ₂, δ₁, δ₂，ρ}，其中γ_米= (γ_米1, … , γ_{mq（平方米）})的米= 1, 2. 与潜在的N个*₁，N个*₂、和w个，第三个组件P（P）(Y（Y） | τ₀, τ₁，Z轴)完整数据的联合似然由下式给出

(14)

哪里⁠、和

对于米=1，2。潜在风险的引入N个*₁，N个*₂、和w个在第三个组件中P（P）(Y（Y） | τ₀, τ₁，Z轴)促进MCMC算法的进一步收敛。鉴于表示前兆成为实时事件的条件密度函数t吨设θ=（θ₁, θ₂, θ_三)表示所有参数的集合。完整数据的联合似然由下式给出

(15)

通过总结N个*_1我和N个*_2我和集成w个_我，用于我= 1, … , n个，我们获得

(16)

哪里和⁠，用于米= 1, 2. 该结果的证明在附录观测数据和（τ）的联合似然₀, τ₁)因此由下式给出

(17)

θ的先前规范如下所示。我们将接头优先级指定为

(18)

∑，{β的参数_k个}, {η_k个}, {Ψ_k个}, {α_米}, {γ_米}，{δ_米}，和ρ假定是先验独立的。对于k个= 1, … , q个，我们对β取正常先验值_k个和η_k个和Wishart之前的Ψ⁻¹_k个和∑⁻¹.β的先验_k个, η_k个，Ψ_k个和∑是由共轭考虑引起的。我们对γ的每个元素取一个正态先验值_米以及生存回归系数δ的向量_米，用于米= 1, 2. 最后，对于米=1,2，我们为α指定一个逆伽马先验_米和ρ的统一先验。在分析IBCSG数据时，所有参数都使用非信息性先验。

对于β_k个, η_k个, Ψ_k个，k个= 1, … , q个由于共轭，很容易获得∑，吉布斯样品。潜在的全部条件N个*₁和N个*₂本质上是泊松分布，因此很容易获得样本。对于无闭合形式全条件分布的参数吉尔克斯与怀尔德（1992）用于获得δ的样品_米从它的log-convave完全条件分布。使用以下算法合并额外的Metropolis步骤吉尔克斯、贝斯特和谭（1995）获取γ样品_米, α_米，和潜在的τ，w个、和u个，其完全条件分布不是对数凹的。计算发展的技术细节见Chi和Ibrahim（2004）。

4.仿真与应用

4.1模拟I

进行了一项模拟研究，以检验所提出的多元生存模型的可行性和性质。为了简单起见，我们只关注二元失效时间随机变量。在这种双变量情况下，有三种联合治愈分数结构。（i）联合生存函数在两个失效时间随机变量中都是适当的（即任一随机变量没有治愈分数），（ii）联合生存函数仅在一个失效时间随机化变量中有治愈分数，（iii）联合生存功能在两个故障时间随机变量都有治愈分数。

在模拟中，没有考虑协变量。我们假设每个故障时间的潜在前兆平均数为

和

对于米= 1, 2. 为了使模型可识别，不包括截取。数据生成如下。对于我=1，…，500，我们首先生成w个_我稳定值（ρ），以及N个*_惯性矩来自波阿斯(w个_我Λ_米(T型₀))的米=1，2，其中T型₀表示随访的持续时间，设置为5。对于我= 1, … , N个*_惯性矩潜在前兆发生的准确时间，V（V）_百万，然后根据条件密度λ生成_米(v（v）)/Λ_米(T型₀)对于0≤v（v）≤T型₀、和U型_百万由参数为α的指数分布生成_米。时间米第次活动我第个主题，Y（Y）_惯性矩，然后计算为(V（V）_百万+U型_百万)总的来说我∈[1,N个*_惯性矩]. 如果N个*_惯性矩=0或Y（Y）_惯性矩>T型₀，则相应的删失指示符_惯性矩将设置为0，否则为ν_惯性矩= 1.

表1显示了获得前面讨论的三种关节固化分数结构（i）、（ii）和（iii）的参数选择。在模拟中，正δ_米对应于零固化分数，而负δ_米对应于事件的正治愈分数。图4——6显示三种设置的观察和估计存活曲线的叠加图。对于每个后验图，实线表示生存率的Kaplan–Meier估计值，虚线表示基于所提出的多元生存模型的边际生存函数估计值。所有估计值都是通过非信息性先验获得的。在所有三种情况下，观察到的和估计的生存曲线几乎相互重叠，这表明我们的多元生存模型能够很好地处理具有不同治愈分数结构的生存函数。

表1

模拟I参数的设置

	α₁	δ₁	α₂	δ₂	ρ
（i）两者都没有固化分数	0.1	0.5	0.1	1	0.5
（ii）一个具有固化分数，一个不具有固化分数	0.1	−1.0	0.1	0.5	0.5
（iii）二者都具有固化分数	0.1	−1.0	0.1	−2.0	0.5

	α₁	δ₁	α₂	δ₂	ρ
（i）两者都没有固化分数	0.1	0.5	0.1	1	0.5
（ii）一个具有固化分数，一个不具有固化分数	0.1	−1.0	0.1	0.5	0.5
（iii）二者都具有固化分数	0.1	−1.0	0.1	−2.0	0.5

表1

模拟I参数的设置

	α₁	δ₁	α₂	δ₂	ρ
（i）两者都没有固化分数	0.1	0.5	0.1	1	0.5
（ii）一个具有固化分数，一个不具有固化分数	0.1	−1.0	0.1	0.5	0.5
（iii）二者都具有固化分数	0.1	−1.0	0.1	−2.0	0.5

	α₁	δ₁	α₂	δ₂	ρ
（i）两者都没有固化分数	0.1	0.5	0.1	1	0.5
（ii）一个具有固化分数，一个不具有固化分数	0.1	−1.0	0.1	0.5	0.5
（iii）二者都具有固化分数	0.1	−1.0	0.1	−2.0	0.5

图4

模拟I结果：（I）两者都没有固化分数。

图5

模拟I结果：（ii）一个有固化分数，一个没有固化分数。

图6

模拟I结果：（iii）均具有固化分数。

4.2仿真II

进行了第二次仿真研究，以评估我们的关节模型的性能。该模拟假设随着时间的推移监测了两个纵向标记，这两个标记都可以预测双变量生存时间。使用n个=800名患者，每个观察到的纵向标记x个_伊克(t吨_ij公司)被模拟为轨迹函数的总和x个*_伊克(t吨_ij公司)误差项ε_ijk公司，用于我= 1, … , 800,k个=1、2和j个=1，…，6.轨迹函数为

其中第页_我的是从标准正态分布中生成的，以表示纵向模型中的基线协变量。设η_k个=[η_k个0, η_k个1, η_k个2]^T型，b条_伊克=[b条_伊克0，b条_伊克1]^T型和ε_ij公司·=[ε_ij公司1, ε_ij公司2]^T型.我们假设η₁=[1.0, 0.5, 1.0]^T型, η₂=[1.0, 1.0, 2.0]^T型、和

在哪儿b条_伊克∼N个(0, Ψ_k个)和ε_ij公司·∼N个(0, Σ). 在总共4800个纵向观察中，有10%被随机选择为缺失。对于双变量生存时间，我们假设

对于米=1，2，其中z（z）_我是一个二元基线协变量，一半患者为零，另一半患者为一。我们选择了γ₁=[−0.2, −0.4]^T型, γ₂=[−0.1, −0.5]^T型, δ₁=−1.0和δ₂=−2.0，其中γ_米=[γ_米1, γ_米2]^T型对于米= 1, 2. 提升时间被假设为具有共同速率α的指数分布₁=α₂=0.5，脆弱w个_我为稳定分布，ρ=0.5。这些选择导致了两种生存结果的治愈率结构，审查率分别为49.1%和55.1%。

我们将四种不同的模型拟合到模拟数据中。其中两个是纵向和生存结果的联合模型，另两个不是。对于联合模型，模型（I）是我们在本文中提出的模型，而模型（II）类似于模型（IY（Y）₁和Y（Y）₂都是独立的。对于分别适合纵向模型和生存模型的非关节模型，模型（III）假设依赖于(X（X）₁，X（X）₂)和(Y（Y）₁，Y（Y）₂)，而模型（IV）假设独立(X（X）₁，X（X）₂)和(Y（Y）₁，Y（Y）₂).

根据纵向系数η的估计对所有模型进行了评估₁₂, η₂₂，和生存系数δ₁和δ₂用于基线协变量。偏差信息准则（DIC），由Spiegelhalter等人（2002年）也为每个模型计算了，作为模型选择的拟合度和复杂性的贝叶斯度量。DIC越小，模型的拟合效果越好。表2总结了结果。当双变量纵向结果之间的关联时，建议的联合模型似乎优于其他三个模型(X（X）₁，X（X）₂)和双变量生存结果(Y（Y）₁，Y（Y）₂)非零。

表2

模拟二：基线协变量系数的后验均值（括号内为标准偏差）

	η₁₂	η₂₂	δ₁	δ₂	驾驶员信息中心
真的	1	2	−1.0	−2.0
模型I	0.994 (0.044)	1.932 (0.039)	−1.142 (0.165)	−2.086 (0.188)	20322.3
模型II	0.959 (0.043)	1.895 (0.039)	−1.186 (0.083)	−1.662 (0.102)	20797.8
模型III	0.994 (0.044)	1.931 (0.040)	−1.009 (2.855)	−0.980（2.896）	22451.9
模型IV	1.021 (0.045)	1.931 (0.041)	−0.860 (0.103)	−1.369（0.115）	20949.2

	η₁₂	η₂₂	δ₁	δ₂	驾驶员信息中心
真的	1	2	−1.0	−2.0
模型I	0.994 (0.044)	1.932 (0.039)	−1.142 (0.165)	−2.086 (0.188)	20322.3
模型II	0.959 (0.043)	1.895 (0.039)	−1.186 (0.083)	−1.662 (0.102)	20797.8
模型III	0.994 (0.044)	1.931 (0.040)	−1.009 (2.855)	−0.980 (2.896)	22451.9
模型IV	1.021 (0.045)	1.931 (0.041)	−0.860 (0.103)	−1.369 (0.115)	20949.2

表2

模拟二：基线协变量系数的后验均值（括号内为标准偏差）

	η₁₂	η₂₂	δ₁	δ₂	驾驶员信息中心
真的	1	2	−1.0	−2.0
模型I	0.994（0.044）	1.932 (0.039)	−1.142 (0.165)	−2.086 (0.188)	20322.3
模型II	0.959（0.043）	1.895 (0.039)	−1.186 (0.083)	−1.662 (0.102)	20797.8
模型III	0.994 (0.044)	1.931 (0.040)	−1.009 (2.855)	−0.980（2.896）	22451.9
模型IV	1.021 (0.045)	1.931 (0.041)	−0.860 (0.103)	−1.369 (0.115)	20949.2

	η₁₂	η₂₂	δ₁	δ₂	驾驶员信息中心
真的	1	2	−1.0	−2.0
模型I	0.994 (0.044)	1.932 (0.039)	−1.142 (0.165)	−2.086 (0.188)	20322.3
模型II	0.959 (0.043)	1.895 (0.039)	−1.186 (0.083)	−1.662 (0.102)	20797.8
模型III	0.994（0.044）	1.931 (0.040)	−1.009 (2.855)	−0.980 (2.896)	22451.9
模型IV	1.021（0.045）	1.931 (0.041)	−0.860 (0.103)	−1.369 (0.115)	20949.2

4.3 IBCSG数据的应用

我们将提出的方法应用于乳腺癌临床试验的数据，以联合调查生活质量与（DFS，OS）之间的关系。为了满足每个纵向生活质量指标的正态性假设，我们将观察到的生活质量转换为（100-QOL）^1/2通过这种转换，转换后的生活质量随着时间的推移而降低，并在0到10之间进行缩放，较小的值反映更好的生活质量。对于每个转换后的指标，考虑单个线性轨迹，以说明患者对生活质量随时间的具体感知。目视检查转换后的QOL随时间的个别变化后，每个指标的线性轨迹函数似乎是一个合理的选择，特别是基于随时间最多三次观察。将相同的基线协变量（随机化后时间、辅助治疗、年龄和居住时间）纳入每个生活质量评估的预测中。居住被认为是“文化”的代表，因此可能会影响患者对生活质量的感知。对于联合生存模型（DFS，OS），转换后的QOL测量值作为时变协变量，辅助治疗、年龄、阳性淋巴结数量和ER状态作为基线协变量。引入了一个遵循正稳定分布的共享脆弱性，以诱导DFS和OS之间的相关性。联合似然的推导以及假设如所述第3.3节。

我们对所有参数都使用了非信息性先验。与G公司表示伽马分布和W公司表示Wishart分布，之前的规范为β_k个∼N个₂(0, 1000我₂), η_k个∼N个₆(0, 1000我₆), Ψ⁻¹_k个∼W公司₂(5, 100我₂), Σ⁻¹∼W公司₄(7, 100我₄), α⁻¹_米至G公司(0.01, 0.01), γ_米∼N个₄(0, 1000我₄), δ_米∼N个₆（0，1000我₆)，用于k个= 1, … , 4,米=1,2，以及区间（0,1）上ρ的一致先验。为了提高吉布斯采样器的效率，我们转换了α_米对数（α_米)的米=1,2和ρto⁠，以及为log（α）生成的样本_米)和logit（ρ）。在分析中，在5000次迭代的老化之后，在所有计算中使用了50000次MCMC迭代。绘制并计算轨迹图、自相关和Gelman–Rubin统计，在5000次迭代之前观察到收敛。

表3显示与生活质量评估相关的回归系数的后验汇总统计。随着时间的推移，健康相关生活质量的所有转换指标均下降，最高概率密度（HPD）区间不包括0，这表明首次手术后生活质量有所改善。与接受六个CMF初始疗程的患者相比，接受三个CMF最初疗程的患者在应对疾病、情绪和身体健康方面的生活质量更好。由于排除了0个HPD间期，CMF的重新引入以及初始循环数和重新引入程序之间的相互作用对生活质量没有不利影响。年轻患者（40岁以下）的生活质量优于老年患者，相应的HPD间期在生活质量评估的所有方面均为0。住院率也在影响患者对生活质量的感知方面发挥作用。总的来说，澳大利亚和新西兰的患者的生活质量比瑞士或瑞典的患者好。

表3

IBCSG数据纵向模型中回归系数的后验均值（括号内为95%HPD区间）

	食欲	应对措施	心情	身体健康
拦截	3.494	5.276	4.278	3.945
	(3.227, 3.764)	(4.880, 5.624)	(4.008, 4.544)	(3.739, 4.176)
时间（年）	−0.578	−0.974	−0.725	−0.515
	(−0.687, −0.465)	(−1.112, −0.852)	(−0.845, −0.586)	（−0.637，−0.368）
#初始循环	0.0173	0.367	0.460	0.268
	(−0.265, 0.251)	(0.045, 0.691)	(0.185, 0.747)	(0.027, 0.570)
再引进	−0.064	0.124	0.182	−0.059
	(−0.378, 0.263)	(−0.189, 0.439)	(−0.097, 0.441)	(−0.314, 0.212)
#初始循环×重新引入	−0.025	−0.278	−0.403	−0.054
	(−0.411, 0.388)	(−0.718, 0.192)	(−0.772, 0.007)	(−0.474, 0.322)
年龄>40岁	0.483	0.295	0.561	0.701
	(0.266, 0.744)	(0.016, 0.601)	(0.360, 0.777)	(0.497, 0.900)
住所：瑞士	0.084	0.374	0.304	0.070
	(−0.144, 0.327)	（0.105，0.641）	(0.083, 0.527)	(−0.147, 0.308)
居住地点：瑞典	0.199	0.502	0.993	0.681
	(−0.080, 0.462)	(0.211, 0.781)	（0.733，1.243）	(0.446, 0.926)

	食欲	应对措施	心情	身体健康
拦截	3.494	5.276	4.278	3.945
	(3.227, 3.764)	(4.880, 5.624)	(4.008, 4.544)	(3.739, 4.176)
时间（年）	−0.578	−0.974	−0.725	−0.515
	(−0.687, −0.465)	(−1.112, −0.852)	(−0.845, −0.586)	(−0.637, −0.368)
#初始循环	0.0173	0.367	0.460	0.268
	(−0.265, 0.251)	(0.045, 0.691)	(0.185, 0.747)	（0.027，0.570）
再引进	−0.064	0.124	0.182	−0.059
	(−0.378, 0.263)	(−0.189, 0.439)	(−0.097, 0.441)	(−0.314, 0.212)
#初始循环×重新引入	−0.025	−0.278	−0.403	−0.054
	(−0.411, 0.388)	(−0.718, 0.192)	(−0.772, 0.007)	(−0.474, 0.322)
年龄>40岁	0.483	0.295	0.561	0.701
	(0.266, 0.744)	(0.016, 0.601)	(0.360, 0.777)	(0.497, 0.900)
居住地点：瑞士	0.084	0.374	0.304	0.070
	(−0.144, 0.327)	(0.105, 0.641)	(0.083, 0.527)	（−0.147，0.308）
居住地点：瑞典	0.199	0.502	0.993	0.681
	(−0.080, 0.462)	（0.211，0.781）	(0.733, 1.243)	(0.446, 0.926)

表3

IBCSG数据纵向模型中回归系数的后验均值（括号内为95%HPD区间）

	食欲	应对措施	心情	身体健康
拦截	3.494	5.276	4.278	3.945
	(3.227, 3.764)	(4.880, 5.624)	(4.008, 4.544)	(3.739, 4.176)
时间（年）	−0.578	−0.974	−0.725	−0.515
	(−0.687, −0.465)	(−1.112, −0.852)	(−0.845, −0.586)	(−0.637, −0.368)
#初始循环	0.0173	0.367	0.460	0.268
	(−0.265, 0.251)	(0.045, 0.691)	(0.185, 0.747)	(0.027, 0.570)
再引进	−0.064	0.124	0.182	−0.059
	(−0.378, 0.263)	(−0.189, 0.439)	(−0.097, 0.441)	(−0.314, 0.212)
#初始周期×重新引入	−0.025	−0.278	−0.403	−0.054
	(−0.411, 0.388)	(−0.718, 0.192)	(−0.772, 0.007)	(−0.474, 0.322)
年龄>40	0.483	0.295	0.561	0.701
	(0.266, 0.744)	(0.016, 0.601)	(0.360, 0.777)	(0.497, 0.900)
居住地点：瑞士	0.084	0.374	0.304	0.070
	(−0.144, 0.327)	(0.105, 0.641)	(0.083, 0.527)	(−0.147, 0.308)
居住地点：瑞典	0.199	0.502	0.993	0.681
	(−0.080, 0.462)	(0.211, 0.781)	（0.733，1.243）	(0.446, 0.926)

	食欲	应对措施	心情	身体健康
拦截	3.494	5.276	4.278	3.945
	(3.227, 3.764)	(4.880, 5.624)	(4.008, 4.544)	(3.739, 4.176)
时间（年）	−0.578	−0.974	−0.725	−0.515
	(−0.687, −0.465)	(−1.112, −0.852)	(−0.845, −0.586)	(−0.637, −0.368)
#初始循环	0.0173	0.367	0.460	0.268
	(−0.265, 0.251)	(0.045, 0.691)	(0.185, 0.747)	(0.027, 0.570)
再引进	−0.064	0.124	0.182	−0.059
	(−0.378, 0.263)	(−0.189, 0.439)	(−0.097, 0.441)	(−0.314, 0.212)
#初始循环×重新引入	−0.025	−0.278	−0.403	−0.054
	(−0.411, 0.388)	(−0.718, 0.192)	(−0.772, 0.007)	（−0.474，0.322）
年龄>40岁	0.483	0.295	0.561	0.701
	(0.266, 0.744)	(0.016, 0.601)	(0.360, 0.777)	(0.497, 0.900)
住所：瑞士	0.084	0.374	0.304	0.070
	(−0.144, 0.327)	(0.105, 0.641)	(0.083, 0.527)	(−0.147, 0.308)
居住地点：瑞典	0.199	0.502	0.993	0.681
	(−0.080, 0.462)	(0.211, 0.781)	(0.733, 1.243)	(0.446, 0.926)

表4显示了与多维QOL评估相关的方差参数的后验总结。除了转换后的应对得分外，所有Ψ的后验均值₁₂均为阴性，表明在研究开始时，当感知的生活质量较差时，随着时间的推移，生活质量得到了更多的改善。生活质量指标之间的相关性用∑表示。由于∑的后验估计的所有非对角元素均为正值，这意味着四个生活质量指标相互正相关。例如，更好的身体健康会带来更好的食欲、情绪和应对能力。最后，我们检验了独立随机效应的假设b条_伊克通过计算随机效应样本之间的后验皮尔逊相关系数。两两绝对后验相关性的中位数为0.023，最小值为0.004，最大值为0.093。这表明独立性假设在IBCSG数据集的分析中可能是合理的。

表4

纵向模型中方差参数的后验均值（括号内为95%HPD区间）

	食欲	应对	心情	身体健康
Ψ₁₁	1.483	1.116	0.762	0.588
	(1.132, 1.832)	(0.845, 1.407)	(0.497, 1.015)	（0.362，0.805）
Ψ₁₂	−0.519	0.127	−0.213	−0.289
	(−0.735, −0.250)	(0.015, 0.245)	(−0.051, 0.286)	(−0.463, −0.133)
Ψ₂₂	0.189	0.022	0.067	0.150
	(0.043, 0.297)	(0.001, 0.049)	(0.002, 0.131)	(0.041, 0.286)
∑	3.984	1.590	2.454	2.505
	(3.680, 4.283)	(1.373, 1.815)	(2.217, 2.700)	(2.266, 2.752)
		4.006	2.390	2.279
		(3.667, 4.328)	(2.135, 2.651)	(2.034, 2.533)
			4.595	3.286
			(4.244, 4.953)	(3.019, 3.551)
				4.807
				(4.475, 5.145)

	食欲	应对措施	心情	身体健康
Ψ₁₁	1.483	1.116	0.762	0.588
	(1.132, 1.832)	(0.845, 1.407)	(0.497, 1.015)	(0.362, 0.805)
Ψ₁₂	−0.519	0.127	−0.213	−0.289
	(−0.735, −0.250)	(0.015, 0.245)	(−0.051, 0.286)	(−0.463, −0.133)
Ψ₂₂	0.189	0.022	0.067	0.150
	(0.043, 0.297)	(0.001, 0.049)	(0.002, 0.131)	(0.041, 0.286)
∑	3.984	1.590	2.454	2.505
	（3.680，4.283）	(1.373, 1.815)	(2.217, 2.700)	(2.266, 2.752)
		4.006	2.390	2.279
		(3.667, 4.328)	(2.135, 2.651)	(2.034, 2.533)
			4.595	3.286
			(4.244, 4.953)	(3.019, 3.551)
				4.807
				（4.475，5.145）

表4

纵向模型中方差参数的后验均值（括号内为95%HPD区间）

	食欲	应对措施	心情	身体健康
Ψ₁₁	1.483	1.116	0.762	0.588
	(1.132, 1.832)	(0.845, 1.407)	(0.497, 1.015)	(0.362, 0.805)
Ψ₁₂	−0.519	0.127	−0.213	−0.289
	(−0.735, −0.250)	(0.015, 0.245)	(−0.051, 0.286)	(−0.463, −0.133)
Ψ₂₂	0.189	0.022	0.067	0.150
	(0.043, 0.297)	(0.001, 0.049)	（0.002，0.131）	(0.041, 0.286)
∑	3.984	1.590	2.454	2.505
	（3.680，4.283）	(1.373, 1.815)	(2.217, 2.700)	(2.266, 2.752)
		4.006	2.390	2.279
		(3.667, 4.328)	(2.135, 2.651)	（2.034、2.533）
			4.595	3.286
			(4.244, 4.953)	(3.019, 3.551)
				4.807
				(4.475, 5.145)

	食欲	应对措施	心情	身体健康
Ψ₁₁	1.483	1.116	0.762	0.588
	(1.132, 1.832)	(0.845, 1.407)	(0.497, 1.015)	(0.362, 0.805)
Ψ₁₂	−0.519	0.127	−0.213	−0.289
	(−0.735, −0.250)	(0.015, 0.245)	(−0.051, 0.286)	（−0.463，−0.133）
Ψ₂₂	0.189	0.022	0.067	0.150
	(0.043, 0.297)	(0.001, 0.049)	(0.002, 0.131)	（0.041，0.286）
∑	3.984	1.590	2.454	2.505
	(3.680, 4.283)	(1.373, 1.815)	(2.217, 2.700)	(2.266, 2.752)
		4.006	2.390	2.279
		(3.667, 4.328)	(2.135, 2.651)	(2.034, 2.533)
			4.595	3.286
			(4.244, 4.953)	(3.019, 3.551)
				4.807
				(4.475, 5.145)

对于双变量生存模型，表5总结了相关参数的后验估计。转换后的生活质量测量值的正回归系数表明，生活质量较好的患者癌症复发或死亡的可能性较小；然而，这些影响的HPD间期不包括0。调整生活质量和其他基线协变量的影响后，初始CMF周期的增加或重新引入另一个周期都不会影响DFS和OS。年轻患者比老年患者更有可能复发或无法生存。癌症进展的不同机制可能适用于40岁以下和40岁以上的患者。ER阳性可降低癌症复发和死亡的风险；然而，更多的阳性节点将增加这两种风险。发件人表5，我们还注意到DFS和OS始终受到时变QOL和所有基线协变量的影响。ρ的后验平均值为0.396，95%的HPD间期为（0.352，0.439）。如中所述第3.2节，这表明这些数据的DFS和操作系统之间存在适度关联，这与预期相符。ρ的边缘后验密度图如下所示图7在图中，我们可以看到ρ的后验分布似乎相当对称，模式为0.394。

表5

生存模型参数的后验均值和95%HPD间期

	DFS公司	操作系统
α	0.030（0.007，0.061）	0.007 (0.001, 0.014)
食欲	0.196 (−0.009, 0.423)	0.157 (−0.087, 0.413)
应对得分	0.115 (−0.095, 0.318)	0.087 (−0.134, 0.290)
心情	0.095 (−0.209, 0.380)	0.161 (−0.178, 0.489)
身体健康	0.145 (−0.283, 0.539)	0.176 (−0.235, 0.581)
#初始循环	0.232 (−0.438, 0.874)	0.405 (−0.306, 1.155)
再引进	−0.270 (−0.948, 0.412)	−0.272 (−1.011, 0.474)
#初始循环×重新引入	−0.314 (−1.294, 0.600)	−0.157 (−1.207, 0.918)
年龄>40岁	−1.185 (−1.779, −0.600)	−0.957 (−1.575, −0.307)
#阳性节点>4	2.309 (1.750, 2.856)	2.492 (1.913, 3.076)
ER（1=正）	−0.060 (−0.569, 0.490)	−0.436 (−1.018, 0.132)
ρ	0.396 (0.352, 0.439)

	DFS公司	操作系统
α	0.030 (0.007, 0.061)	0.007（0.001，0.014）
食欲	0.196 (−0.009, 0.423)	0.157 (−0.087, 0.413)
应对得分	0.115 (−0.095, 0.318)	0.087 (−0.134, 0.290)
心情	0.095（-0.209，0.380）	0.161 (−0.178, 0.489)
身体健康	0.145 (−0.283, 0.539)	0.176 (−0.235, 0.581)
#初始循环	0.232 (−0.438, 0.874)	0.405 (−0.306, 1.155)
再引进	−0.270 (−0.948, 0.412)	−0.272（−1.011，0.474）
#初始循环×重新引入	−0.314 (−1.294, 0.600)	−0.157 (−1.207, 0.918)
年龄>40岁	−1.185 (−1.779, −0.600)	−0.957 (−1.575, −0.307)
#阳性节点>4	2.309 (1.750, 2.856)	2.492 (1.913, 3.076)
ER（1=正）	−0.060 (−0.569, 0.490)	−0.436 (−1.018, 0.132)
ρ	0.396 (0.352, 0.439)

表5

生存模型参数的后验均值和95%HPD间期

	DFS公司	操作系统
α	0.030 (0.007, 0.061)	0.007 (0.001, 0.014)
食欲	0.196 (−0.009, 0.423)	0.157 (−0.087, 0.413)
应对得分	0.115 (−0.095, 0.318)	0.087 (−0.134, 0.290)
心情	0.095（-0.209，0.380）	0.161 (−0.178, 0.489)
身体健康	0.145 (−0.283, 0.539)	0.176 (−0.235, 0.581)
#初始循环	0.232（−0.438，0.874）	0.405 (−0.306, 1.155)
再引进	−0.270 (−0.948, 0.412)	−0.272 (−1.011, 0.474)
#初始循环×重新引入	−0.314 (−1.294, 0.600)	−0.157 (−1.207, 0.918)
年龄>40岁	−1.185 (−1.779, −0.600)	−0.957（−1.575，−0.307）
#阳性节点>4	2.309 (1.750, 2.856)	2.492 (1.913, 3.076)
ER（1=正）	−0.060 (−0.569, 0.490)	−0.436 (−1.018, 0.132)
ρ	0.396 (0.352, 0.439)

	DFS公司	操作系统
α	0.030 (0.007, 0.061)	0.007 (0.001, 0.014)
食欲	0.196 (−0.009, 0.423)	0.157 (−0.087, 0.413)
应对得分	0.115 (−0.095, 0.318)	0.087 (−0.134, 0.290)
心情	0.095 (−0.209, 0.380)	0.161 (−0.178, 0.489)
身体健康	0.145 (−0.283, 0.539)	0.176 (−0.235, 0.581)
#初始循环	0.232 (−0.438, 0.874)	0.405（−0.306，1.155）
再引进	−0.270 (−0.948, 0.412)	−0.272 (−1.011, 0.474)
#初始循环×重新引入	−0.314 (−1.294, 0.600)	−0.157 (−1.207, 0.918)
年龄>40	−1.185 (−1.779, −0.600)	−0.957 (−1.575, −0.307)
#阳性节点>4	2.309 (1.750, 2.856)	2.492 (1.913, 3.076)
ER（1=正）	−0.060 (−0.569, 0.490)	−0.436 (−1.018, 0.132)
ρ	0.396（0.352，0.439）

图7

IBCSG数据ρ的边缘后验密度。

DFS和OS模型中转换后的QOL指标的正回归系数（随着时间的推移而降低）表明，人群中的边际治愈率和关节治愈率不为零。我们注意到，当模型中包含协变量时，每个患者都有一个单独的治愈分数。图8显示了所有患者边缘治愈分数的后验均值分布。复发时间变量的后验平均治愈分数为0.303，后验标准偏差为0.133，而死亡时间变量的后验平均治愈率为0.363，后验标偏差为0.168。平均而言，30.3%的患者治愈，因此术后不易复发，36.3%的患者术后不会死于乳腺癌进展。

图8

所有患者的后均治愈率的箱线图。

5.讨论

我们提出了一种新的联合多元纵向和多元生存模型，该模型可容纳零和非零治愈分数。提出了一个潜在过程模型，以显式地建模多元重复测度之间的两个依赖结构源，并允许直接推断随时间和不同变量的关联。对于多变量生存模型，引入了一个正稳定分布的共享脆弱性参数，以诱导生存结果之间的相关性。当协变量通过特定的生物路径建模时，该模型具有比例风险结构，既有条件也有边际风险。此外，生物驱动疾病过程的引入允许数据具有非零治愈率。因此，该模型能够处理具有适当和不适当生存函数的多元失效时间数据。该模型的未来工作包括开发贝叶斯假设测试、模型选择和模型充分性的方法。

工具书类

陈

，

M.H.先生。

，

易卜拉欣

，

J·G·。

、和

辛哈

，

D。

(

2002

).

具有治愈分数的多元生存数据的贝叶斯推断

。

多元分析杂志

80

，

101

——

126

。

芝加哥

，

年。

和

易卜拉欣

，

J·G·。

(

2004

).

多元纵向和多元生存数据的联合模型.技术报告

，

北卡罗来纳大学教堂山分校

，

北卡罗来纳州

。

克莱顿

，

D.G.公司。

(

1978

).

双变量生命时间表的关联模型及其在慢性病家族倾向流行病学研究中的应用

。

生物特征

65

，

141

——

151

。

水龙头

，

C.J。

和

托马斯

，

直流电。

(

1996

).

同时建模截尾生存数据和重复测量的协变量：吉布斯抽样方法

。

医学统计学

15

，

1663

——

1685

。

盖尔芬德

，

答：E。

，

萨胡

，

韩国。

、和

卡林

，

业务伙伴。

(

1996

).

广义线性混合模型的有效参数化

。

贝叶斯统计

5

，

165

——

180

。

吉尔克斯

，

W.R.公司。

和

野生

，

第页。

(

1992

).

吉布斯采样的自适应抑制采样

。

应用统计学

41

，

337

——

348

。

吉尔克斯

，

W.R.公司。

，

最佳

，

数量。

、和

棕褐色

，

英国中央银行。

(

1995

).

Gibbs抽样中的自适应抑制Metropolis抽样

。

应用统计学

44

，

455

——

472

。

亨德森

，

R。

，

挖掘

，

第页。

、和

多布森

，

答：。

(

2000

).

纵向测量和事件时间数据的联合建模

。

生物统计学

4

，

465

——

480

。

霍加德

，

第页。

(

1986

).

一类多元失效时间分布

。

生物特征

73

，

671

——

678

。

布拉吉莫夫

，

I.A.公司。

和

切宁

，

英国工程师。

(

1959

).

论稳定律的单峰性

。

概率论及其应用

4

，

417

——

419

。

易卜拉欣

，

J·G·。

，

陈

，

M.H.先生。

、和

辛哈

，

D。

(

2001

).

贝叶斯生存分析

。

纽约

:

Springer-Verlag公司

。

易卜拉欣

，

J·G·。

，

陈

，

M.H.先生。

、和

辛哈

，

D。

(

2004

).

纵向和生存数据联合建模的贝叶斯方法及其在癌症疫苗研究中的应用

。

中国统计局

14

，

847

——

867

。

国际乳腺癌研究小组。

(

1996

).

绝经前淋巴结阳性乳腺癌患者辅助化疗的持续时间和再次应用

。

临床肿瘤学杂志

14

，

1885

——

1894

。

公共医学

线路接口单元

，

J.S.公司。

(

1994

).

贝叶斯计算中的坍塌吉布斯采样器及其在基因调控问题中的应用

。

美国统计协会杂志

89

，

958

——

966

。

橡树

，

D。

(

1989

).

脆弱性诱发的双变量生存模型

。

美国统计协会杂志

84

，

487

——

493

。

歌曲

，

十、。

，

达维迪安语

，

M。

、和

齐亚提斯

，

答：A。

(

2002

).

具有多个测量误差的纵向协变量的比例风险模型的估计量

。

生物统计学

三

，

511

——

528

。

Spiegelhalter公司

，

D.J.博士。

，

最佳

，

N.G.公司。

，

卡林

，

业务伙伴。

、和

范德林德

，

答：。

(

2002

).

模型复杂性和拟合的贝叶斯测度

。

英国皇家统计学会杂志B辑

64

，

583

——

616

。

齐亚提斯

，

答：A。

和

达维迪安语

，

M。

(

2004

).

纵向数据和时间-事件数据的联合建模：概述

。

中国统计局

14

，

793

——

818

。

齐亚提斯

，

答：A。

，

德格鲁托拉

，

五、。

、和

Wulfsohn公司

，

医学硕士。

(

1995

).

通过误差测量的纵向数据建立存活率关系模型：应用于艾滋病患者的存活率和CD4计数

。

美国统计协会杂志

90

，

27

——

37

。

王

，

年。

和

泰勒

，

J·M·G。

(

2001

).

纵向和事件时间数据的联合建模及其在获得性免疫缺陷综合征中的应用

。

美国统计协会杂志

96

，

895

——

905

。

伍尔夫松

，

医学硕士。

和

齐亚提斯

，

答：A。

(

1997

).

生存与纵向数据的联合模型

。

生物计量学

53

，

330

——

339

。

徐

，

J。

和

Zeger公司

，

S.L.公司。

(

2001年a

).

纵向数据的联合分析，包括重复测量和事件发生时间

。

应用统计学

50

，

375

——

387

。