总结

复发事件的事件史研究通常在人口统计学、流行病学、医学和社会科学等领域进行(Cook和Lawless,2007复发事件的统计分析纽约:Springer‐Verlag;赵等,2011,测试 20, 1–42). 为了进行此类分析,对两种类型的数据进行了广泛调查:复发事件数据和面板计数数据。然而,在实践中,可能会遇到第三种类型的数据,即混合的复发事件和面板计数数据或混合的事件历史数据。如果持续监测或观察一些研究对象,从而提供复发事件数据,而其他研究对象仅在离散时间观察,因此仅提供面板计数数据,则会出现此类数据。更普遍的情况是,每个受试者在特定时间段内连续观察,但在其他时间段内仅在离散时间观察。除了Zhu等人(2013,医学统计学 32, 1954–1963). 在本文中,我们考虑使用加性率模型对混合数据进行回归分析,并开发了一些基于估计方程的方法来估计感兴趣的回归参数。结果估计量的有限样本和渐近性质都得到了建立,数值研究表明,所提出的方法适用于实际情况。该方法被应用于激发本研究的儿童癌症幸存者研究。

1引言

复发事件在许多领域都有研究,例如人口学、流行病学、医学和社会科学(库克和劳利斯,2007年;Zhao、Balakrishnan和Sun,2011年). 复发事件包括住院、感染、急性心肌梗死和肿瘤转移。为了分析这些事件,文献中广泛讨论了两类数据。一个是重复事件数据,当连续观察所有研究对象时会产生,因此,它们提供了完整的信息。另一个是面板计数数据,当仅定期或在离散时间观察研究对象时,会出现该数据(Kalbfleisch和Lawless,1988年;Zhao等人,2011年). 在后一种情况下,只观察两个观测时间之间的事件数量,而不是事件的准确发生时间。然而,在实践中,人们可能会面临第三种类型的数据,即混合事件历史数据,其中包括上述两种特殊情况下的数据,且文献很少。如果持续监测或观察一些研究对象,从而提供复发事件数据,而其他研究对象仅在离散时间观察,因此仅提供面板计数数据,则会出现此类数据。更常见的情况是,每个研究对象在特定时间段内持续观察,而在其他时间段内仅在离散时间观察。

儿童癌症幸存者研究(CCSS)是一项多中心纵向队列研究(Robison等人。,2002). 自1996年以来,CCSS向13000多名儿童癌症幸存者和作为对照组的兄弟姐妹随机抽样发放了基线汇总问卷。随后定期发送跟进总结问卷。该问卷要求了解每次怀孕开始时的年龄(15岁以下、15-20岁、21-25岁、26-30岁、31-35岁、36岁及以上)及其结果。如果在任何汇总问卷中报告了怀孕,则会发送一份详细的怀孕问卷,询问该人怀孕时的确切年龄和其他信息。CCSS的一个目标是确定儿童癌症和癌症治疗对随后的生殖功能的长期影响(如果有)。关于妊娠过程,一些患者在某些时期提供了详细或复发事件数据,但在其他时期仅提供了面板计数数据。因此,我们在CCSS参与者中混合了妊娠的复发事件和小组计数数据。

已经提出了许多分析复发事件数据的方法(劳利斯和纳多,1995年;Lin等人,2000年). 特别是Cook和Lawless(2007)对复发事件数据的文献进行相对完整和全面的回顾。此外,许多作者还讨论了面板计数数据的分析。其中,巴拉克里希南和赵(2009,2010)考虑了基于面板计数数据的计数过程的非参数比较,以及Cheng和Wei(2000)、孙伟(2000),张(2002)、胡、孙、魏(2003)、Wellner和Zhang(2007)开发了一些回归分析程序。对于经常性事件和面板计数混合数据的分析,一种简单的方法是通过使用一些插补程序生成经常性事件数据,或将观察到的数据视为面板计数数据。这可能会产生有偏见的结果或效率较低。为了解决这个问题,Zhu等人。(2013)提出了比例率模型下的一些简单程序。然而,这些程序是临时性的,没有提供任何理论依据。在下文中,我们考虑加法利率模型,这有时可能是首选方法。此外,还提供了理论依据,并制定了模型检查程序。下面给出了对此的更多评论。

本文的其余部分组织如下。第2节首先描述了一些假设和将在本文中使用的加法利率模型。此外,针对混合事件历史数据的两种特殊情况,给出了两种简单的估计方法。第3节考虑了一般混合复发事件和面板计数数据的回归分析。建立了一些估计方程方法来估计回归参数。还导出了所得估计量的渐近性质。第4节讨论了模型诊断问题,并提出了一种基于残差的程序,以评估所述加法率模型的适当性。第5节给出了一些数值结果,表明所提出的方法适用于实际情况。第6节将建议的方法应用于CCSS数据,第7节包含一些结论性意见。

2假设、模型和特殊情况分析

在本节中,我们将首先介绍贯穿本文的假设和模型。然后,为了推动下一节中一般混合事件历史数据的估算程序,我们将分别描述经常性事件数据和面板计数数据的估算过程。

2.1假设和模型

考虑对一些反复发生的事件进行事件历史研究,包括n个独立主体。对于主题,让论坛表示到目前为止发生的事件的累计数量t吨,论坛,论坛,其中论坛表示研究的长度。也适用于主题,假设存在一个协变量向量,表示为论坛、跟进或审查时间论坛和一系列时间点论坛这样,受试者可以在每个间隔内连续观察或仅离散观察论坛.对应上述时间点,定义指标函数论坛对于论坛如果受试者在体内持续观察论坛否则。注意,如果论坛为所有人t吨,观察数据减少为经常性事件数据,面板计数数据对应于论坛为所有人t吨.

定义论坛,论坛、和论坛,论坛。还定义论坛论坛观察到的感兴趣的复发事件过程和实际观察过程。协变量对潜在复发事件过程的影响论坛,我们假设给定论坛,的条件速率函数论坛有表单

(1)

在这里论坛表示相关回归参数的向量,以及论坛是一个正的、未指定的且不递减的函数。很明显,模型(1)等于

(2)

上述模型假设协变量对基础利率或均值函数起加性作用,并测量利率或均值之间的差异。模型(1)(2)通常分别称为加性率模型和平均值模型。在下面,我们假设给定论坛、观察过程论坛,感兴趣的事件过程论坛和审查时间论坛将相互独立论坛可能取决于论坛以任意的方式。

模型的替代方案(1)(2)是比例率或平均值模型(库克和劳利斯,2007年),测量协变量对速率或平均函数的乘法效应。然而,在许多情况下,利率或手段之间的差异具有直接意义;因此,模型(1)(2)应优先考虑。其中一个设置是健康干预研究,与新干预计划相关的成本节约直接相关。此外,作为朔贝尔、曾和蔡(2006)指出,对于连续协变量,加法模型可能比比例模型更合适。即使在两种类型的模型都能很好地拟合数据的情况下,由于回归参数易于解释,也可能首选加性模型。

2.2使用复发事件数据进行估计

用于估计回归参数论坛,我们首先考虑混合事件历史数据的特殊情况,即重复事件数据。在这种情况下,我们论坛为所有人t吨如上所述。对于每个,定义

(3)

论坛对于论坛,其中论坛,论坛、和论坛对于向量论坛。很容易在模型下看到(1),的论坛是零均值随机过程。因此,为了估算论坛论坛,使用以下两个估算公式是很自然的(Schaubel等人。,2006)

哪里论坛.让论坛论坛表示论坛论坛分别定义为。然后论坛具有不依赖于的显式形式论坛.

2.3使用面板计数数据进行估算

在本节中,我们考虑了一般混合事件历史数据的另一种特殊情况,面板计数数据。在这种情况下,我们有论坛为所有人t吨为了简单起见,我们假设论坛仅在离散时间点观察到论坛,论坛.定义论坛,论坛、和

(4)

在模型下(1),与论坛是的论坛的是零均值随机过程。注意,这里我们假设论坛的与相同论坛; 下面将对此发表一些评论。

用于估算论坛论坛,首先注意我们有关于论坛’s,因此使用Nelson–Aalen估计量是很自然的,表示为论坛估计论坛.给定论坛类似于重现事件数据的估算方程,可以使用估算方程

用于估算论坛论坛分别是。在上面,论坛具有论坛论坛论坛表示上面定义的估计量。人们可以将其视为论坛,论坛也具有独立于论坛.

3混合事件历史数据的回归分析

现在我们考虑混合的复发事件和面板计数数据。为此,我们首先讨论如下情况:如前一节所述,观测过程的平均函数论坛的与相同论坛然后我们将估计过程推广到观测过程可能依赖于协变量的情况论坛的。

3.1独立观测过程估计

用于模型估算(1)(2),我们将遵循上一节中使用的相同思想。定义

估计论坛,我们建议使用估计方程

(5)

哪里论坛论坛如前所述,以及

(6)

修正的Nelson–Aalen估计量。通过求解方程(5),我们得到论坛,其中

(7)

(8)

用于估算论坛,考虑等式论坛这就产生了

(9)

请注意,估计器论坛以上可能不会减少t吨。要更正此问题,可以使用论坛通过使用类似于林和英的论点(1994),我们可以证明论坛论坛在以下意义上是渐近等价的论坛.

描述的渐近性质论坛,让论坛论坛表示论坛论坛具有论坛,论坛、和论坛替换为其真实值论坛,论坛、和论坛分别为,论坛论坛表示论坛论坛具有论坛,论坛、和论坛被他们的估计值所取代论坛,论坛、和论坛分别是。还定义论坛论坛然后可以证明,在补充材料中给出的条件(C1)–(C5)下,论坛是的一致估计量论坛此外论坛可以用均值为零的正态分布和协方差矩阵渐近逼近论坛,其中论坛具有论坛论坛补充材料中概述了这些结果的证明。

3.2相关观测过程估计

在前面的章节中,假设观测过程论坛的独立于协变量论坛的。实际上,这可能不是真的。为了推广上述估算程序,在本节中,我们假设过程可能依赖于比例率模型中的协变量

哪里论坛是回归参数的向量。如前所述,估计论坛,可以首先考虑论坛论坛如上所述,我们有关于论坛因此,可以估计论坛论坛通过求解以下两个估算方程

(10)

(11)

(库克和劳利斯,2007年).

论坛论坛表示论坛论坛上述定义。用于估算论坛,由估算功能驱动论坛,我们考虑估计方程

(12)

在这里论坛具有论坛论坛表示由上述等式给出的估计量。那么我们有论坛,其中

对于的渐近性质论坛,定义

那么我们可以证明论坛,在(C1)–(C4)和(C5)条件下)在补充材料中给出,论坛也是一致的。此外,可以近似地计算论坛通过均值为零的正态分布和协方差矩阵论坛,其中论坛具有

上述结果的证明与论坛因此省略了。

4拟合优度测试

在本节中,我们考虑拟合优度检验或加性比率模型的适当性检验(1)。遵循Lin等人。(2000),我们考虑以下剩余过程的累积和:

在上述内容中,论坛意味着论坛与的相应组件进行比较z(z)、和论坛

为了研究论坛,定义论坛 论坛 论坛、和

在上面,

然后我们在补充材料中表明,在条件(C1)–(C4)和(C5)下),流程论坛可以用零均值高斯过程近似

注意,即使给出了上述结果,仍然很难确定论坛分析原因是论坛没有独立的增量。另一方面,通过遵循Lin等人。(2000),可以显示出过程的分布论坛可以近似为以下零均值高斯过程

哪里论坛是大小的随机样本n个独立于数据的标准正态分布。这表明我们可以首先获得大量的论坛通过重复生成标准正态随机样本论坛修复数据时。The distribution of论坛然后可以通过这些实现的经验分布来近似。更具体地说,评估模型的整体拟合优度(1),我们可以应用上确界检验统计量论坛并获得第页通过比较观察值得出的值论坛大量实现论坛.

5 A模拟研究

进行了广泛的模拟研究,以评估前几节中提出的回归参数估计量的有限样本行为。在研究中,协变量Z轴假设遵循成功概率为0.5的伯努利分布,并且审查时间由以下均匀分布生成论坛具有论坛对于观察过程和数据类型,我们考虑了两种设置。一个是生成一系列观察时间论坛的平均值来自泊松过程论坛另一个是生成论坛的平均值来自泊松过程论坛具有论坛.鉴于论坛的,针对每个时段论坛,我们生成了数据类型指示器论坛根据伯努利分布,成功概率为论坛,论坛,论坛。假设如果论坛,期间内发生事件的确切时间论坛是已知的,否则仅为该期间内发生的事件数论坛已知。对于这两种情况,我们假设潜在的复发事件过程论坛是一个非齐次泊松过程满足模型(2)具有论坛。下面给出的结果基于1000个重复,样本大小为100或200。

1给出估计器的结果论坛基于模拟的混合事件历史数据论坛存在论坛、0或1,论坛,论坛,或论坛和独立的观测过程。通过这些设置,我们的复发事件平均数量从1.43到5.4不等,复发事件数据的比例约为20%、50%或80%,对应于不同的论坛结果包括估计值的平均值论坛(估计)、估计值的经验标准差(ESD)、估计标准误差(ASE)的平均值和95%的经验覆盖概率(CP)。仿真结果表明,该估计器似乎是无偏的,ASE和ESD具有可比性。此外,所提出估计量的分布的正态近似似乎表现良好,正如预期的那样,随着样本量的增加,结果有所改善。

表1

上的模拟结果论坛

论坛论坛
论坛论坛估计静电放电ASE公司人物配对关系估计静电放电ASE公司人物配对关系
0.2−1−1.0000.2000.1970.948−1.0010.1420.1440.942
00.0100.3150.3060.9420.0010.2190.2210.954
11.0020.4250.4080.9351.0090.3020.2970.936
0.5−1−1.0080.1880.1810.936−1.0090.1330.1330.951
00.0050.2900.2790.939−0.0080.2090.2050.938
11.0010.3910.3730.9331.0060.2850.2810.945
0.8−1−1.0120.1610.1550.938−1.0110.1180.1130.933
00.0030.2520.2330.925−0.0080.1750.1710.946
11.0070.3330.3050.9421.0070.2320.2240.933
论坛论坛
论坛论坛估计静电放电ASE公司人物配对关系估计静电放电ASE公司人物配对关系
0.2−1−1.0000.2000.1970.948−1.0010.1420.1440.942
00.0100.3150.3060.9420.0010.2190.2210.954
11.0020.4250.4080.9351.0090.3020.2970.936
0.5−1−1.0080.1880.1810.936−1.0090.1330.1330.951
00.0050.2900.2790.939−0.0080.2090.2050.938
11.0010.3910.3730.9331.0060.2850.2810.945
0.8−1−1.0120.1610.1550.938−1.0110.1180.1130.933
00.0030.2520.2330.925−0.0080.1750.1710.946
11.0070.3330.3050.9421.0070.2320.2240.933

论坛ESD,经验标准差;ASE,平均标准误差;CP,95%经验覆盖概率。

表1

上的模拟结果论坛

论坛论坛
论坛论坛估计静电放电ASE公司人物配对关系估计静电放电ASE公司人物配对关系
0.2−1−1.0000.2000.1970.948−1.0010.1420.1440.942
00.0100.3150.3060.9420.0010.2190.2210.954
11.0020.4250.4080.9351.0090.3020.2970.936
0.5−1−1.0080.1880.1810.936−1.0090.1330.1330.951
00.0050.2900.2790.939−0.0080.2090.2050.938
11.0010.3910.3730.9331.0060.2850.2810.945
0.8−1−1.0120.1610.1550.938−1.0110.1180.1130.933
00.0030.2520.2330.925−0.0080.1750.1710.946
11.0070.3330.3050.9421.0070.2320.2240.933
论坛论坛
论坛论坛估计静电放电ASE公司人物配对关系估计静电放电ASE公司人物配对关系
0.2−1−1.0000.2000.1970.948−1.0010.1420.1440.942
00.0100.3150.3060.9420.0010.2190.2210.954
11.0020.4250.4080.9351.0090.3020.2970.936
0.5−1−1.0080.1880.1810.936−1.0090.1330.1330.951
00.0050.2900.2790.939−0.0080.2090.2050.938
11.0010.3910.3730.9331.0060.2850.2810.945
0.8−1−1.0120.1610.1550.938−1.0110.1180.1130.933
00.0030.2520.2330.925−0.0080.1750.1710.946
11.0070.3330.3050.9421.0070.2320.2240.933

论坛ESD,经验标准差;ASE,平均标准误差;CP,95%经验覆盖概率。

估计量的结果论坛根据模拟数据,表中给出了相关观测过程2其他设置与表相同1它们再次表明,拟议的估算方法似乎适用于此处考虑的情况。注意,在上面,假设数据类型论坛与协变量无关,在实践中,这有时可能不是真的。为了解决这个问题,我们还使用论坛对于具有以下特征的组中的受试者,设置为0.3、0.6或0.9论坛以及0.1、0.4或0.7。平均而言,论坛所有受试者的得分分别为0.2、0.5或0.8。显示了在以下方面获得的结果论坛所有其他设置与表相同1很容易看出,他们给出了与表中相似的结论12.

表2

上的模拟结果论坛

论坛论坛
论坛论坛估计静电放电ASE公司人物配对关系估计静电放电ASE公司人物配对关系
0.2−1−1.0110.1380.1590.976−1.0160.0990.1110.967
0−0.0170.2220.2270.951−0.0280.1590.1610.956
10.9680.3070.2950.9270.9740.2110.2090.940
0.5−1−1.0100.1400.1650.974−1.0150.1010.1160.966
0−0.0160.2240.2240.943−0.0270.1600.1600.956
10.9710.3120.2970.9220.9760.2120.2110.939
0.8−1−1.0090.1470.1850.974−1.0130.1050.1210.971
0−0.0100.2290.2270.945−0.0250.1620.1620.943
10.9750.3140.3080.9320.9820.2180.2190.949
论坛论坛
论坛论坛估计静电放电ASE公司人物配对关系估计静电放电ASE公司人物配对关系
0.2−1−1.0110.1380.1590.976−1.0160.0990.1110.967
0−0.0170.2220.2270.951−0.0280.1590.1610.956
10.9680.3070.2950.9270.9740.2110.2090.940
0.5−1−1.0100.1400.1650.974−1.0150.1010.1160.966
0−0.0160.2240.2240.943−0.0270.1600.1600.956
10.9710.3120.2970.9220.9760.2120.2110.939
0.8−1−1.0090.1470.1850.974−1.0130.1050.1210.971
0−0.0100.2290.2270.945−0.0250.1620.1620.943
10.9750.3140.3080.9320.9820.2180.2190.949

论坛ESD,经验标准差;ASE,平均标准误差;CP,95%经验覆盖概率。

表2

上的模拟结果论坛

论坛论坛
论坛论坛估计静电放电ASE公司人物配对关系估计静电放电ASE公司人物配对关系
0.2−1−1.0110.1380.1590.976−1.0160.0990.1110.967
0−0.0170.2220.2270.951−0.0280.1590.1610.956
10.9680.3070.2950.9270.9740.2110.2090.940
0.5−1−1.0100.1400.1650.974−1.0150.1010.1160.966
0−0.0160.2240.2240.943−0.0270.1600.1600.956
10.9710.3120.2970.9220.9760.2120.2110.939
0.8−1−1.0090.1470.1850.974−1.0130.1050.1210.971
0−0.0100.2290.2270.945−0.0250.1620.1620.943
10.9750.3140.3080.9320.9820.2180.2190.949
论坛论坛
论坛论坛估计静电放电ASE公司人物配对关系估计静电放电ASE公司人物配对关系
0.2−1−1.0110.1380.1590.976−1.0160.0990.1110.967
0−0.0170.2220.2270.951−0.0280.1590.1610.956
10.9680.3070.2950.9270.9740.2110.2090.940
0.5−1−1.0100.1400.1650.974−1.0150.1010.1160.966
0−0.0160.2240.2240.943−0.0270.1600.1600.956
10.9710.3120.2970.9220.9760.2120.2110.939
0.8−1−1.0090.1470.1850.974−1.0130.1050.1210.971
0−0.0100.2290.2270.945−0.0250.1620.1620.943
10.9750.3140.3080.9320.9820.2180.2190.949

论坛ESD,经验标准差;ASE,平均标准误差;CP,95%经验覆盖概率。

表3

上的模拟结果论坛具有相关数据类型

论坛论坛
论坛论坛估计静电放电ASE公司人物配对关系估计静电放电ASE公司人物配对关系
0.2−1−0.9930.2060.2010.935−0.9990.1440.1470.950
00.0350.3170.3100.9370.0070.2190.2240.951
11.0440.4310.4140.9301.0240.2990.2980.945
0.5−1−1.0120.1920.1850.934−1.0180.1370.1360.944
0−0.0060.2940.2820.940−0.0280.2090.2060.939
10.9800.3980.3750.9300.9760.2810.2730.936
0.8−1−1.0260.1620.1570.935−1.0160.1190.1140.937
0−0.0250.2470.2280.927−0.0170.1720.1680.954
10.9710.3190.2950.9320.9950.2240.2170.935
论坛论坛
论坛论坛估计静电放电ASE公司人物配对关系估计静电放电ASE公司人物配对关系
0.2−1−0.9930.2060.2010.935−0.9990.1440.1470.950
00.0350.3170.3100.9370.0070.2190.2240.951
11.0440.4310.4140.9301.0240.2990.2980.945
0.5−1−1.0120.1920.1850.934−1.0180.1370.1360.944
0−0.0060.2940.2820.940−0.0280.2090.2060.939
10.9800.3980.3750.9300.9760.2810.2730.936
0.8−1−1.0260.1620.1570.935−1.0160.1190.1140.937
0−0.0250.2470.2280.927−0.0170.1720.1680.954
10.9710.3190.2950.9320.9950.2240.2170.935

论坛ESD,经验标准差;ASE,平均标准误差;CP,95%经验覆盖概率。

表3

上的模拟结果论坛具有相关数据类型

论坛论坛
论坛论坛估计静电放电ASE公司人物配对关系估计静电放电ASE公司人物配对关系
0.2−1−0.9930.2060.2010.935−0.9990.1440.1470.950
00.0350.3170.3100.9370.0070.2190.2240.951
11.0440.4310.4140.9301.0240.2990.2980.945
0.5−1−1.0120.1920.1850.934−1.0180.1370.1360.944
0−0.0060.2940.2820.940−0.0280.2090.2060.939
10.9800.3980.3750.9300.9760.2810.2730.936
0.8−1−1.0260.1620.1570.935−1.0160.1190.1140.937
0−0.0250.2470.2280.927−0.0170.1720.1680.954
10.9710.3190.2950.9320.9950.2240.2170.935
论坛论坛
论坛论坛估计静电放电ASE公司人物配对关系估计静电放电ASE公司人物配对关系
0.2−1−0.9930.2060.2010.935−0.9990.1440.1470.950
00.0350.3170.3100.9370.0070.2190.2240.951
11.0440.4310.4140.9301.0240.2990.2980.945
0.5−1−1.0120.1920.1850.934−1.0180.1370.1360.944
0−0.0060.2940.2820.940−0.0280.2090.2060.939
10.9800.3980.3750.9300.9760.2810.2730.936
0.8−1−1.0260.1620.1570.935−1.0160.1190.1140.937
0−0.0250.2470.2280.927−0.0170.1720.1680.954
10.9710.3190.2950.9320.9950.2240.2170.935

论坛ESD,经验标准差;ASE,平均标准误差;CP,95%经验覆盖概率。

对于上述所有结果,我们假设审查时间论坛与协变量无关。4给出了一些关于论坛根据我们生成的模拟数据论坛来自考克斯模型论坛具有论坛也就是说论坛的取决于论坛的。所有其他设置与表相同2从表中可以看出4与之前一样,所提出的估计方法似乎仍能很好地工作,并且正如预期的那样,方差大于当审查时间与协变量无关时的方差。我们还考虑了其他情况,得到了类似的结果。

表4

上的模拟结果论坛具有相关审查时间

论坛论坛
论坛论坛估计静电放电ASE公司人物配对关系估计静电放电ASE公司人物配对关系
0.2−1−1.0060.2000.2110.957−1.0210.1390.1480.964
0.20−0.0180.3110.2970.930−0.0280.2140.2110.935
0.210.9710.3920.3790.9220.9860.2880.2730.929
0.5−1−1.0070.2040.2150.953−1.0220.1390.1530.967
0.50−0.0130.3150.2920.932−0.0240.2160.2100.939
0.510.9700.3920.3770.9320.9880.2900.2750.928
0.8−1−1.0120.2120.2380.973−1.0220.1440.1680.975
0.80−0.0080.3140.2930.934−0.0220.2150.2100.932
0.810.9730.3930.3840.93410.2910.2820.929
论坛论坛
论坛论坛估计静电放电ASE公司人物配对关系估计静电放电ASE公司人物配对关系
0.2−1−1.0060.2000.2110.957−1.0210.1390.1480.964
0.20−0.0180.3110.2970.930−0.0280.2140.2110.935
0.210.9710.3920.3790.9220.9860.2880.2730.929
0.5−1−1.0070.2040.2150.953−1.0220.1390.1530.967
0.50−0.0130.3150.2920.932−0.0240.2160.2100.939
0.510.9700.3920.3770.9320.9880.2900.2750.928
0.8−1−1.0120.2120.2380.973−1.0220.1440.1680.975
0.80−0.0080.3140.2930.934−0.0220.2150.2100.932
0.810.9730.3930.3840.93410.2910.2820.929

论坛ESD,经验标准差;ASE,平均标准误差;CP,95%经验覆盖概率。

表4

上的模拟结果论坛具有相关审查时间

论坛论坛
论坛论坛估计静电放电ASE公司人物配对关系估计静电放电ASE公司人物配对关系
0.2−1−1.0060.2000.2110.957−1.0210.1390.1480.964
0.20−0.0180.3110.2970.930−0.0280.2140.2110.935
0.210.9710.3920.3790.9220.9860.2880.2730.929
0.5−1−1.0070.2040.2150.953−1.0220.1390.1530.967
0.50−0.0130.3150.2920.932−0.0240.2160.2100.939
0.510.9700.3920.3770.9320.9880.2900.2750.928
0.8−1−1.0120.2120.2380.973−1.0220.1440.1680.975
0.80−0.0080.3140.2930.934−0.0220.2150.2100.932
0.810.9730.3930.3840.93410.2910.2820.929
论坛论坛
论坛论坛估计静电放电ASE公司人物配对关系估计静电放电ASE公司人物配对关系
0.2−1−1.0060.2000.2110.957−1.0210.1390.1480.964
0.20−0.0180.3110.2970.930−0.0280.2140.2110.935
0.210.9710.3920.3790.9220.9860.2880.2730.929
0.5−1−1.0070.2040.2150.953−1.0220.1390.1530.967
0.50−0.0130.3150.2920.932−0.0240.2160.2100.939
0.510.9700.3920.3770.9320.9880.2900.2750.928
0.8−1−1.0120.2120.2380.973−1.0220.1440.1680.975
0.80−0.0080.3140.2930.934−0.0220.2150.2100.932
0.810.9730.3930.3840.93410.2910.2820.929

论坛ESD,经验标准差;ASE,平均标准误差;CP,95%经验覆盖概率。

6申请

现在,我们将前几节中提出的方法应用于CCSS产生的重复性事件和面板计数的混合数据。这项研究涉及14358名幸存者和4023名兄弟姐妹,他们是随机选择的入选CCSS的幸存者的子集,作为对照病例。为了进行分析,我们将重点关注1996年年龄至少为25岁的女性骨癌幸存者和女性对照病例的一个亚组,并收集到2007年之前的信息。该小组由398名儿童骨癌幸存者和1201名对照病例组成,其中实际上只有55对兄弟姐妹。因此,将所有科目都视为独立似乎是合理的。如上所述,在研究期间,有一些后续阶段(例如2003年),在此期间只分发了简要问卷。此外,一些参与者在某些时间段内只返回了一份问卷,即使他们同时收到了总结问卷和怀孕问卷,而在其他时间段,他们同时返回了这两份问卷。此外,这些周期因参与者而异。因此,只有混合事件历史数据可用于妊娠过程。

更具体地说,表5显示幸存者组和对照组以及所有组的妊娠计数频率。从表中可以看出,三组的平均妊娠数分别为1.940、2.403和2.288。此外,幸存者的怀孕率似乎低于健康对照组。此外,持续观察期占总研究期的79%。换句话说,79%的全部数据或全部观测信息是完整的,21%是不完整的数据。这里的目的是比较两组之间的妊娠过程。

表5

CCSS中的妊娠计数频率

怀孕次数(%)
队列n个012论坛
幸存者398112 (28.14)70 (17.59)87 (21.86)129 (32.41)
兄弟姐妹1201216 (17.99)151 (12.57)319 (26.56)515 (42.88)
总计1599328 (20.51)221 (13.82)406 (25.39)644 (40.28)
怀孕次数(%)
队列n个012论坛
幸存者398112 (28.14)70 (17.59)87 (21.86)129 (32.41)
兄弟姐妹1201216 (17.99)151 (12.57)319 (26.56)515 (42.88)
总计1599328 (20.51)221 (13.82)406 (25.39)644 (40.28)
表5

CCSS中的妊娠计数频率

怀孕次数(%)
队列n个012论坛
幸存者398112 (28.14)70 (17.59)87 (21.86)129 (32.41)
兄弟姐妹1201216 (17.99)151 (12.57)319 (26.56)515 (42.88)
总计1599328 (20.51)221 (13.82)406 (25.39)644 (40.28)
怀孕次数(%)
队列n个012论坛
幸存者398112 (28.14)70 (17.59)87 (21.86)129 (32.41)
兄弟姐妹1201216 (17.99)151 (12.57)319 (26.56)515 (42.88)
总计1599328 (20.51)221 (13.82)406 (25.39)644 (40.28)

要应用前面章节中建议的估算程序,请定义论坛如果受试者为骨癌幸存者,其他为0。首先,我们检查观察过程对协变量或组指标的依赖性论坛并获得论坛根据bootstrap程序估计的标准误差为0.167。这表明观测过程独立于论坛我们可以应用第3.1节中给出的估算程序。请注意,这是意料之中的,因为观察过程是离散的,并且在研究开始时基本上是固定的。

得出的估算程序的应用论坛估计标准误差为0.003。这对应于第页测试幸存者和同胞对照组妊娠过程无差异的接近零的值,表明对照组的妊娠率明显高于骨癌幸存者。换句话说,癌症及其治疗似乎对怀孕率有显著的负面影响。为了给出图形化的想法,图1分别给出了两组孕妇累计平均怀孕次数的估计值,计算公式如下(9)和采取论坛结果再次表明,兄弟姐妹的怀孕率比骨癌幸存者高出很多。请注意,我们还进行了分析,其中包括一些潜在的混杂因素,如种族。结果表明,它们没有显著影响,并且它们的添加对以下系数的估计没有太大影响Z轴.

估计的累计平均怀孕人数。
图1

估计累计平均怀孕次数。

评估模型的适当性(2),我们应用了第4节中给出的拟合优度测试程序,并获得第页值为0.146。这表明该模型似乎很适合数据。注意,这里的结论与Zhu等人给出的结论类似。(2013)基于比例速率模型。

7结束语

在前面的章节中,我们讨论了由加性比率模型产生的混合复发事件和面板计数数据的回归分析(Schaubel等人。,2006). 为了估计回归参数,我们开发了一些基于估计方程的方法,并建立了所得估计量的有限和渐近性质。此外,还提供了一个拟合优度测试程序来评估模型的充分性,模拟结果表明,所提出的方法似乎运行良好。注意,在建议的方法中,我们假设观测过程是连续的。如果过程是离散的,并且只在有限的时间点跳跃,那么问题会简单得多。此外,该方法适用于诸如CCSS中的离散情况。

如上所述,提出的方法是由CCSS推动的,其在CCSS中的应用表明,早期癌症治疗可能会对总体妊娠率产生显著的负面影响。请注意,在数据分析中,重点是总体怀孕率,在怀孕期间,一些人实际上以堕胎告终。有时人们可能会争辩说,只应包括未堕胎的怀孕。同样,每一次怀孕都有一个时期,在此期间不会再次怀孕。在这种情况下,反复事件过程通常被称为反复发作过程(Hu等人。,2011;Zhu等人,2013年)很明显,不考虑该时期的分析可能会导致总体上的偏差估计。对于这里考虑的情况,我们认为可能的偏见是可以忽略的。

该方法中使用的一个假设是,在给定协变量的情况下,观察过程和相关的复发事件过程是独立的。实际上,这可能不是真的,也可能有问题(Liu、Huang和O'Quigley,2008年;梁璐莹,2009). 当这两个过程相关时,已经为经常性事件数据和面板计数数据制定了一些估算程序(Sun和Zhao,2013年)它们是联合建模方法或条件方法。然而,将它们概括为这里讨论的情况似乎并不简单。如上所述,可替代加性比率或平均值模型的是比例比率或平均数模型(库克和劳利斯,2007年;Zhu等人。,2013). 然而,这两个模型描述了两个不同的方面,并测量了两种不同类型的协变量效应。有时前者可能在某种程度上更具临床意义,因为它解释(或给出)协变量效应的直接测量。

请注意,所提出的估算方程包括数量论坛论坛一般来说,使用它似乎很自然论坛定义类似于论坛论坛但是有论坛论坛远离的。虽然所得的估计方程和回归参数的估计是渐近等价的,但从方程的结构来看,使用前者实际上更为自然。此外,对于有限样本情况,使用后者获得的估计值可能具有较大的偏差。还要注意,在前面的章节中,假设协变量是时间无关的,有时可能会遇到时变协变量。尽管将上面讨论的思想推广到后一种情况是很简单的,但对所得估计的渐近性质的研究或建立要复杂得多。

8补充资料

补充材料包含第3节和第4节中提到的证明,它们以及模拟研究的代码可在生物计量学威利在线图书馆网站。

致谢

这项工作得到了美国国立卫生研究院拨款(R03CA169150)的部分支持,以及ALSAC和癌症中心支持的资助。此外,赵的研究还得到了国家自然科学基金(NNSFC,No.11471135)的部分资助,以及来自教育部各高校基础研究的CCNU自主研究基金(CCNU13F018,CCNU14Z01002)。

工具书类

巴拉克里希南
,
N。
,
十、。
(
2009
).
面板计数数据的新多样本非参数检验
.
统计年刊
 
37
,
1112
1149
.

巴拉克里希南
,
N。
,
十、。
(
2010
).
面板计数数据计数过程相等性的非参数检验
.
计算统计与数据分析
 
54
,
135
142
.

,
南卡罗来纳州。
世界环境学会
,
洛杉矶。
(
2000
).
面板数据半参数模型的推论
.
生物特征
 
87
,
89
97
.

厨师
,
R·J。
无法无天的
,
J.F.公司。
(
2007
).
复发事件的统计分析
.
纽约
:
Springer‐Verlag公司
.

,
十、。
,
洛伦西
,
M。
,
斯皮内利
,
J。
,
,
美国。
、和
麦克布莱德
,
M。
(
2011
).
分析具有不可忽略事件持续时间的复发事件,并应用于评估医院利用率
.
终身数据分析
 
17
,
215
233
.

,
X·J。
,
太阳
,
J。
、和
世界环境学会
,
洛杉矶。
(
2003
).
从面板计数估计回归参数
.
斯堪的纳维亚统计杂志
 
30
,
25
43
.

卡尔布弗雷希
,
J、D。
无法无天的
,
J.F.公司。
(
1988
).
现场性能研究的可靠性评估
.
技术计量学
 
30
,
365
388
.

无法无天的
,
J.F.公司。
纳多
,
C、。
(
1995
).
重复事件分析的几种简单稳健方法
.
技术计量学
 
37
,
158
168
.

,
年。
,
,
西。
、和
,
Z.公司。
(
2009
).
具有信息观测时间的纵向数据联合建模与分析
生物计量学
 
65
,
377
384
.

,
D.Y.博士。
,
世界环境学会
,
洛杉矶。
,
,
一、。
、和
,
Z.公司。
(
2000
).
复发事件的平均值和率函数的半参数回归
.
英国皇家统计学会期刊,B辑
 
69
,
711
730
.

,
D.Y.博士。
,
Z.公司。
(
1994
).
加性风险模型的半参数分析
.
生物特征
 
81
,
61
71
.

线路接口单元
,
L。
,
,
十、。
、和
奥奎克利
,
J。
(
2008
).
在有信息的观测时间和相关终末事件的情况下分析纵向数据,并应用于医疗费用数据
.
生物计量学
 
64
,
950
958
.

罗宾逊
,
法律。
,
梅滕斯
,
交流。
,
博伊斯
,
J、D。
,
布雷斯洛
,
东北。
,
唐纳森
,
第S条。
,
绿色
,
D.M.博士。
,
,
F.P.公司。
,
草地
,
A.T.公司。
,
穆尔维希尔
,
J·J。
,
内格里亚
,
J.P.公司。
,
内斯比特
,
机械工程师。
,
封隔器
,
R·J。
,
波特
,
J、D。
,
斯科拉
,
C.答。
,
史密斯
,
文学硕士。
,
斯托瓦尔
,
M。
,
强大
,
拉丁美洲。
,
雅水
,
年。
、和
Zeltzer公司
,
L.K.公司。
(
2002
).
儿童癌症幸存者研究的研究设计和队列特征:一个多机构合作项目
.
医学和儿科肿瘤学
 
38
,
229
239
.

朔贝尔
,
D.E.博士。
,
,
D.升。
、和
,
J·W·。
(
2006
).
重复事件数据的半参数加性速率模型
.
终身数据分析
 
12
,
389
406
.

太阳
,
J。
世界环境学会
,
洛杉矶。
(
2000
).
具有协变量相关观察和截尾时间的面板计数数据的回归分析
.
英国皇家统计学会杂志B辑
 
62
,
293
302
.

太阳
,
J。
,
十、。
(
2013
).
面板计数数据的统计分析
.
纽约
:
Springer‐Verlag公司
.

韦尔纳
,
J.A.公司。
,
年。
(
2007
).
协变量面板计数数据的两种基于似然的半参数估计方法
.
统计年刊
 
35
,
2106
2142
.

,
年。
(
2002
).
面板计数数据的半参数伪似然估计方法
.
生物特征
 
89
,
39
48
.

,
十、。
,
巴拉克里希南
,
N。
、和
太阳
,
J。
(
2011
).
基于面板计数数据的非参数推断
.
测试
 
20
,
1
42
.

,
L。
,
用钳子钳起
,
X·W。
,
,
H。
,
太阳
,
J。
,
斯里瓦斯塔瓦
,
D。
,
雷森林
,
西。
、和
罗宾逊
,
L。
(
2013
).
混合复发事件数据的统计分析及其在癌症幸存者研究中的应用
.
医学统计学
 
32
,
1954
1963
.

本文根据牛津大学出版社标准期刊出版模式的条款出版和发行(https://academic.oup.com/journals/pages/open_access/funder_policies/chorus/standard_publication_model)