总结

大多数当前的贝叶斯SEIR(易感、暴露、感染、移除(或恢复))模型要么使用指数分布的潜伏期和感染期,要么允许潜伏期和传染期的单一分布,要么对时间分布的可用信息量做出强有力的假设,尤其是在暴露的隔间里度过的时间。许多传染病需要对潜伏期和传染期进行更现实的假设。在本文中,我们提供了一个替代模型,该模型允许对暴露和感染分区使用一般分布,同时避免了对完整潜伏期数据的需要。另一种形式是一种路径特异性SEIR(PS SEIR)模型,该模型遵循通过暴露和感染隔间的单个路径,从而无需对潜伏和感染时间分布进行指数假设。我们展示了PS SEIR模型是如何随机模拟一类确定性SEIR模型的。然后,我们通过仿真结果证明了该PS-SEIR模型相对于更常见的人口平均模型的改进,并对2006年以来爱荷华州流行性腮腺炎疫情进行了新的分析。

1引言

SIR(易感、传染性、已移除(或已恢复))和SEIR(易感,暴露,传染性、已删除(或已修复))模型可追溯到科马克和麦肯德里克1927然而,直到最近,SIR和SEIR模型的随机变量才成为统计文献中的主流。原始模型的一个显著特征是,所考虑的传染病的潜伏期和感染期呈指数分布,即所谓的指数假设(安德森和梅,1991年). 指数假设是随机方法中早期确定性模型的众多假设之一。

指数假设在建模中往往是一种方便的假设,这主要是因为模型形式简单,在随机框架中插补更简单。不幸的是,这种假设对于许多传染病来说是不现实的。指数分布的无记忆性要求在白天移动到感染区的概率恒定j+1之后j潜伏感染的天数,无论j.

放宽指数假设的想法并不新鲜,早在1948年就已经完成了这项工作(肯德尔,1948年). 最近,发表了大量工作来放松指数假设。然而,人们往往会看到模型对暴露时间做出了非常有力的假设(例如,假设初始暴露时间已知(Streftaris和Gibson,2004年),或者假设潜伏期是固定的(奥尼尔和贝克尔,2001年)). 一个显著的例外是男孩和贾尔斯2007,他们提供了一个模型,该模型可以使用潜在和感染类别的伽马分布,并且不需要初始暴露时间。虽然他们的方法只处理伽马分布,但这种方法可能对许多传染病有效。劳埃德2001Wearing、Rohani和Keeling,2005年表明γ分布可以很好地适应许多传染病。此外,Jewell等人,2009年提出了一个允许一般传染期的SIR模型,但不要将该模型扩展到SEIR结构,并提出了一种与我们这里提出的完全不同的方法。

Kenah和Miller 2011年表明感染时间分布对重大疫情的概率有显著影响Wearing等人,2005年当感染时间被错误地假定为指数分布时,表明微生物的基本繁殖数存在偏差。事实上,Kenah和Miller的论文提供了一种利用一般潜伏时间和感染时间分布的方法。在他们的方法中,潜伏期分布必须事先已知,并对个人感染接触者进行采样。这样做的缺点是,在分析开始之前,需要知道潜在的和感染性的分布,但其优点是易于在接触图模型中使用。我们的工作不需要知道潜在的和传染性的分布;然而,我们确实需要在模型中使用一些事先信息。在提议的模型中,混合发生在人口层面,因此,人口层面的干预措施(如政府宣传运动)很容易评估和自然建模,这是我们将在本文中重点考虑的一个问题。然而,我们的模型并不容易适应接触图方案。

Kenah和Miller的工作对随机框架中未来疫情预测的准确性具有重要影响。如果混合过程中涉及的参数有偏差,可能会导致对未来疫情最终规模的预测不准确,或导致对公共卫生干预效果的分析不准确,如果在分析中使用了这些干预措施。据我们所知,当潜伏期和感染期的指数分布被错误指定时,还没有人研究参数的方差。因为SEIR模型中的参数方差已经很大(参见,例如。,埃尔德、杜基克和德怀尔,2006年),我们觉得这值得调查。

在个人层面,已经做了一些工作来放松指数假设(例如,参见奥尼尔和贝克尔,2001年;Yang等人,2006年). 当个体水平的信息可用于小群体时,这些模型工作得很好。然而,它们是有限的,因为许多干预措施将在人口层面应用,并且可能需要估算接受干预的个人的指数。此外,许多流行病发生在大量人群中,使用单个级别的模型计算可能会很慢。混合模型将允许以人口为基础的干预措施和大样本量的自然方法,同时仍允许个体水平方法在世代中的灵活性。

在本文中,我们提出了一种称为路径特异性贝叶斯SEIR模型的混合模型,以下简称为PS SEIR模型,该模型允许使用潜伏和感染间隔时间的一般分布。这将使具有非指数潜伏期和/或感染期的传染病建模具有更大的灵活性。然后,我们将该模型导出为一类广泛的确定性模型的随机模拟。接下来,我们提出了一种从后验分布中采样的方法。我们给出了模拟结果,以证明与天真地将威布尔和伽马分布的传染病分析为指数分布相比,根据它们的真实分布来分析威布尔和伽马分布的传染病是有改进的。在模拟结果之后,我们对2006年发生在爱荷华州的流行性腮腺炎疫情进行了分析。最后,我们讨论了该公式的局限性和优点。

2方法

在本节中,我们首先提出PS SEIR模型。接下来,我们将说明在推导它作为一类确定性SEIR模型的模拟时所做的假设。

2.1建议模型

本节的主要目标是演示如何放宽指数假设,以及如何针对潜伏期和感染期实现离散化分布。我们利用了一个更现实的假设,即一个人在成为主动感染者之前,有一个最长的时间可以承受潜在感染。我们假设所有暴露类别的个体最终都会转移到感染类别,正如Lekone and Finkenstädt 2006年安德森和1991年5月,并且不要考虑此时无潜在感染的接触病例。

感兴趣的总体平均SEIR模型见Lekone and Finkenstädt 2006年,这本身就是从中找到的SIR模型的推广Mode和Sleeman 2000:

定义= 1, …,T型作为离散时间的下标S公司,E类,、和R(右)代表敏感、暴露、感染和移除隔间中的个体数量分别是。符号公式表示类别的变化。公式表示混合和可能的干预功能,控制每次新暴露的数量+1,并且约束为非负公式表示控制混合和干预的参数向量。小时表示数据收集分区中时间点之间的天数。人口中的总个体数表示为N个.

(1)

对于使用指数假设的模型,暴露数据通常安排为T型-计数的维向量,E类= (E类1, …,E类T型)′. 注意,在这些模型中,评估可能性的唯一必要信息是每个时间点暴露类别中的总计数,E类。我们不仅通过计算每个时间点暴露个体的数量,而且通过利用每个个体在暴露隔室中的时间长度来放宽这个假设。考虑收集T型x个M(M)1矩阵E类,其中M(M)1是传染源可以保持潜伏的最长时间。单元格(,j)然后包含在该时间点的个人数j潜伏感染过程的时间点疫情的影响。换句话说,表示自疫情开始以来的客观时间,以及j表示疾病过程中主观的、个体的时间。实际上,j将通常以天为单位进行测量,尽管这肯定不是必需的。这个T型x个M(M)2传染性基质定义类似于E类,其中行表示自疫情开始以来经过的时间点数量,列表示个人留在感染室的时间点的数量。

当个人刚接触到病毒并感染了潜在感染时,个体从易受影响的类移动到行暴露矩阵的第1列E类.对于每一个不具有传染性的时间单位,个体都会从行移动,列j在对角线路径中,向右移动一列,j+1,向下一排,+1.当个人感染时',个人移动到行',第1列,共列,并重复该过程,直到删除。该过程允许插补每个个体在暴露类别中的时间长度,并允许离散和利用许多潜伏时间和感染时间分布。通过指定个人可以留在Exposed或Infectious类中的最大时间长度,可以预先定义矩阵的列数,并且无需在分析运行时自适应选择矩阵的大小。虽然自适应方案可能是可行的,但没有必要这样做,因为传染源可能处于潜伏状态的最长时间通常是已知的。此外,自适应方案的计算效率可能不高。

由于暴露数据和感染数据是以矩阵的形式收集的,因此室改变的概率可能会随着个体在室中停留的时间而变化。这使得指数假设得以放宽,任何分布都可以离散化,并用于近似真实的潜在和感染时间分布。正如引言中所述,这使得更现实的分布可以用于传染病。

有了这一结构,研究人员能够利用充分的先验知识,了解个人在暴露和感染类别中的时间长度。通常,这些信息是可用的,可以对多个分布进行拟合和比较。混合和干预参数不太可能有很强的先验信息,因此可以对这些参数使用相对较弱的先验值。

建议的PS SEIR模型采用以下方案:表示自疫情开始以来的离散日历时间,以及j表示个体处于潜伏或感染状态的离散时间。然后,

(2)

这些定义来自等式(1),其中X(X)ij公司,Y(Y)ij公司,W公司、和E类ij公司都没有被发现,而公式(当时新感染的总人数)和公式(当时的新回收总量)已知。Z1是由暴露分布定义的随机变量Z2由感染分布定义。和以前一样,公式代表混合和可能的干预功能,控制每次新暴露的数量+ 1. 在这里公式表示控制混合和干预的参数向量。+表示当时感染者的总数,小时表示数据收集时间之间的天数,以及N个代表人口中的总人数。

隔室分别为敏感、暴露、感染和移除类。将bin定义为数据收集时间之间的时间量。在我们的离散化方案中,bin将是小时时间单位(通常以天为单位)。箱子在暴露和感染隔间内用作离散化的基本时间单位。大多数数据集将使用小时=1,但只需要0<小时< ∞. 这种类型的离散化允许分析大型数据集,同时仍然可以灵活地使用与时间相关的改变隔室的条件概率。通过在暴露和感染隔间内定义箱子,可以根据个体在隔间内的时间长度改变隔间变化的条件概率,这反过来又允许使用指数分布以外的分布来计算潜伏和感染时间。

2.2 PS SEIR模型的推导

PS SEIR模型可以导出为以下非线性确定性方程组的随机模拟:

(3)

在此过程中,我们做了几个假设,并在此概述了核心假设。

  • 1

    假设一个同质人群的易感性。这通常在人口平均模型中假设。

  • 2

    假设感染个体的独立泊松接触分布共享一个参数。这对腮腺炎或麻疹等疾病很有效,但对淋病或衣原体等性病模型效果不佳。

  • 三。

    将暴露隔间定义为仅包含最终会感染的人,不考虑返回敏感类的可能性。

  • 4

    假设在整个感染过程中具有持续传染性。

  • 5

    假设从暴露隔室到感染隔室(以及从感染隔室到移除隔室)移动的独立概率。

  • 6

    个人被视为具有相同的潜伏期和感染时间分布。在这些过程中没有个体异质性。

完整的推导可以在Web附录A中找到。

3计算

3.1 MCMC技术

从完全后验分布中采样对于该模型是不可行的。因此,我们依赖MCMC采样技术。建议使用Metropolis Hastings采样对模型中的参数进行采样。在我们所有的模拟工作中,使用正态提案分布是足够的。然而,有必要找到一种有效的方法从曝光矩阵中进行采样。在每次迭代中简单地生成整个矩阵是不现实的,因为MH算法很少接受提案。我们建议的抽样方案可以在Web附录B中找到。

3.2仿真结果

运行了许多模拟,我们在这里报告了典型集合的结果。考虑这样一种情况,即完整的移除时间是可用的,并且干预的参数形式是已知的。这将证明PS SEIR模型在理想情况下比人口平均方法提供的改进。其他模拟可以在Web附录C中找到。

对于每个模拟数据集,总共有20000人,其中一名成员属于传染性类别,所有其他人在疫情开始时都易感。为模拟数据而选择的混合参数为0.25,以便使流行病的规模具有很大程度的可变性。让ψ1是混合参数和ψ2是干预参数。我们考虑的干预形式如下公式,其中0是干预开始的时间。这表示从易受影响类转移到暴露类的概率呈指数衰减。对于这种形式,ψ2选择为0.1,并且0100天。

为指数分布选择的参数化为公式对于伽马分布,参数化为公式选择参数值以近似腮腺炎等疾病。流行性腮腺炎的潜伏期为16-18天,这一时间段最短可达12天,最长可达25天(疾病预防控制中心,2009年a).

感染期不太为人所知,但在症状出现后,脱落通常持续不到9天,尽管这通常是5天左右(Polgreen等人,2008年). 在腮腺炎发病前2至3天,喉咙拭子可以从40%的腮腺炎感染者中分离出病毒,而这些感染者在出现症状之前通常具有传染性(疾病预防控制中心,2009年a,b).

对于模拟,指数分布中λ的真值对于暴露平均时间为18.71,对于感染平均时间为8.62。暴露时间分布选择与γ分布相关的真实α和β分别为30和1.603,感染时间分布选择100和11.6。

选择感染时间分布是为了说明典型的时间脱落量以及个人在出现症状之前感染的可能性。γ感染时间分布给出了典型的7至10天的感染期,这与症状出现后的典型脱落时间以及症状出现前的典型感染期一致。选择指数分布的平均感染时间与γ分布相同。

我们模拟了3000种可能的流行病,并从最终规模分布中选择了四个与小、中、大和非常大流行病相对应的数据集。这四个数据集的最终疫情规模为34、62、122和222名感染者。

仿真结果如表所示1在指数分析和伽马分析中,用于混合和干预参数的先验值分别为伽马(.1,.4)和伽马(.1.1)。这些代表了对于流行性腮腺炎等常见传染病可能拥有的微弱但信息丰富的信息。我们注意到,这些先验值比分析中使用的先验值弱Lekone和Finkenstädt 2006年对于每个数据集的指数分析,λ事先分配了一个Gamma(187.09,10)。对于伽玛分析,α优先于伽玛(300,10),β优先于伽马(16.03,10)。这些值代表了潜在时间分布通常可用的强大先验信息。此外,我们注意到,微弱的先验信息允许准确估计潜伏时间的平均值,但会导致对大型数据集的方差估计过高。我们将证明,此方法的最大改进来自小数据集。此外,对于已知病原体(如腮腺炎)的潜伏时间和感染时间分布,通常很容易获得强有力的先验信息,并且可以合法地用于分析。

表1

用于分析具有指数衰减干预的伽马数据集的参数中位数和95%中心可信区间。基于每次老化后的10000次实现

分析数据集混合(0.25)干预(0.1)阿尔法(30)贝塔系数(1.604)R(右)0(2.16)预测疫情规模
费用34例0.230.62不适用不适用1.837
(0.14, 0.32)(0.07, 2.96)(1.13, 2.74)(1, 573)
伽马射线34例0.200.1229.781.541.6917
(0.13, 0.28)(0.05, 0.22)(26.45, 33.17)(1.21, 1.91)(1.11,2.38)(1, 173)
费用62例0.230.12不适用不适用1.859
(0.16, 0.31)(0.04, 0.35)(1.23, 2.68)(1, 672)
伽马射线62例0.210.0729.731.641.7926
(0.15, 0.28)(0.03, 0.11)(26.54, 33.23)(1.30, 1.97)(1.28, 2.39)(1, 242)
费用122例0.260.12不适用不适用2.1336
(0.20, 0.34)(0.07, 0.22)(1.59, 2.87)(1, 1212)
伽马射线122例0.260.1029.132.222.2478
(0.20, 0.32)(0.07,0.14)(25.93, 32.50)(1.39, 1.97)(1.76, 2.75)(1, 475)
费用222例0.270.10不适用不适用2.1143
(0.22, 0.32)(0.07,0.15)(1.68, 2.61)(1, 1119)
伽马射线222例0.270.1028.811.572.2884
(0.22, 0.31)(0.08, 0.13)(25.56, 32.16)(1.34, 1.82)(1.92, 2.70)(1, 424)
分析数据集混合(0.25)干预(0.1)阿尔法(30)贝塔系数(1.604)R(右)0(2.16)预测疫情规模
费用34例0.230.62不适用不适用1.837
(0.14, 0.32)(0.07, 2.96)(1.13, 2.74)(1, 573)
伽马射线34例0.200.1229.781.541.6917
(0.13, 0.28)(0.05, 0.22)(26.45, 33.17)(1.21, 1.91)(1.11,2.38)(1, 173)
费用62例0.230.12不适用不适用1.859
(0.16, 0.31)(0.04, 0.35)(1.23, 2.68)(1, 672)
伽马射线62例0.210.0729.731.641.7926
(0.15, 0.28)(0.03, 0.11)(26.54, 33.23)(1.30, 1.97)(1.28, 2.39)(1, 242)
费用122例0.260.12不适用不适用2.1336
(0.20, 0.34)(0.07, 0.22)(1.59, 2.87)(1, 1212)
伽马射线122例0.260.1029.132.222.2478
(0.20, 0.32)(0.07,0.14)(25.93, 32.50)(1.39, 1.97)(1.76, 2.75)(1, 475)
费用222例0.270.10不适用不适用2.1143
(0.22, 0.32)(0.07,0.15)(1.68, 2.61)(1, 1119)
伽马射线222例0.270.1028.811.572.2884
(0.22, 0.31)(0.08, 0.13)(25.56, 32.16)(1.34, 1.82)(1.92, 2.70)(1, 424)
表1

用于分析具有指数衰减干预的伽马数据集的参数中位数和95%中心可信区间。基于每次老化后的10000实现

分析数据集混合(0.25)干预(0.1)阿尔法(30)贝塔系数(1.604)R(右)0(2.16)预测疫情规模
费用34例0.230.62不适用不适用1.837
(0.14, 0.32)(0.07, 2.96)(1.13, 2.74)(1, 573)
伽马射线34例0.200.1229.781.541.6917
(0.13, 0.28)(0.05, 0.22)(26.45, 33.17)(1.21, 1.91)(1.11,2.38)(1, 173)
费用62例0.230.12不适用不适用1.859
(0.16, 0.31)(0.04, 0.35)(1.23, 2.68)(1, 672)
伽马射线62例0.210.0729.731.641.7926
(0.15, 0.28)(0.03, 0.11)(26.54, 33.23)(1.30, 1.97)(1.28, 2.39)(1, 242)
费用122例0.260.12不适用不适用2.1336
(0.20, 0.34)(0.07, 0.22)(1.59, 2.87)(1, 1212)
伽马射线122例0.260.1029.132.222.2478
(0.20, 0.32)(0.07,0.14)(25.93, 32.50)(1.39, 1.97)(1.76, 2.75)(1, 475)
费用222例0.270.10不适用不适用2.1143
(0.22, 0.32)(0.07,0.15)(1.68, 2.61)(1, 1119)
伽马射线222例0.270.1028.811.572.2884
(0.22, 0.31)(0.08, 0.13)(25.56, 32.16)(1.34, 1.82)(1.92, 2.70)(1, 424)
分析数据集混合(0.25)干预(0.1)阿尔法(30)贝塔系数(1.604)R(右)0(2.16)预测疫情规模
费用34例0.230.62不适用不适用1.837
(0.14, 0.32)(0.07, 2.96)(1.13, 2.74)(1, 573)
伽马射线34例0.200.1229.781.541.6917
(0.13, 0.28)(0.05, 0.22)(26.45, 33.17)(1.21, 1.91)(1.11,2.38)(1, 173)
费用62例0.230.12不适用不适用1.859
(0.16, 0.31)(0.04, 0.35)(1.23, 2.68)(1, 672)
伽马射线62例0.210.0729.731.641.7926
(0.15, 0.28)(0.03, 0.11)(26.54, 33.23)(1.30, 1.97)(1.28, 2.39)(1, 242)
费用122例0.260.12不适用不适用2.1336
(0.20, 0.34)(0.07, 0.22)(1.59, 2.87)(1, 1212)
伽马射线122例0.260.1029.132.222.2478
(0.20, 0.32)(0.07,0.14)(25.93, 32.50)(1.39, 1.97)(1.76, 2.75)(1, 475)
费用222例0.270.10不适用不适用2.1143
(0.22, 0.32)(0.07,0.15)(1.68, 2.61)(1, 1119)
伽马射线222例0.270.1028.811.572.2884
(0.22, 0.31)(0.08, 0.13)(25.56, 32.16)(1.34, 1.82)(1.92, 2.70)(1, 424)

Geweke诊断中大于0.05的P值用于指示所有模型参数的收敛性(Geweke,1992年). 请注意,PS SEIR模型通常在参数估计的方差方面提供了一些改进,大多数改进是在疫情规模较小到中等规模时出现的,因为在这些情况下,每条路径对混合和干预参数的影响更大。除了拟合真实模型所期望的方差减少之外,我们假设,这种现象的主要原因是伽马分布模型提供了更多关于潜在过程的信息,这使得在疫情规模较小的情况下可以实现更准确的参数。

在查看最终疫情规模时,人们注意到PS-SEIR方法的预测大大改进。在这些预测中,当根据伽马分析生成新的流行病时,我们使用了真实的伽马感染时间分布,当根据感染时间分布生成新的疫情时,使用了指数感染时间分布(8.62天)。混合和干预参数的微小差异可能对疫情规模预测产生显著影响,特别是当采用指数传染时间时。PS SEIR方法不仅缩小了可信区间,而且通过允许较少变化的感染时间来防止疫情规模预测中的这种可变性。这些预测强烈支持在分析疫情数据和预测新疫情时使用适当的模型。值得注意的是,这些报告没有区分轻微疫情和重大疫情。然而,一个明显的特征是,PS SEIR预测的疫情更接近真实的疫情规模。

4数据分析

激励性数据集包括2006年爱荷华州流行性腮腺炎疫情期间经拭子培养确诊的214例腮腺炎的发病时间,疫情持续时间为2006年1月29日至2006年6月25日。我们注意到,疫情早期通过拭子培养确诊病例的可能性较小,这可能导致对感染时间分布的估计更长,而对混合参数的估计更低。事实上,我们拟合的所有模型都倾向于低估疫情的最终规模,混合参数的低值可能是部分原因。然而,在流行病学研究中,并不是每个感染个体都能被诊断出来,这是很常见的,相反,我们强调PS-SEIR结构的改进要优于类似的人口平均方法。

以下分析有两个目标。第一个是对爱荷华州流行性腮腺炎疫情进行比仅利用指数分布更为现实的分析,并证明PS-SEIR公式相对于人口平均公式的改进。第二是为公众对疫情的认识确定一个合理的参数形式,作为对数据的干预。这将证明认识到现代流行病中公众意识导致的行为变化的重要性,以及量化这些变化的重要性。

Polgreen等人使用广义线性混合模型(GLMM)方法分析了爱荷华州流行性腮腺炎疫情,绘制了数据图,并使用比例测试分析了春假的影响。他们发现春假后腮腺炎病例的年龄构成存在春假效应(Polgreen等人,2010年). 我们再次注意到,他们的分析考虑了所有可能的病例,而我们的分析只考虑了确诊病例。考虑在SEIR结构中对时间进行更精细的处理,可以让我们扩展他们的研究结果,并确定数据集中更多的时间结构。

仅仅对数据集建模而不考虑公众意识的干预是不成功的。流行病很少发生,这是基于从没有考虑公众意识的模型中获得的估计参数后验值,而确实发生的流行病严重低估了最终的流行病规模,几乎没有模拟流行病达到真实流行病规模的一半。先前的文献已经成功地将公众意识作为一种干预手段。请注意Lekone and Finkenstädt 2006年使用指数衰减干预来模拟公众意识,因为政府的意识运动取得了可喜的结果。

在建模公众意识时,我们将使用两个参数化。第一次干预将与第二次干预相同,将于3月30日开始,即CDC向MMWR网站发布消息的当天(CDC 2006年). 第二项是后勤干预,其形式如下公式,其中Φ1> 0,公式,day是自初始案例以来的天数。此函数将能够在疫情期间从其初始值减少混合参数。为了适应春假对混合的影响,我们从2006年3月6日开始,进行了为期三周的持续效应干预。该干预的参数形式可在Web附录C中找到。

在处理腮腺炎时必须考虑的一个方面是MMR疫苗的存在。CDC表示,爱荷华州幼儿园2004-2005年MMR疫苗接种率为97%(2009年b). 因此,我们将其作为对爱荷华州疫苗接种率的最佳估计。Farley-Kim等人,1985年提示MMR疫苗预防腮腺炎的有效性为85%。该模型中的一个简化假设是,疫苗是产生永久免疫的“要么全有要么全无”疫苗。根据我们的疫苗接种估计,爱荷华州有523000人易患腮腺炎。257万人将从被删除类别开始,以说明其免疫状态。这是一个重要的考虑因素,因为高免疫率对混合和干预参数的大小起着作用。

由于腮腺炎感染时间的先验信息不如潜在时间的先期信息强(见2),我们将为每个分布使用两个传染期长度。第一组是短感染时间。这些对应于指数(8.6)、伽马(100,11.6)和威布尔(12,9)。第二组将是长时间的感染。这些对应于指数(11)、伽马(25,2.27)和威布尔(6,12)。

构建模型,并使用后验预测P值方法评估其拟合度,如Gelman、Meng和Stern,1996年在MCMC链的每次迭代中,都会产生一种单一的流行病。所使用的模型拟合统计数据表明,最终疫情规模在107至428之间(是疫情的一半至两倍),模拟疫情结束的日期在117至197之间(与实际疫情长度相差40天)。这些数值是根据模拟流行病中的变异性选择的。

2显示了我们运行的所有模型的后验预测P值。特定路径方法产生了模型拟合的最高后验P值。最佳路径特异性模型(Weibully分布,干预呈指数形式,感染时间长)产生的公认流行病数量是最佳拟合人口平均模型(指数分布,干预呈正态分布,感染时间较长)的六倍多。路径特异性方法也产生了一些最低的P值,表明它对所选择的公共卫生干预形式很敏感。给出了最佳拟合PS-SEIR模型及其相应指数模型的描述性统计。我们注意到,与总体平均方法相比,PS SEIR方法的可信区间要小得多。此外,众所周知,流行性腮腺炎通常潜伏16至18天。威布尔模型中平均潜伏时间的可信区间比指数模型更适合这种先验已知信息。与总体平均模型相比,潜在时间方面的更好拟合以及可信区间更窄可能表明PS SEIR模型的模型拟合精度更高。基本生殖数,R(右)0,两种模型的中位数都在历史合理范围内(安德森和梅,1991年). 然而,PS SEIR模型为该参数提供了更窄的95%可信区间。这一点很重要,因为这个数字是这些模型中感兴趣的基本数量。

表2

模型的后验预测P值用于实际数据分析。每个后验预测P值基于7000个实现

分发干预感染期P值
指数指数0.0203
指数指数0.0284
指数物流0.0245
指数物流0.0305
伽马射线指数0.0881
伽马射线指数0.1061
伽马射线物流0.0028
伽马射线物流0.0033
韦布尔指数0.1668
韦布尔指数0.2184
韦布尔物流0.0004
韦布尔物流0.0335
分发干预传染期P值
指数指数0.0203
指数指数0.0284
指数物流0.0245
指数物流0.0305
伽马射线指数0.0881
伽马射线指数0.1061
伽马射线物流0.0028
伽马射线物流0.0033
韦布尔指数0.1668
韦布尔指数0.2184
韦布尔物流0.0004
韦布尔物流0.0335
表2

模型的后验预测P值用于实际数据分析。每个后验预测P值基于7000个实现

分发干预感染期P值
指数指数0.0203
指数指数0.0284
指数物流0.0245
指数物流0.0305
伽马射线指数0.0881
伽马射线指数0.1061
伽马射线物流0.0028
伽马射线物流0.0033
韦布尔指数0.1668
韦布尔指数0.2184
韦布尔物流0.0004
韦布尔物流0.0335
分发干预感染期P值
指数指数0.0203
指数指数0.0284
指数物流0.0245
指数物流0.0305
伽马射线指数0.0881
伽马射线指数0.1061
伽马射线物流0.0028
伽马射线物流0.0033
韦布尔指数0.1668
韦布尔指数0.2184
韦布尔物流0.0004
韦布尔物流0.0335
表3

模型1的关键参数或参数形式的后验概率的描述性统计,该模型具有指数分布的暴露时间、指数衰减干预和长感染时间,以及模型2的Weibully分布的暴露次数、指数衰减干扰和长感染时间。基于每个7000实现

模型参数中值的95%中央可信区间
模型1混合0.91(0.43, 1.72)
模型2混合1.23(0.89, 1.66)
模型1春假−0.59(−2.21, 0.22)
模型2春假−0.21(−0.82, 0.21)
模型1公众意识0.08(0.03, 0.13)
模型2公众意识0.04(0.03, 0.06)
模型1平均接触量18.88(11.60, 25.23)
模型2平均接触量17.25(16.93, 18.07)
模型1R(右)010.01(4.73,18.92)
模型2R(右)013.69(9.91, 18.48)
模型1预测疫情规模15(5, 126)
模型2预测疫情规模64(37, 195)
模型参数中值的95%中央可信区间
模型1混合0.91(0.43, 1.72)
模型2混合1.23(0.89, 1.66)
模型1春假−0.59(−2.21, 0.22)
模型2春假−0.21(−0.82, 0.21)
模型1公众意识0.08(0.03, 0.13)
模型2公众意识0.04(0.03, 0.06)
模型1平均接触量18.88(11.60, 25.23)
模型2平均接触量17.25(16.93, 18.07)
模型1R(右)010.01(4.73,18.92)
模型2R(右)013.69(9.91, 18.48)
模型1预测疫情规模15(5, 126)
模型2预测疫情规模64(37, 195)
表3

模型1的关键参数或参数形式的后验概率的描述性统计,该模型具有指数分布的暴露时间、指数衰减干预和长感染时间,以及模型2的Weibully分布的暴露次数、指数衰减干扰和长感染时间。基于每个7000实现

模型参数中值的95%中央可信区间
模型1混合0.91(0.43, 1.72)
模型2混合1.23(0.89, 1.66)
模型1春假−0.59(−2.21, 0.22)
模型2春假−0.21(−0.82, 0.21)
模型1公众意识0.08(0.03, 0.13)
模型2公众意识0.04(0.03, 0.06)
模型1平均接触量18.88(11.60, 25.23)
模型2平均接触量17.25(16.93, 18.07)
模型1R(右)010.01(4.73,18.92)
模型2R(右)013.69(9.91, 18.48)
模型1预测疫情规模15(5, 126)
模型2预测疫情规模64(37, 195)
模型参数中值的95%中心可信区间
模型1混合0.91(0.43, 1.72)
模型2混合1.23(0.89, 1.66)
模型1春假−0.59(−2.21, 0.22)
模型2春假−0.21(−0.82, 0.21)
模型1公众意识0.08(0.03, 0.13)
模型2公众意识0.04(0.03, 0.06)
模型1平均接触量18.88(11.60, 25.23)
模型2平均接触量17.25(16.93, 18.07)
模型1R(右)010.01(4.73,18.92)
模型2R(右)013.69(9.91, 18.48)
模型1预测疫情规模15(5, 126)
模型2预测疫情规模64(37, 195)

后面抽签的自相关也很有趣。Geweke标准用于评估烧伤,如第3节所述。磨合后,我们发现PS SEIR混合参数的自相关较低,如表所示与相应的总体平均参数相比。混合参数Φ1对于PS方法,滞后10自相关为0.10,但在总体平均方法中为0.65。春假干预具有滞后10自相关,PS方法为0.12,而人口方法为0.55。公共卫生干预的滞后10自相关系数为0.07,PS方法为0.81,而人口平均法为0.81。然而,潜在分布的平均值在PS SEIR模型中具有0.91的自相关,而在总体平均模型中具有0.66的自相关。对于这两个模型,链之间的相互关系是相似的。

1绘制了疫情曲线,这些曲线属于最佳拟合PS-SEIR模型以及相应的人口平均模型的合理范围。可以看出,PS SEIR模型在合理范围内提供了更多预测疫情(21.84%对2.84%)。此外,PS-SEIR方法更准确地拟合了疫情的形状。在人口方法中,那些处于合理范围内的流行病往往会在早期高估疫情规模,而PS SEIR方法提供了直到第50天的更准确的疫情包络线。在第50天左右,疫情数量急剧增加,这是两种模型都无法很好地描述的特征。然而,PS-SEIR模型也捕捉到了疫情剩余部分的形状,在疫情之上还有更多曲线。回顾一下,由于只使用了确诊病例,预计最终疫情规模将被低估。对于这个数据集,PS-SEIR模型比人口平均方法更好地捕捉到疫情的真实形式。

上部:具有威布尔潜伏期和感染时间、指数公共卫生干预和长感染分布的PS-SEIR模型的可接受流行病曲线。下:接受相同人口平均模型的流行病曲线。灰色曲线是模型预测,而黑色曲线是实际流行。
图1

上部:具有威布尔潜伏期和感染时间、指数公共卫生干预和长感染分布的PS-SEIR模型的可接受流行病曲线。下:接受相同人口平均模型的流行病曲线。灰色曲线是模型预测,而黑色曲线是实际流行。

5讨论

路径特异性公式通常比人口平均方法更好地模拟流行病。在模拟研究中,混合和干预过程的所有参数形式都是已知的,就这些参数的中值而言,通常采用路径特定方法和总体平均方法,并且几乎总是给出更窄的可信区间。在SEIR建模中,参数实现的微小差异非常重要,特别是在混合参数中。

我们还注意到,在对爱荷华州流行性腮腺炎疫情进行的实际数据分析中,PS-SEIR模型比人口平均方法产生了更合理规模的预测疫情。事实上,根据第4节中定义的统计数据,最佳PS-SEIR模型产生的合理疫情规模预测是最佳人口平均模型的7倍多。因此,我们建议在分析潜伏期和感染期不呈指数分布的传染病相关流行病时,使用路径特异性方法。

此外,还有两个无关的初始病例。总体平均方法不能很好地处理这种结构,而PS SEIR模型可以很容易地处理它。对于发生在Dubuque县的第二个初始病例,我们将该患者设定为在疫情开始前14天内存在潜伏感染,因此该患者的总潜伏期为17天。这最大限度地减少了对后部潜伏期分布的影响,并得到了有关腮腺炎潜伏期长度的先验知识的支持。人口平均模型将其作为3天的潜伏期进行分析,这可能会对参数的后验概率产生一些影响。

我们对爱荷华州流行性腮腺炎疫情的分析存在局限性。首先,个人的传染性在其感染期间是恒定的。这是不现实的,但PS SEIR模型的当前形式要求这样做。其次,在这种分析中违反了均匀混合。第三,疫苗接种是以一种相当幼稚的方式进行的,这可能会影响混合和干预参数的准确性。

尽管存在这些局限性,但我们已经证明,与人口平均方法相比,路径特异性方法可以产生更准确的流行病SEIR模型,并避免了当前SEIR和SIR模型在考虑一般潜伏和感染时间分布时的许多弱点。

5补充资料

第2节、第3节和第4节中引用的网络附录可在Wiley Online Library的生物统计学网站上获得。

致谢

作者感谢Philip Polgreen博士在理解腮腺炎发病过程和爱荷华州腮腺炎疫情方面提供的帮助,并感谢一位副编辑和两位审稿人,他们极大地改进了手稿。Aaron Porter还通过T32 GM077973“微生物、传染病和生物信息学统计”培训拨款感谢NIH的支持。

工具书类

安德森
,
风险管理。
五月
,
风险管理。
(
1991
).
人类传染病:动力学与控制
.
英国牛津
:
牛津科学出版物
.

男孩
,
R·J。
贾尔斯
,
中华人民共和国。
(
2007
).
具有时间非均匀去除率的SEIR流行病模型的贝叶斯推断
.
数学生物学杂志
 
55
,
223
247
.

疾病预防控制中心
(
2006
).
流行性腮腺炎
.http://www.cdc.gov/mmwr/preview/mmwrhtml/mm5513a3.htm.

疾病预防控制中心
(
2009年a
).
腮腺炎临床问答
.http://www.cdc.gov/mumps/clinical/qa-disease.html.

疾病预防控制中心
(
2009年b
).
腮腺炎患者隔离的最新建议
.http://www.cdc.gov/mmwr/preview/mmwrhtml/mm5740a3.htm.

埃尔德
,
D。
,
杜基克
,
五、。
、和
德怀尔
,
G.公司。
(
2006
).
疾病传播预测的不确定性
.
美国国家科学院
 
103
,
15693
15697
.

法利-金
,
R。
,
巴特
,
美国。
,
斯泰特勒
,
H。
,
奥伦斯坦
,
西。
,
巴特
,
英国。
,
沙利文
,
英国。
,
哈尔平
,
T。
、和
西罗特金
,
B。
(
1985
).
腮腺炎疫苗临床疗效
.
美国流行病学杂志
 
121
,
593
597
.

盖尔曼
,
答:。
,
,
X-L。
、和
斯特恩
,
H。
(
1996
).
基于已实现差异的模型适应度后验预测评估
.
中国统计局
 
6
,
733
807
.

格威克
,
J。
(
1992
). 评估基于抽样方法计算后验矩的准确性。
贝叶斯统计4
.
英国牛津
:
克拉伦登出版社
.

珠宝
,
C。
,
Kypraiosy公司
,
T。
,
尼尔兹
,
第页。
、和
罗伯茨
,
G.公司。
(
2009
).
新发传染病的贝叶斯分析
.
贝叶斯分析
 
4
,
465
496
.

基纳
,
E。
米勒
,
J.C.公司。
(
2011
). 流行病渗透网络、流行病结果和干预措施。
传染病的跨学科观点
.内政部:.

肯德尔
,
D.G.公司。
(
1948
).
可变生成时间在随机生灭过程发展中的作用
.
生物特征
 
35
,
316
330
.

科马克
,
重量。
麦肯德里克
,
答:。
(
1927
).
对流行病数学理论的贡献
.
伦敦皇家学会会刊A
 
115
,
700
721
.

勒科内
,
体育。
芬肯斯特
,
B。
(
2006
).
带有控制干预的随机流行病SEIR模型的统计推断:埃博拉病例研究
.
生物计量学
 
63
,
1170
1177
.

劳埃德
,
答:。
(
2001
).
传染病模型中传染期的实际分布:持续性和动力学的变化模式
.
理论种群生物学
 
60
,
59
71
.

模式
,
C.J.公司。
斯莱曼
,
C.K.公司。
(
2000
).
流行病学中的随机过程:HIV/AIDS、其他传染病和计算机
.
世界科学出版有限公司
.

奥尼尔
,
P.D.公司。
贝克尔
,
N.G.公司。
(
2001
).
敏感性变化时流行病的推断
.
生物统计学
 
2
,
99
108
.

波尔格林
,
第页。
,
博内特
,
L。
,
卡瓦诺
,
J。
,
金格里奇
,
美国。
,
德雅尔丹
,
L。
,
哈里斯
,
M。
,
奎利斯克
,
M。
、和
彭泰拉
,
M。
(
2008
).
症状出现后腮腺炎病毒传播的持续时间
.
临床传染病
 
46
,
1450
1451
.

波尔格林
,
第页。
,
博内特
,
L。
,
,
M。
,
彭泰拉
,
M。
、和
卡瓦诺
,
J。
(
2010
).
流行性腮腺炎传播的空间分析:大学生及其春假旅行的重要性
.
流行病学与感染
 
138
,
434
441
.

Streftaris公司
,
G.公司。
吉布森
,
G·J。
(
2004
).
实验性口蹄疫流行的贝叶斯分析
.
伦敦皇家学会会刊B
 
271
,
1111
1117
.

穿
,
H。
,
鲁哈尼
,
第页。
、和
龙骨
,
M。
(
2005
).
传染病管理的适当模式
.
公共科学图书馆医学
 
2
,
0621
0627
.

,
年。
,
隆吉尼
,
I.米。
、和
哈洛兰
,
机械工程师。
(
2006
).
利用密切接触人群的传染病发病率数据设计和评估预防干预措施
.
应用统计学
 
55
,
317
330
.

本文根据牛津大学出版社标准期刊出版模式的条款出版和发行(https://academic.oup.com/journals/pages/open_access/funder_policies/chorus/standard_publication_model)