本文介绍了一个确定美国新冠肺炎病例第二次喘振行为的数学框架。在这个框架内,一种灵活的算法方法为每个状态选择一组转折点,计算它们之间的距离,并确定每个状态是处于(或超过)第一次喘振还是第二次喘振。然后,利用归一化时间序列之间的适当距离,逐月进一步分析病例轨迹之间的关系。我们的算法显示,31个州正在经历第二次激增,而最大的10个州中有4个仍处于第一次激增状态,病例数从未减少。该分析有助于突出最成功和最不成功的国家应对新型冠状病毒疫情。

美国受到新冠肺炎的严重影响,在病例和死亡人数方面均居世界领先地位。1各州在很大程度上决定了自己对疫情的应对措施,2寻求保护公民生命,同时减轻经济后果。继3月和4月的封锁和企业关闭之后,所有50个州都减少了限制。自那以后,美国的新案件数量急剧上升,公众就是否应该称之为“第二次激增”展开了辩论4,5因此,仔细确定最成功和最不成功的国家,对于应对新冠肺炎持续威胁具有重要意义。本文有两个目标:建立一个数学框架,定义第二次疫情激增并确定正在经历的状态,并比较新病例计数的轨迹,以此确定有效的大流行应对措施。

了解新冠肺炎病例统计的轨迹有助于各国政府应对疫情的影响。鉴于该疾病的高度传染性,每天新增病例的数量可能会超过医疗系统,并进一步限制企业和社交聚会。相反,新病例数量的减少是一个好迹象,但应仔细监测。因此转折点在新的案例中,计数对识别至关重要。然而,鉴于人类行为的随机性,转折点很难预测,新冠肺炎的预测建模需要经常观察实时数据。本文重点对美国不同州的案例轨迹进行回顾性分析,以确定哪些公共政策应对措施最有效,哪些最无效。虽然我们将重点放在美国,但我们的方法可能会得到更广泛的应用,以了解公共政策对巴西和印度等具有类似联邦结构的国家的影响。这三个国家的新冠肺炎病例数是世界上最高的,1政府的反应因州而异,结果也不尽相同。6、7

为了实现这个目标,我们使用了来自时间序列分析时间序列分析已广泛应用于流行病学,8,9包括新冠肺炎。10–12现有的时间序列分析方法多种多样,包括幂律模型13以及距离分析等非参数方法,14距离相关性,15–17和网络模型。18本文旨在开发一个新的识别和比较转折点研究新型冠状病毒在美国传播的时间序列。这些转折点将国家在大流行期间的发展轨迹划分为处于(或超过)第一次激增或第二次激增。

除了上述国家间转折点的确定外,本文还使用了一种新的半度量方法来度量国家行为之间的距离,并基于此进行聚类。该文件实施层次聚类,19,20它以前曾用于各种流行病学应用。其中包括炎症性疾病,21空气传播疾病,22阿尔茨海默病,23埃博拉病毒,24非典,25和新冠肺炎。11 

本文结构如下:。,我们介绍了部分方法,然后展示了我们的结果。章节描述了我们的框架,用于识别转折点,确定哪些状态处于第二次激增状态,以及基于相似行为的聚类。章节逐月分析每个州新冠肺炎计数的轨迹。章节四、总结了新冠肺炎在美国传播的结果和新发现。附录A,我们简要地将我们的分析应用于巴西各州,以证明我们方法的通用性。

在本节中,我们开发了一个数学框架和程序来确定一个状态是否经历了第二次喘振。通过仔细选择转折点,我们制定了适用于单个时间序列的定义,并开发了一种方法来比较时间序列集合中不同的喘振行为。

x个(t吨)R(右)是公共时间间隔内实值时间序列的集合t吨=1,,T型,=1,,n个本文分析的时间序列是美国50个州和哥伦比亚特区新病例的每日计数,按字母顺序排列,=1,,51我们的数据涵盖2020年1月21日至2020年7月31日,期间为T型=193跨越天n个=51区域。

数据集中有几个不规则的特征,包括周末的病例数较低,由于先前数据的调整而导致的一些每日负计数,以及一般噪声。此外,不同数据源之间存在微小差异。为了隔离数据集中以及不同数据集之间的信号,我们首先应用Savitzky–Golay过滤器26计数以生成集合平滑时间序列x个^(t吨),t吨=1,,T型,=1,,n个.这将移动平均计算与多项式平滑相结合。通过移动平均计算,它在很大程度上消除了所有负计数,除非只有极少数情况。在这些情况下,我们将任何负平滑计数替换为零。在本文的剩余部分,我们将分析这些平滑的情况x个^(t吨).由于平滑过程,x个^(t吨)R(右)0不一定是整数,但都是非负的。

光滑时间序列转折点和二次喘振行为的识别x个^(t吨)分两步进行。首先,我们确定一系列潜在的局部极大值或峰值,和局部极小值或水槽第二,我们根据选择的条件适当地细化这个序列。最后几局P(P)T型波峰和波谷的概率分别决定了时间序列是否处于(或超过)其第一次或第二次浪涌P(P)T型非空。

对于第一步,基本思想是指定一个时间t吨0峰值或低谷,如果

x个^(t吨0)=最大值{x个^(t吨):最大值(1,t吨0)t吨最小值(t吨0+,T型)},
(1)
x个^(t吨0)=最小值{x个^(t吨):最大值(1,t吨0)t吨最小值(t吨0+,T型)},
(2)

对于参数<T型2,我们查看的长度。在本文中,我们选择=17解释病毒的14天潜伏期27减少周末的测试。这些天真的定义(1)(2)有两个缺陷:第一x个^(t吨)可以确定以下连续值t吨当只计算一个时,作为峰值或低谷。更微妙的是,当时间序列在两者之间基本上是单调的时,可能会在相距很远的两个点检测到两个波谷,它们之间没有峰值。例如,在图1(a),在t吨0=1126分别对应于时间序列的开始和2020年5月26日。以下是排除后者的方法。

图1。

平滑时间序列并确定各个州的转折点:(a)密西西比州、(b)乔治亚州、(c)加利福尼亚州、(d)德克萨斯州和(e)北卡罗来纳州被指定为序列TP,并被确定为第一次激增。(f)佛罗里达州、(g)宾夕法尼亚州和(h)俄亥俄州被确定为第二次激增,序列为TPTP。(i) 纽约州和(j)新泽西州被指定为TPT序列,并决心结束他们的第一次激增,并使曲线变平。(k) 亚利桑那州和(l)缅因州被分配为TPT和TPTPT,在这段时间结束时有最后的波谷,并被确定分别从第一次和第二次激增中下降。

图1。

平滑时间序列并确定各个州的转折点:(a)密西西比州、(b)乔治亚州、(c)加利福尼亚州、(d)德克萨斯州和(e)北卡罗来纳州被指定为序列TP,并被确定为第一次激增。(f)佛罗里达州、(g)宾夕法尼亚州和(h)俄亥俄州被确定为第二次激增,序列为TPTP。(i) 纽约州和(j)新泽西州被指定为TPT序列,并决心结束他们的第一次激增,并使曲线变平。(k) 亚利桑那州和(l)缅因州被指定为TPT和TPTPT,在该时期结束时出现最终波谷,并确定分别从第一次和第二次浪涌开始下降。

关闭模态

我们实现了(1)(2)通过依次检查x个^(t吨)。第一个峰值或波谷指定为的第一个值t吨0这样的话(1)(2)分别保持。对于美国各州而言,这是一个初始低谷t吨0=1对应于平滑后的零情况。已确定峰值t吨0,我们在期间搜索t吨>t吨0对于两个元素之一:如果我们在t吨1>t吨0根据(2),我们将其添加到槽组中,并从t吨1正常情况下。如果我们在t吨1>t吨0根据(1)这样的话x个^(t吨0)x个^(t吨1),我们忽略了这个较小的峰值作为冗余;如果我们在t吨1>t吨0根据(1)这样的话x个^(t吨0)<x个^(t吨1),我们删除峰值t吨0并替换为t吨1然后从那里继续。类似的过程适用于t吨0通过这个过程,我们生成了波谷和波峰的交替序列,从波谷开始t吨0=1每个时间序列分别在其全局最大值和最小值处分配至少一个峰值和一个谷值。如果全局最大值不唯一,则在第一个最大值处指定一个峰值。第一步到此结束。

到目前为止,我们收集的每个时间序列都被分配了一个交替的波峰和波谷序列,从波谷开始t吨0=1如果到目前为止的序列是TPTP,人们可能会天真地将一个状态定义为处于第二次激增。然而,一些检测到的峰值和波谷并不重要,应排除在外。我们描述了一种灵活的方法来排除平凡的峰值或波谷,在这种方法中我们应用了两个条件。

t吨1<t吨是两个峰,必然被一个槽隔开。我们选择一个参数δ如果峰值比率,定义为x个^(t吨)x个^(t吨1)<δ,我们删除了峰值t吨.如果连续两个槽t吨2,t吨4留下,我们移除t吨2如果x个^(t吨2)>x个^(t吨4),否则删除t吨4也就是说,如果第二个峰值的大小小于δ对于第一个峰值,我们将其删除,决定不将其称为第二次浪涌。

最后,我们定义对数粒度在次之间t吨1<t吨2作为

日志毕业生(t吨1,t吨2)=日志x个^(t吨2)日志x个^(t吨1)t吨2t吨1.
(3)

分子与日志(x个^(t吨2)x个^(t吨1))是更合适的替代x个^(t吨2)x个^(t吨1)1事实上,“增长率”在(1,),而对数速率有界于(,). The日志毕业生函数测量该期间对数增长的平均速率[t吨1,t吨2]。现在,让我们t吨1,t吨2是相邻的峰谷。我们选择一个参数ϵ=0.01,如果

|日志毕业生(t吨1,t吨2)|<ϵ,
(4)

也就是说,平均对数增加或减少是明确定义的,并且小于1%,我们将两者都删除t吨1t吨2从我们的群峰群谷中。例如,此步骤从图1(b),其中2020年4月17日的局部最大值不重要。这种情况下,槽始终保持在t吨0=1,其中x个^(t吨0)=0以及全球最大值的峰值。以下是选择P(P)T型.

为了量化时间序列转折点之间的距离,我们应用了Ref。28(带有第页=1). 给定两个非空有限集S公司1,S公司2,定义为

D类(S公司1,S公司2)=12(b条S公司2d日(b条,S公司1)|S公司2|+S公司1d日(,S公司2)|S公司1|),
(5)

哪里d日(b条,S公司1)是距离b条S公司2到集合S公司1.价值观d日(S公司1,S公司2)是对称的、非负的和零当且仅当S公司1=S公司2.然后,我们定义n个×n个喘振行为矩阵转折点设置之间

D类j个T型P(P)=D类(P(P),P(P)j个)+D类(T型,T型j个).
(6)

然后,D类j个T型P(P)=0当且仅当时间序列x个^(t吨)x个^j个(t吨)具有相等的波峰和波谷,因此具有相同的浪涌行为。这些程序以算法格式显示在附录B.

我们的方法为每个状态分配四种可能的序列类型之一。13个州,包括佐治亚州、加利福尼亚州、德克萨斯州和北卡罗来纳州[图1(b),1(c),1(d)、和1(e)分别]被指定为序列TP(即一个波谷,然后是一个波峰),并被视为处于其第一次涌浪中。所有13个都在最后一天有其独特的峰值和全局最大值,并在图2,其中我们在D类T型P(P)。使用任何值都可以获得相同的结果δ[0.1,0.2],所以我们选择δ=0.2也就是说,我们排除了任何少于第一次的五分之一的第二次激增。然后,31个州和哥伦比亚特区被分配给TPTP-we,他们认为这是第二次激增图1(f),1(克)、和1(小时)分别是。其中,除佛罗里达州和南卡罗来纳州外,其他所有州在最后一天都出现了峰值,其中19个州在当天达到了全球最大值。这些第二个浪涌状态形成了图2四个州被指定为TPT序列,其中纽约州和新泽西州[1(i)1(j)]由于峰值比小于0.2,因此去除了局部最大值。他们的曲线已经变平,第一次激增已经完全结束。亚利桑那州[1(k)]犹他州和犹他州也被指定为TPT,在最后一天达到最后一个低谷,这表明他们仍在从第一次激增中回落。最后,缅因州[1(l)]和佛蒙特州被指定为TPTPT序列。对于缅因州来说,这最后一个低谷是在这一时期结束时,这表明它仍在从第二次激增中回落,而佛蒙特州的最后一个谷底是在最后一次之前,这表明该州已经将第二次浪潮的曲线拉平D类T型P(P)将所有这些行为区分为单独的集群。

图2。

喘振行为矩阵,定义见第。,测量新情况下轨迹中转向点集之间的距离。时间序列的五个主要(子)簇被识别为具有以下行为:13个状态处于第一次激增,两个状态完成了第一次激增并使曲线变平,两个状态从第一次激增下降,31个州和哥伦比亚特区已经超过了他们的第一次激增,现在正经历第二次激增。

图2。

喘振行为矩阵,定义见第。,测量新情况下轨迹中转向点集之间的距离。五个主要(子)时间序列簇被确定为具有以下行为:第一次喘振中的13个状态,完成第一次喘息并使曲线变平的两个状态,第一次喘气后下降的两个国家,31个州和哥伦比亚特区已经超过了他们的第一次激增,现在正经历第二次激增。

关闭模态

在本节中,我们进一步分析了50个州和哥伦比亚特区的新病例数,逐月检查平滑病例数的轨迹。将这些平滑的计数限制在特定的月份可以得到一个序列(f)=((f)(1),(f)(2),,(f)()))R(右),其中{29,30,31}是当月的天数=1,,51.

||(f)||=t吨=1|(f)(t吨)|成为1向量的范数(f).作为所有人(f)(t吨)为非负数,统计一个月内观察到的新病例总数(直至平滑),对于每个州和3月后的每个月都不为零。因此,我们可以定义=(f)||(f)||.矢量反映一个月内新病例数的相对变化。例如,一个月内新病例差异在1000到1100之间的州将呈现相对平坦的标准化轨迹;然而,一个月内新病例数从0增加到100的州,其归一化轨迹将急剧增加,这反映了相对变化。我们定义轨迹距离矩阵D类j个=||j个||测量标准化轨迹之间的距离。此距离与常用距离不同距离相关,10,15–17哪种测量方法更适合于累积病例首先,当两个序列具有最大可能的相似性时,距离相关等于1,而距离D类j个两个相同序列之间为0。其次,鉴于序列(1,2,,4)(4,,2,1)距离相关性等于1,它们具有显著不同的归一化轨迹距离,这预示着一个序列在增加,而另一个序列在减少。明确地,||j个||=0当且仅当(f)=α(f)j个对一些人来说α>0,而两个序列(X(X)k个),(Y(Y)k个)具有距离相关性1当且仅当X(X)k个=+b条Y(Y)k个对于常量,b条也就是说,距离相关性不能区分正梯度和负梯度。

图3(a)3(d)分别在4月、5月、6月和7月的这些矩阵上实现分层聚类。树状图结构具有一致的相似性:每个图形都有三个簇、两个小簇和一个大多数簇,其中包含几个内部相似性较高的子簇。这两个小簇通常由经历急剧增加或减少轨迹的状态组成,而较大的簇表现出更多的异质性。我们描述了表一。在这里,我们还包括Frobenius范数每个距离矩阵。对于n个×n个矩阵A类,定义为||A类||=(,j个=1n个|j个|2)12并量化一个月内所有距离的总传播。

图3。

轨迹树状图,定义见第。适用于(a)四月、(b)五月、(c)六月和(d)七月。这些树状图逐月强调具有类似新病例轨迹的状态。对于所有四个月,都有一个一致的集群结构:两个小集群和一个带有几个集中子集群的大集群。

图3。

轨迹树状图,定义见第。适用于(a)四月、(b)五月、(c)六月和(d)七月。这些树状图逐月强调具有类似新病例轨迹的状态。在这四个月里,都有一个一致的集群结构:两个小集群和一个包含几个集中子集群的大集群。

关闭模态
表一。

四个月内轨迹距离矩阵的簇数、簇大小和Frobenius范数。

轨迹距离矩阵
月份集群群集大小Frobenius范数
4月{4,6,41} 15.34 
五月 {2,2,44} 15.97 
6月3个{3,14,34} 18.35 
7月{3,4,44} 8.67 
轨迹距离矩阵
月份集群群集大小Frobenius范数
4月{4,6,41} 15.34 
五月 {2,2,44} 15.97 
六月{3,14,34} 18.35 
7月{3,4,44} 8.67 

五月份,三个州因人数较少而被排除在外。

4月份,层次聚类确定了美国存在三个州簇,如图3(a)第一个包括阿拉斯加、夏威夷、爱达荷、路易斯安那、蒙大拿和佛蒙特州,所有这些州的新病例轨迹都在下降。爱达荷州,见图4(a),显示了集群的典型行为,在4月初达到峰值,在本月剩余时间内稳步下降。第二组包括爱荷华州、堪萨斯州、明尼苏达州和内布拉斯加州,所有这些州的新增病例数都急剧增加。爱荷华州和明尼苏达州在图4(b)4(c)分别是。最后一个簇包含所有41个剩余状态和两个高度自相似的子簇。第一个子集群包含各州,其轨迹向下凹陷,4月份出现局部峰值。乔治亚州、宾夕法尼亚州和康涅狄格州如图所示图1(b),1(克)、和4(d)分别是该亚类的典型。第二个子集群由轨迹适度增加的州组成,如密西西比州和亚利桑那州,如图1(a)1(k)分别是。

图4。

平滑时间序列并确定各个州的转折点:(a)爱达荷州,(b)爱荷华州,(c)明尼苏达州,(d)康涅狄格州,(e)阿肯色州,(f)马萨诸塞州。阿肯色州第一次出现激增;爱达荷州、爱荷华州和明尼苏达州正在经历比第一次更严重的第二次激增;康涅狄格州和马萨诸塞州的最高比率超过0.2的病例出现了新的增长,如第。因此,他们决心要经历第二次激增。

图4。

平滑时间序列并确定各个州的转折点:(a)爱达荷州,(b)爱荷华州,(c)明尼苏达州,(d)康涅狄格州,(e)阿肯色州,(f)马萨诸塞州。阿肯色州第一次出现激增;爱达荷州、爱荷华州和明尼苏达州正在经历比第一次更严重的第二次激增;康涅狄格州和马萨诸塞州的最高比率超过0.2的病例出现了新的增长,如第。因此,他们决心要经历第二次激增。

关闭模态

五月份,我们将阿拉斯加、夏威夷和蒙大拿州排除在树状图之外[图3(b)],因为它们平滑的轨迹大多由零和非常低的计数组成。再次观察到三个星团:第一个也是最反常的星团仅包含纽约和新泽西,它们的轨迹显著下降,如图所示图1(i)1(j)分别是。第二个集群包含阿肯色州[图4(e)]和佛蒙特州;五月初,他们的发展轨迹相对平稳,下半年有所上升。所有其他状态都包含在最后一个集群中,还有几个可观察的子集群。一个显著的子集群包括东北部的康涅狄格州、特拉华州、马萨诸塞州、宾夕法尼亚州、罗德岛州和哥伦比亚特区图4(d)4(f)分别用于康涅狄格州和马萨诸塞州。相比之下,另一个子集群包含北卡罗来纳州和亚利桑那州[图1(e)1(k)其特点是5月份温和持续增长。

6月,再次观察到三个集群图3(c)第一个包括佛罗里达州、爱达荷州和蒙大拿州,这些州的新病例显著增加。图1(f)4(a)显示,佛罗里达州和爱达荷州在前一个月分别出现温和下降和持平病例后,自6月初以来分别经历了高速增长。在第二组中,我们再次观察了几乎所有东北部各州,包括康涅狄格州[4(d)]缅因州哥伦比亚特区[1(l)]马萨诸塞州马里兰州[4(f)]新泽西州新罕布什尔州[1(j)],纽约[1(i)]罗得岛州和弗吉尼亚州。这些集群在6月经历了轨迹从4月早些时候的峰值下降的过程。最后一个集群的特征是轨迹增加的状态。包含密西西比州、俄亥俄州、阿肯色州和其他州的一个显著的子星团在6月份的线性增长轨道上表现出相当大的相似性,如图1(a),1(小时)、和4(e)分别是。

7月[3(d)],三个集群中的第一个包含亚利桑那州、犹他州、缅因州和佛蒙特州。亚利桑那州[1(k)]犹他州和缅因州的房价较第一次上涨有所下降[1(l)]和佛蒙特州第二次。第二个集群由康涅狄格州组成[4(d)]、夏威夷和马萨诸塞州[4(f)]从7月初到7月底,所有这些都显示出新病例的增长。7月份,最终集群中的州几乎都经历了持续的增长,亚集群中出现了更细微的轨迹分离。例如,一个子集群包含加利福尼亚、德克萨斯和佛罗里达,显示在图4(c),4(d)、和4(f)分别在7月初经历了快速增长,并在7月底开始趋于平稳。即使是纽约和新泽西州的病例在7月份也略有增加,尽管绝对数要低得多。另一个子聚类包含乔治亚州、宾夕法尼亚州和俄亥俄州[1(b),1(克),1(小时)在新的情况下,它们都经历了近似线性增长。如中所示表一7月份降低的Frobenius范数反映出矩阵整体上的扩散较小,这是因为有大量州具有类似的增长轨迹。

本文提出了一种分析时间序列集合中的转折点和轨迹的新方法。我们的数学框架定义了在新冠肺炎病例中经历(或超过)第二次疫情激增的状态的特征。转折点簇集之间的半度量的使用根据其不同的喘振行为进行状态描述,并提供对时间序列集合整体行为的即时可见的洞察力。

在对行为进行分类的同时,还要逐月对轨迹进行仔细检查。这里,我们根据新病例数增加或减少的相对速率来分离和聚集轨迹。我们的方法是灵活的:不同的平滑技术、数据之间的度量、集合之间的(半)度量、算法框架中的参数和聚类方法可以用于研究时间序列集合,并识别不同的喘振行为,其通用性高于此应用程序。我们通过在巴西联邦单位的简单应用来证明这一点附录A.

逐月对各州的轨迹进行聚类显示出集群结构中的一致相似性:总是有三个集群,即一个多数集群和两个较小的集群。随着时间的推移,稳定的集群结构使人们能够很容易地观察到各个状态的集群成员的变化,并确定不同状态下新案例计数改变方向的时间框架。例如,5月份,纽约和新泽西州进入了一个单独的集群,其特点是新案件数量急剧下降,因为他们引入了面具授权。29 

我们的分析为新冠肺炎在美国的演变提供了见解。虽然之前的论文研究了不同国家在较短时间内的统计数据,10,11本文以国家为基础,对美国进行了为期七个月的研究。在我们的框架内,我们确定31个州和哥伦比亚特区正在经历第二次激增,其中21个州比第一次激增更为严重。13个州,包括最大的10个州中的4个州,仍处于第一次激变,新的病例数从未实质性减少。只有两个州完全结束了,两个州部分结束了他们的第一次激增,到目前为止还没有第二次激增。只有两个州超过了第二个州。截至7月底,所有其他州的病例数都在增加,在分析的最后一天,有32例病例数(经过平滑处理)达到最高。所有这些功能在中都可见图2,其中五个(子)集群对应于这五种可能的喘振行为。

中的相似之处图2可以帮助确定成功管理新冠肺炎次数最多和最少的州的共同特征。与许多东北部州一样,纽约州和新泽西州在4月初出现了新冠肺炎病例高峰。与其他东北部州不同,这两个州大幅减少了新病例,并避免了第二次疫情激增。马萨诸塞州和特拉华州在7月出现了第二轮疫情激增,分别为第一次高峰的28.5%和55.7%,分别是。

相比之下,加利福尼亚州、德克萨斯州、佛罗里达州和乔治亚州是新冠肺炎病例增长管理不佳的四个州:它们的病例数是全国最高的。加利福尼亚州和德克萨斯州限制了这些限制,尽管案件从未停止增加,随后又在创纪录的统计中恢复了这些限制。30–32带箱子人均乔治亚州比加利福尼亚州和得克萨斯州还大,在7月份推翻了当地的口罩规定后,乔治亚州仍处于首次激增阶段。33在最初的第一次激增之后,佛罗里达州减少了限制,此后经历了漫长而陡峭的第二次激增,其中包括最高的单日计数。34图3(c)3(d)将这些状态放在性能较差的集群中,而图2图中显示了佛罗里达州的第二次浪涌,以及加利福尼亚州、德克萨斯州和乔治亚州的第一次浪涌。

总的来说,本文介绍了一种分析时间序列集合中二次喘振行为的新方法,并对新冠肺炎在美国的传播提供了新的见解2020年初,许多州认为新冠肺炎将很快得到解决。例如,很少有人预测佛罗里达州的第二次激增会比第一次严重得多。尽管如此,这是一种高度传染性的病毒,即使是报告为零的国家也发现了复发。35由于进一步激增危及公民安全和经济复苏,各个州必须密切关注其案件的发展轨迹,并迅速作出反应,将案件数量增加的可能性降至最低。我们预计,许多州政府将从第二次疫情激增中吸取教训,并谨慎观察新的案件数量。保持警惕是必要的,我们希望各国在回应中学习到这一点。

作者感谢Kerry Chen和Orri Ganel的有益评论和编辑。

支持本研究结果的数据可在参考文献中公开获得。3637.

在这个简短的部分中,我们通过将我们的方法应用于巴西的27个联邦单位来展示我们方法的通用性。我们的数据跨度为2020年2月25日至2020年7月31日,为期158天。图5,我们在27×27转折点矩阵D类T型P(P)第。与美国相比,我们确定,14个州和联邦地区中的大多数都处于首次激增阶段,新的案件数量从未大幅减少。只有三个州进入了第二轮激增——卡拉、伯南布哥和里约热内卢,而九个州则从第一轮激增中有所下降。与佛罗里达等美国州不同,第二轮的激增是温和的,其严重程度与第一轮激流相当。与美国一样,我们注意到基于地理位置的显著相似性。在九个州中

图5:。

喘振行为矩阵,定义见第。适用于巴西27个联邦单位。三组时间序列确定了以下行为:14个州加上第一次激增的联邦区,9个州从第一次激变中下降,三个州超出了第一次激化,现在正经历第二次激增。

图5:。

喘振行为矩阵,定义见第。,适用于巴西的27个联邦单位。三组时间序列确定了以下行为:14个州加上第一次激增的联邦区,9个州从第一次激变中下降,三个州超出了第一次激化,现在正经历第二次激增。

关闭模态
算法1

转折点识别(步骤1)

给定:时间序列x个(t吨)R(右) 
形成平滑的时间序列:x个^(t吨)=Savitzky--戈莱(x个(t吨)); 
数据预处理:如果x个^(t吨)<0,t吨小时电子n个x个^(t吨)=0; 
初始化:状态=,当前TP=1,峰值集=空
槽集={1}; 
While期间当前TP<T型 
   设置t吨0=当前TP;标志=假; 
   对于t吨1=t吨0+1T型 
       如果state=槽状态t吨1满足(1)x个^(t吨1)>x个^(t吨0)然后 
           state=峰值状态; 
           追加t吨1至PeakSet; 
           当前TP=t吨1; 标志=true; 
           休息 
       否则,如果state=槽状态t吨1满足(2)x个^(t吨1)<x个^(t吨0) 
       然后 
           追加t吨1至槽组; 
           删除t吨0来自TroughSet; 
           当前TP=t吨1; 标志=true; 
           休息 
       否则,如果state=峰值状态t吨1满足(2)x个^(t吨1)<x个^(t吨0)然后 
           state=槽状态; 
           追加t吨1至槽集; 
           当前TP=t吨1; 标志=true; 
           休息 
       否则,如果state=峰值状态t吨1满足(1)x个^(t吨1)>x个^(t吨0)然后 
           追加t吨1至PeakSet; 
           删除t吨0来自PeakSet; 
           当前TP=t吨1; 标志=true; 
           休息 
    如果标志=假然后 
       中途休息 
输出峰值集和槽集。 
给定:时间序列x个(t吨)R(右) 
形成平滑的时间序列:x个^(t吨)=萨维茨基--戈莱(x个(t吨)); 
数据预处理:如果x个^(t吨)<0,t吨小时电子n个x个^(t吨)=0; 
初始化:状态=,当前TP=1,峰值集=空
槽集={1}; 
While期间当前TP<T型 
   设置t吨0=当前TP;标志=假; 
   对于t吨1=t吨0+1T型 
       如果state=槽状态t吨1满足(1)x个^(t吨1)>x个^(t吨0)然后 
           state=峰值状态; 
           追加t吨1至PeakSet; 
           当前TP=t吨1; 标志=true; 
           休息 
       否则,如果state=槽状态t吨1满足(2)x个^(t吨1)<x个^(t吨0) 
       然后 
           追加t吨1至槽集; 
           删除t吨0来自TroughSet; 
           当前TP=t吨1; 标志=true; 
           休息 
       否则,如果state=峰值状态t吨1满足(2)x个^(t吨1)<x个^(t吨0)然后 
           state=槽状态; 
           追加t吨1至槽集; 
           当前TP=t吨1; Flag=真; 
           休息 
       否则,如果state=峰值状态t吨1满足(1)x个^(t吨1)>x个^(t吨0)然后 
           追加t吨1至PeakSet; 
           删除t吨0来自PeakSet; 
           当前TP=t吨1; 标志=true; 
           休息 
    如果标志=假然后 
       中途休息 
输出峰值集和槽集。 
算法2

转折点细化(步骤2)

TPSet=排序(峰值集槽集);                          索引开始
从1开始
初始化:CurrentPeakIndex=2;                        开始峰值比率
精炼
While期间当前峰值指数长度(TPSet)-2 
    =当前峰值指数,t吨1=TPS集(),t吨=TP设置(+2); 
    如果x个^(t吨)x个^(t吨1)δ然后 
        当前峰值指数=+2; 
    否则,如果x个^(t吨)x个^(t吨1)<δ+2=长度(TPSet)然后 
        删除t吨来自PeakSet; 
        TPSet=排序(峰值集槽集); 
    否则,如果x个^(t吨)x个^(t吨1)<δ+2长度(TPSet)然后 
        t吨2=TPS集(+1),t吨4=TPS集(+); 
        如果x个^(t吨2)x个^(t吨4)然后 
            删除t吨4来自TroughSet; 
        其他的 
            删除t吨2来自槽集; 
        删除t吨来自PeakSet; 
        TPSet=排序(峰值集槽组); 
    初始化:CurrentIndex=1;                开始日志粒度细化
    虽然当前索引<长度(TPSet) 
        =当前指数,t吨0=TPS集(),t吨1=TPS集(+1); 
        如果|日志毕业生(t吨0,t吨1)|<ϵ然后                                   参见方程式(3) 
             删除t吨0t吨1从槽集和峰值集; 
             TPSet=排序(峰值集槽集); 
        其他的 
             当前索引=+1; 
    输出峰值集和槽集。 
TPSet=排序(峰值集槽集);                          索引开始
从1开始
初始化:CurrentPeakIndex=2;                        开始峰值比率
精炼
While期间当前峰值指数长度(TPSet)-2 
    =当前峰值指数,t吨1=TPS集(),t吨=TPS集(+2); 
    如果x个^(t吨)x个^(t吨1)δ然后 
        当前峰值指数=+2; 
    否则,如果x个^(t吨)x个^(t吨1)<δ+2=长度(TPSet)然后 
        删除t吨来自PeakSet; 
        TPSet=排序(峰值集槽集); 
    否则,如果x个^(t吨)x个^(t吨1)<δ+2长度(TPSet)然后 
        t吨2=TPS集(+1),t吨4=TPS集(+); 
        如果x个^(t吨2)x个^(t吨4)然后 
            删除t吨4来自TroughSet; 
        其他的 
            删除t吨2来自TroughSet; 
        删除t吨来自PeakSet; 
        TPSet=排序(峰值集槽集); 
    初始化:CurrentIndex=1;                开始日志粒度细化
    虽然当前索引<长度(TPSet) 
        =当前索引,t吨0=TPS集(),t吨1=TPS集(+1); 
        如果|日志毕业生(t吨0,t吨1)|<ϵ然后                                   参见方程式(3) 
             删除t吨0t吨1从槽集和峰值集; 
             TPSet=排序(峰值集槽集); 
        其他的 
             当前索引=+1; 
    输出峰值集和槽集。 

在数据期结束时,这六个数字正在下降,其中六个位于北部地区:阿克雷、阿马帕、亚马逊、帕拉、朗多尼亚和罗赖马。在分析的最后一天,15个州显示了其最大的新病例数(经过平滑处理)。

在本节中,我们提供了用于确定第二次喘振行为的计算步骤的算法演示,如第节所述。.算法1介绍了第。二、A确定波峰和波谷的交替序列。算法2描述了第二个步骤,在此步骤中对列表进行了优化。在我们的实现中,我们选择了三个参数=17,δ=0.2,ϵ=0.01.方程(1)(2)在第一步中定义必要的条件,而(3)在第二步中定义必要条件。

1
请参见https://ourworldindata.org/conarovirus-source-data《我们的数据世界》(2020)(2020年8月1日访问)。
2
共和国。
哈法吉
M.M.先生。
梅洛
, “
全球化思考,本地化行动——美国对新型冠状病毒的回应
,“
北英格兰。医学杂志。
382
,
e75(电子75)
(
2020
).
三。
M。
拉蒂
等。《华盛顿邮报》(2020年),参见https://www.washingtonpost.com/nation/2020/05/19/conarovirus-update-us(2020年5月20日)。
4
R。
迈耶
交流。
牧歌
《大西洋月刊》(2020),“大流行的毁灭性新阶段”,参见https://www.theatlantic.com/science/archive/200/06/second-coronavirus-surge-here/613522网址(2020年6月25日)。
5
法律。
马拉加基斯
,“第一波和第二波冠状病毒”,约翰斯·霍普金斯医学院(2020),见https://www.hopkinsmedicine.org/health/conditions-and-diseases/coronavirus/first-and-second-waves-of-coronavvirus(霍普金斯医学网)(2020年6月24日)。
6
风险管理。
达席尔瓦
,
成本加运费。
德奥利维拉·门德斯
、和
C、。
Manchein公司
《审查巴西境内新冠肺炎疫情的异质传播》,medRxiv(2020年)。
7
一、。
巴拉利
等。,“印度对新冠肺炎的政策回应”,《全球卫生政策影响中心(2020年)》,见http://centerforpolicyimpact.org/our-work/the-4ds/indias-policy-response-to-covid-19(2020年6月)。
8
H.W.公司。
赫思科特
, “
传染病数学
,“
SIAM版本。
42
,
599
653
(
2000
).
9
G.公司。
乔维尔
,
L。
萨滕斯皮尔
,
美国。
班萨尔
、和
C、。
振动器
, “
表征早期疫情增长的数学模型:综述
,“
物理学。生命修订版。
18
,
66
97
(
2016
).
10
C、。
Manchein公司
,
大肠杆菌。
布鲁格纳戈
,
风险管理。
达席尔瓦
,
到岸价。
门德斯
、和
M.W.公司。
拜姆斯
, “
四大洲新型冠状病毒疫情幂律增长与软隔离策略的低效性密切相关
,“
混乱
30
,
041102
(
2020
).
11
J.A.T.公司。
马查多
上午。
洛佩斯
, “
罕见和极端事件:新冠肺炎疫情
,“
非线性动力学。
100
,
2953
2972
(
2020
).
12
N。
詹姆斯
M。
孟席斯
, “
基于聚类的多元时间序列双重进化:分析新冠肺炎
,“
混乱
30
,
061108
(
2020
).
13
A。
巴斯克斯
, “
具有发散再生数分支过程的多项式增长
,“
物理学。修订稿。
96
,
038702
(
2006
).
14
R。
莫埃克尔
B。
默里
, “
测量时间序列之间的距离
,“
物理D
102
,
187
194
(
1997
).
15
G·J。
塞凯利
,
M.L.公司。
里佐
、和
英国。
巴基罗夫
, “
通过距离相关性测量和测试相关性
,“
Ann.统计。
35
,
2769
2794
(
2007
).
16
成本加运费。
门德斯
M.W.公司。
拜姆斯
, “
检测Lyapunov不稳定性、噪声引起的逃逸时间和混合的距离相关性
,“
物理A
512
,
721
730
(
2018
).
17
到岸价。
门德斯
,
风险管理。
达席尔瓦
、和
M.W.公司。
拜姆斯
, “
距离自相关和Lyapunov指数的衰减
,“
物理学。版本E
99
,
062206
(
2019
).
18
英国。
,
B。
,
J.米。
摩尔
,
问:。
、和
M。
小型
, “
成长中的社区网络:一个分布式链接模型
,“
混乱
30
,
041101
(
2020
).
19
J.H。
病房
, “
分层分组以优化目标函数
,“
美国统计协会。
58
,
236
244
(
1963
).
20
G·J。
塞凯利
M.L.公司。
里佐
, “
基于距离内联合的层次聚类:Ward最小方差方法的扩展
,“
J.分类。
22
,
151
183
(
2005
).
21
上午-下午。
马多雷
等。, “
层次聚类技术对魁北克省慢性炎症疾病相关遗传多态性地理分布建模的贡献
,“
公共卫生基因组学
10
,
218
226
(
2007
).
22
M。
Kretzschmar公司
R.T.公司。
米科拉杰奇克
, “
八个欧洲国家的接触概况及其对模拟空气传播传染病传播的影响
,“
公共科学图书馆一号
4
,
电子5931
(
2009
).
23
H。
阿拉斯瓦尔
,
机械工程师。
哈拉比
,
J·J。
克罗斯
,
A。
阿卜杜拉
、和
答:A。
穆斯塔法
, “
无监督聚类方法在阿尔茨海默病中的应用
,“
前面。计算。神经科学。
13
,
31
(
2019
).
24
H。
穆拉迪
,
A。
布斯塔姆
、和
D。
莱斯塔里
,“层次聚类有序分割和折叠杂交在埃博拉病毒系统发育分析中的应用”,in2015年国际先进计算机科学和信息系统会议(IEEE,2015)。
25
R。
里西
,
第页。
马哈塔
,
L。
马西森
、和
第页。
麝香
, “
使用算术手征切割的层次聚类:复杂性和实验
,“
公共科学图书馆一号
5
,
e14067(电子14067)
(
2010
).
26
A。
萨维茨基
M.J.E公司。
戈莱
, “
用简化的最小二乘法对数据进行平滑和微分
,“
分析。化学。
36
,
1627
1639
(
1964
).
27
美国。
劳尔
等。, “
公开报告的确诊病例中2019年冠状病毒病(COVID-19)的潜伏期:估计和应用
,“
Ann.实习生。医学。
172
,
577
582
(
2020
).
28
N。
詹姆斯
,
M。
孟席斯
,
L。
阿齐兹
、和
J。
, “
用于多元变化点分析和异常检测的新型半度量
,“
物理D
412
,
132636
(
2020
).
29
L。
费雷-萨登
M。
克拉默
,《纽约时报》(2020),见https://www.nytimes.com/2020/04/15/nyregion/conavirus-face-masks-andrew-cuomo.html(2020年4月15日)。
30
J。
科尔曼
,“加利福尼亚州要求另外六个县关闭所有酒吧的室内业务”,《The Hill》(2020年),见https://thehill.com/homenews/state-watch/506117-california-tells-6 additional-counies-to-close-indoor-businesss-all(2020年7月6日)。
31
第页。
斯维特克
《德克萨斯论坛报》(2020),见https://www.texastribune.org/2020/07/02/texas-mask-order-greg-abott-coronavirus网址(2020年7月2日)。
33
美国。
纽曼
,“乔治亚州州长发布命令撤销地方面具授权”,NPR(2020)https://www.npr.org/sections/coronavirus-live-updates/2020/07/16/891718516/georgias-governor-issues-order-rescinding-local-mask-mandates公司(2020年7月16日)。
34
D。
霍金斯
,
F、。
索姆内兹
,
L。
梅克勒
、和
M。
拉蒂
《华盛顿邮报》(2020),见https://www.washingtonpost.com/nation/200/07/12冠状病毒更新-us(2020年7月13日)。
36
《美国冠状病毒(Covid-19)数据》,《纽约时报》(2020),参见https://github.com/nytimes/covid-19-data(2020年8月15日访问)。
37
《佩内尔·加罗纳维罗斯》(Painel coronavírus),《萨乌德部长》(Ministério da Saúde)(2020年),见https://covid.saude.gov.br(2020年8月25日访问)。