S公司摘要

最大稳定过程越来越广泛地用于建模复杂的极端事件,但现有的拟合方法要求计算量大,仅限于几十个变量。|${r}$|-帕累托过程在数学上更简单,通过推广单变量超越的概念,它具有合并所有相关极端事件的潜在优势。在本文中,我们研究了在高维峰值-阈值推断中使用适当的评分规则,重点关注与对数高斯随机函数相关的极值过程,并将梯度评分估计量与具有归一化边缘的正则变化分布的谱和删失似然估计量进行了比较,使用数百个位置的数据。当从真实模型进行模拟时,谱估计的性能最好,紧随其后的是梯度得分估计,但删失似然估计在吸引域的模拟中性能更好,尽管在弱极值依赖的情况下它优于梯度得分。我们通过在3600个位置的网格上模拟极端降雨,基于局部强降雨和空间累积降雨的超标情况,说明了我们想法的潜力和灵活性,并讨论了模型拟合的诊断。两个拟合模型之间的差异突出了罕见事件的定义如何影响估计的依赖结构。

1.简介

最近对极值理论的贡献描述了能够处理时空现象的模型(例如。,Kabluchko等人,2009年)并为罕见事件建模提供了一个灵活的框架,但它们的复杂性使高维数据的推理变得困难,甚至难以处理。例如,Brown–Resnick过程块中最大似然项的数量随着维度的增加而增加|D美元$|就像贝尔数字一样(Huser&Davison,2013年),因此计算成本较低的方法,如复合似然(Padoan等人,2010年)或包含分区信息(Stephenson&Tawn,2005年;Thibaud等人,2016年)已被提倡。第一种方法速度较慢,而第二种方法虽然效率更高,但如果分区不正确,则容易产生偏差(华兹华斯,2015).

使用块最大值的另一个有吸引力的替代方法是峰值-阈值分析,它通过关注单个极端事件来包含更多信息。在多元情况下,使用了超越的特定定义(例如。,Rootzén&Tajvidi,2006年;Ferreira&de Haan,2014年;Engelke等人,2015年),可以在|${r}$|-帕累托过程(Dombry&Ribate,2015年). 对于这种方法,完全似然通常以封闭形式提供,从而将可以联合建模的变量的最大数量从少数增加到几十个,但如果包括非极端成分,则可能会出现有偏估计。审查可能性,在这种情况下由Wadsworth&Tawn(2014),对于非极值观测更为稳健,但它涉及多元正态分布函数,计算量可能很高。然而,推论对于|$D\约30$|.

使用尾部相关系数开发的完全似然推断的非参数替代方案(Davis&Mikosch,2009年;Davis等人,2013年)或稳定的尾相关函数(Einmahl等人,2016年)依赖成对估计并允许峰值-阈值推断|$D\约100$|,但它们可能效率低下,并且可能受到组合考虑的限制。

最大稳定过程的应用(例如。,Asadi等人,2015年)或帕累托过程(Thibaud&Opitz,2015年)重点关注小区域,最多使用了几十个具有特定类型超越的位置,但需要利用更大的网格数据集以及更复杂的风险定义,以便更好地理解极端事件并减少模型不确定性。本文的目标是强调函数峰值相对于阈值建模的优势,使用|${r}$|-Pareto过程,以显示具有数百个位置的Brown–Resnick模型的高维推理的可行性,并比较不同过程在有限阈值方面的稳健性。我们开发了一种基于梯度得分的估计方法(海瓦里宁,2005年)对于超越的一般概念,不需要计算多元正态概率,计算复杂性由矩阵反演驱动,与经典高斯似然推断一样。该方法侧重于单个极端事件和超越的一般概念,由Pareto过程建模,而不是最大稳定方法。

2.在高阈值上建模超标

2.1. 单变量模型

极值的统计分析最初是针对块极大值开发的(甘贝尔,1958年, §5.1). 这种方法得到了广泛的应用,可以产生良好的结果,但将复杂数据集缩减到最大可能会导致信息的严重丢失(Madsen等人,1997年),因此通常首选阈值上的超标建模(Davison&Smith,1990年). |X美元$|是存在常数序列的随机变量|$a_n>0$||亿美元$|这样的话
\开始{方程式}n\,{\rm pr}(X>b_n+a_n X)\rightarrow-\log G(X)\结束{方程式}
(1)
作为|$n\rightarrow\infty$|,其中|G美元$|是非退化分布函数。然后|X美元$|据说属于最大吸引域|G美元$|并且,对于足够大的阈值|$u<\inf\{x:F(x)=1\}$|,我们可以使用近似值
\开始{方程式}{rm-pr}(X-u>X\mid-X>u)\近似H_{(\xi,\sigma)}(X)=\begin{cases}(1+\xi x/\sigma)_+^{-1/\xi},&\xi\neq 0\\\exp(-x/\sigma),&\xi=0,\结束{cases}\结束{方程式}
(2)
哪里|$\西格玛=\西格马(u)>0$||$a_+=\max(a,0)$|.如果形状参数|$\xi美元$|是否定的,那么|x美元$|必须位于间隔中|$[0,-\西格玛/\xi]$|,而|x美元$|可以取任何带正或零的正值|$\xi$|这意味着分布超过了高阈值|$u(美元)$|任何随机变量|X美元$|满足以下条件(2)可以近似为
\开始{方程式*}G_{(\xi,\sigma,u)}(x)=1-\zeta_uH_{,\结束{方程式*}
哪里|$\泽塔_u$|是指|X美元$|超过阈值|$u$|这种单变量超越模型以其最简单的形式适用于独立和相同分布的变量,但也用于时间序列、非平稳和空间数据。

超越的建模可以推广到多元设置(Rootzén&Tajvidi,2006年)和连续过程(Ferreira&de Haan,2014年;Dombry&Ribate,2015年)在功能规则变化框架内。

2.2. 功能规则变化

|美元$|是一个紧凑的度量空间,例如|$[0,1]^2$|用于空间应用。我们写作|$\mathscr美元{F}(F)_+=C\{S,[0,\infty)\}$|连续函数的Banach空间的闭子集|$x:S\rightarrow\mathbb{R}$|被赋予统一规范|$\|x\|=\sup_{s\在s}|x(s)|$|中,写入|$\mathscr{F}$|对于|$\mathscr美元{F}(F)_+$|与单身人士|$\{0\}$|排除,并写入|$\mathscr{B}(\Xi)$|对于Borel|美元\西格玛$|-与度量空间相关的代数|$\Xi$|.让|$M_\mathscr{F}$|表示上的Borel度量等级|$\mathscr{B}(\mathscr{F})$|; 我们说一套|$A\in\mathscr{B}(\mathscr{F})$|被限制在远离|$\{0\}$|如果|$d(A,\{0\})=\inf_{x\在A}\|x\|>0$|.一系列措施|$\{\Lambda_n\}\subset M_\mathscr{F}$|据说收敛到极限|M_\mathscr{F}中的$\Lambda\$|(Hult&Lindskog,2005年)如果|$\lim_{n\rightarrow\infty}\Lambda_n(A)=\Lambda(A)$|为所有人|$A\in\mathscr{B}(\mathscr{F})$|远离|$\{0\}$|具有|$\Lambda(\partial A)=0$|,其中|$\部分A$|表示的边界|$澳元|对于所谓的|$\帽子{w}$|-收敛,请参见(Lindskog等人,(2014年,定理2.1)。

规则变化提供了一个灵活的数学设置,在这个设置中,可以根据|$\hat{w}$|-措施的趋同。随机过程|$X美元$|样本路径位于|$\mathscr{F}$|有规律地变化(Hult&Lindskog,2005年)如果存在正实数序列|$a_1、a_2、\ldot$|具有|$\lim_{n\rightarrow\infty}a_n=\infty$|和一个措施|M_\mathscr{F}中的$\Lambda\$|这样的话
\开始{方程式}n\:{\rm pr}(a_n^{-1}X\in\cdot)\rightarrow\Lambda(\ cdot)\结束{方程式}
(3)
作为|$n\rightarrow\infty$|; 然后我们写|$X\in\小{\text{rv}}(\mathscr{F},a_n,\Lambda)$|; 请注意指向的链接(1). 对于规范化过程|$X^*$|,例如通过标准化|X美元$|至Fréchet单元(科尔斯·唐恩出版社,1991年, §5)或单位Pareto(Klüppelberg&Resnick,2008年),正则变分等价于重整化点态极大值的收敛性|$n^{-1}\最大{i=1}^n X_i^*$|的独立副本|X美元^*$|到非退化过程|$Z^*$|具有单位Fréchet边距和指数度量|$\兰姆达^*$|(de Haan和Lin,2001年). 这个过程|$Z^*$|被称为简单的最大稳定过程,并且|X美元^*$|据说位于的最大吸引域|$Z^*$|.

规则变化也会影响超过高阈值的超越特性。对于任何非负可测函数|${r}:\mathscr{F}\rightarrow[0,\infty)$|和随机过程|s}$|中的$\{X(s)\}_{s,一个|${r}$|-超越被定义为一个事件|$\{{r}(X)>u_n\}$|其中阈值|$u_n$|是这样的|${\rm pr}\{{r}(X)>u_n\}\到0$|作为|$n\rightarrow\infty$|。我们进一步要求|${r}$|同质,即存在|$\alpha>0$|这样的话|${r}(ax)=α$|对于|$a>0$||$x\in\mathscr{F}$|.作为|${r}(\cdot)$|可以替换为|${r}(\cdot)^{1/\alpha}$|在不失一般性的情况下,在下文中我们假设|$\alpha=1$|.Dombry&Ribatet(2015)打电话|${r}$|成本函数,在2013年蒙彼利埃大学II期博士论文托马斯·奥皮茨(Thomas Opitz)中称之为径向聚合函数;但我们更喜欢术语风险功能,因为|${r}$|确定要研究其风险的极端事件类型。

后续结果的自然公式|${r}$|-超越使用伪极分解。作为一种规范|$\|\cdot\|_{\rm ang}$||$\mathscr{F}$|,称为角范数,以及风险函数|${r}$|,伪极变换|$T_{r}}$|是这样的地图
$$T_{{r}}:\mathscr{F}\rightarrow[0,\infty)\times\mathscr{宋体}_{\rm ang},\quad T_{r}}(x)=\left\{v={r}(x),\:w=\frac{x}{\|x\|_{rm ang{}}\right\}\!,$$
哪里|$\mathscr美元{宋体}_{\rm ang}$|是单位球体|$\{x\in\mathscr{F}:\|x\|_{\rm ang}=1\}$|.如果|${r}$|是连续的,并且|T美元$|仅限于|$\{x\in\mathscr{F}:{r}(x)>0\}$|,然后|T美元$|是带逆的同胚|$T_{r}}^{-1}(v,w)=v\次w/{r}(w)$|.
中的定理2.1Lindskog等人(2014)提供了等效的伪极公式(). 对于任何|$X\in\小{\text{rv}}(\mathscr{F},a_n,\Lambda)$|以及任何一致连续的风险函数|${r}$|不会消失|$\兰姆达$|-几乎到处都有|$\测试版>0$|和一个措施|$\西格玛_{{r}}$||$\mathscr{B}(\mathscr{宋体}_{\rm ang})$|这样的话
\开始{方程式}n \:{\rm pr}\{T_{r}}^{-1}(a_n^{-1}v,w)\in\cdot\}\rightarrow\Lambda\circ T_{r}}^{-1}(\cdot)=\Lambda ^{beta}\times\sigma_{r}(\ cdot)\结束{方程式}
(4)
作为|$n\rightarrow\infty$|,其中|$\Lambda^{\beta}[v,\infty)=v^{-\beta{$||$\sigma_{r}}(\cdot)=\Lambda\{x\in\mathscr{F}:{r}(x)\geqslate 1,\:x/\|x\|_{rm ang}\in(\cdop)\}$|称为角度测量。相反,如果|$\{x\in\mathscr{F}:{r}(x)=0\}=\空集$|(Lindskog等人,2014年,推论4.4)。

功能|${r}(x)=\sup_{s\在s}x(s)$|中,由使用Rootzén和Tajvidi(2006)在多元环境中费雷拉和德哈恩(2014)对于连续过程,意味着|X美元$|在任何位置超过阈值|$s\单位:s$|将被标记为极端,但此功能只能在以下应用程序中使用|X美元$|贯穿始终|$S$|。因此,最好使用以下功能|s'}X中的$\max_{s\$||s'}X/u中的$\max_{s\$|,其中|$S'\子集S$|是一组有限的测量站点。其他风险职能部门包括|$\int_{S}X(S)\,{{\rm d}}S$|用于研究面雨量(Coles&Tawn,1996年),|$\min_{s\in s'}X(s)/u(s)$|、和|$X(s_0)$|针对影响特定地点的风险|$s_0$|尽管风险函数的选择允许人们关注特定类型的极端事件,但角度范数的选择|$\|\cdot\|_{\rm ang}$|没有效果,并且通常是为了方便而制作的。

最后,对于一个通用的角度范数|$\|\cdot\|_{\rm ang}$|,两个风险泛函的角度测度|${r} _1个$||${r} _2$|绝对积极的|$\兰姆达$|-几乎所有地方都被这个表达联系在一起
\开始{方程式}\西格玛_{{r} _1个}(\mathrm{d} w个)=\左\{\压裂{{r} _1个(w) }{{r} _2(w) }\right\}^\beta\sigma_{{r} _2}(\mathrm{d} w个),\quad\mathrm{d} w个\in\mathscr{B}(\mathscr{宋体}_{\rm ang})\text{.}\结束{方程式}
(5)

方程式(5)对于模拟和我们感兴趣时非常有用|${r} 2个$|-超出,但根据|${r} _1个$|美元之前的所有定义和结果都适用于有限尺寸,即|D美元$|-维随机向量,替换时|$\帽子{w}$|-模糊收敛(Resnick,2007年,§3.3.5)|$M_{\mathbb{R}^D_+\setminus\{0\}}$|,Borel类度量|$\mathscr{B}(\mathbb{R}^D_+\setminus\{0\})$|被赋予|$\|\cdot(美元)\|$|规范;参见上述托马斯·奥皮茨的博士论文。

2.3.|${r}$|-帕累托过程

在本节中,|${r}$|表示非负且同质的泛函|$\alpha=1$|. The|${r}$|-帕累托过程(Dombry&Ribate,2015年)对于建模超越非常重要,可以构造为
\开始{方程式*}P=U\frac{Q}{{r}(Q)},\结束{方程式*}
哪里|美元$|是一个单变量Pareto随机变量|${\rm pr}(U>v)=1/v^\beta$||$(v\geqsleat 1)$||$Q美元$|是一个随机过程,样本路径位于|$\mathscr{S}^{右}_{\rm ang}=\{x\ in{\mathscr{F}}:{r}(x)\geqslant 1,\|x\|_{\rm ang}=1\}$|和概率测度|$\sigma_{\rm ang}$|.流程|P美元$|然后被称为|${r}$|-带尾指数的Pareto过程|$\测试版>0$|和角度测量|$\sigma_{\rm ang}$|; 为了区分不同的Pareto过程,下面我们使用符号|P美元^{右}_{\beta,\sigma{{r}}}$|对于|$P$|.
的一个重要属性|美元$|-Pareto过程具有阈值不变性:|$A\in\mathscr{B}(\{x\in\mathscr{F}:{r}(x)\geqslate 1\})$|以及所有|$u\geqsleat 1个$|这样的话|${\rm pr}\{{r}(P)\geqslate u\}>0$|,
\开始{方程式*}{\rm pr}\{u^{-1}P\在A\mid{r}(P)\geqslide u\}={\rm pr}(P\在A)\text{.}中\结束{方程式*}
此外,对于|$X\in\小{\text{rv}}(\mathscr{F},a_n,\Lambda)$|带索引|$\测试版>0$|以及风险职能部门|${r}$|在原点处是连续的且不消失|$\兰姆达$|-几乎无处不在|${r}$|-超越弱收敛于|${r}$|-帕累托过程,即。,
\开始{方程式*}{\rm pr}\big\{u^{-1}X\in\cdot\maid{r}(X)\geqslant u\big\}\rightarrow{\rm pr}\bigh(P_{\beta,\sigma\{r}}}^{r}\in\cdot\bigh)\结束{方程式*}
作为|$n\rightarrow\infty$|,带有尾部索引|$\测试版$|和概率测度|$\西格玛{{r}}$|定义见(4) (Dombry&Ribate,2015年,定理2)。使用规范化流程时|$X^*$|,指数度量|$\兰姆达^*$|极限最大稳定过程|$Z^*$|和措施|$\Lambda^1\times\sigma_{{r}}$|Pareto过程在坐标变换之前是相同的,如下所示(4).
对于两个不同的风险功能|${r} _1个$||${r} _2$|和角度测量|美元\西格玛_{{r} _1个}$||美元\西格玛_{{r} _2}$|存在的|M_\mathscr{F}中的$\Lambda\$|这样的话
\开始{方程式*}\λ\约T^{-1}_{{r} _1个}(\cdot)=\Lambda\circ T^{-1}_{{r} 2个}(\cdot),\结束{方程式*}
相关的帕累托过程|P美元^{{r} _1个}_{\β,\σ_{{r} _1个}}$||P美元^{{r} _2}_{\β,\σ_{{r} _2}}$|定义在|$\mathscr{F}$|,但是,正如所建议的(5),如果存在阈值|$u_{\rm分钟}$|这样的话
$$\{x\in\mathscr{F}:{r} _1个(x) \geqslate u_{\rm min}\}\子集\{x\in\mathscr{F}:{r} _2(x) \geqsland 1 \}$$
然后
\开始{方程式}{\rm pr}\left\{\frac{P^{{r} _1个}_{\β,\σ_{{r} _1个}}}{u} \在\ cdot中\;\比格|\;{r} _2\大(P^{{r} _1个}_{\β,\σ_{{r} _1个}}\big)\geqslant u \right \}={\rm pr}\big(P^{{r} _2}_{\β,\σ_{{r} 2个}}\in\cdot\big),\quad u\geqsland u_{\rm min}\text{.}\结束{方程式}
(6)

模拟|${r}$|-帕累托过程仅对少数风险函数可行,例如|${r} _1个(x) =\|x\|_1$|,但是(6)可用于从另一个过程中获取一个过程的样本:用于独立复制|$x^1,\点,x^N$||P美元^{{r} _1个}_{\β,\σ_{{r} _1个}}$|⁠,|$\{y^n=x^n/u_{\rm分钟}:{r} _2(y^n)\geq斜1 \}$|是来自的样本|P美元^{{r} _2}_{\β,\σ_{{r} _2}}$|⁠.

最后,让我们|$\西格玛{{r}}$|是一个概率测度|$\mathscr{S}^{右}_{\rm ang}$|,并定义流程
\开始{方程式}M(s)=\max_{n\in\mathbb{n}}U^n\frac{Q^n(s)}{{r}(Q^n)},s中的\quad s,\结束{方程式}
(7)
哪里|$\{U^n:n\in\mathbb{n}\}$|是上的泊松过程|$(0,\infty)$|具有强度|$u^{-2}\,{\rmd}}u$||$Q^1,Q^2,\点$|是一个过程的复制|$Q美元$|用概率测度|$\西格玛{r}$|.然后|百万美元$|是具有指数度量的最大稳定过程|$\Lambda_\theta\{A_{rm-max}(x)\}=\Lambda ^1\times\sigma_{r}\{A_{rm-mmax}(x)\}$|,其中|$A_{rm-max}(x)=\{y\in\mathscr{F}:\sup_{s\inS}y(s)/x(s)\geqslate 1\}$|因此,方程式(7)连接|${r}$|-帕累托过程及其最大稳定对应项。

2.4. 与log-Gaussian随机函数相关的极值过程

我们专注于|${r}$|-基于log-Gaussian随机过程的Pareto过程,其最大稳定对应项是Brown–Resnick过程。这个类特别有用,不仅因为它的灵活性,而且因为它是基于广泛应用的高斯模型。(Chiles&Delfiner(1999年第84–108页)回顾这些经典模型。

|$Z$|是具有平稳增量的零米高斯过程,即半变异函数|$\gamma(s,s')={E}[\{Z(s)-Z(s')\}^2]/2$||s中的$(s,s’)$|只取决于差异|$s-s'$|(Chiles&Delfiner,1999年,第30页),并让|$\sigma^2={\rm var}\{Z(s)\}$|.如果|$Z^1、Z^2、\ldot$|是的独立副本|$Z$||$\{U^n:n\in\mathbb{n}\}$|是上的泊松过程|$(0,\infty)$|具有强度|$u^{-2}\,{\rmd}}u$|,独立于|$Z^n$|,然后
\开始{方程式*}M(s)=\max_{n\in\mathbb{n}}U^n\exp\{Z^n(s)-\sigma^2(s)/2\},\quad s在s中,\结束{方程式*}
是一个具有标准Fréchet裕度的稳定Brown–Resnick过程,其分布仅取决于|$\伽马$|(Kabluchko等人,2009年); 这样的过程是最大稳定的。|$\gamma_\θ$|表示其参数的参数化半变异函数|$\θ$|位于紧集|$\Theta$|,并让|$\西格玛^2_\西塔$|表示相应的方差函数。
|$1,\ldot,s_D$|成为感兴趣的地点|$S$|.在论文的其余部分中,|x美元$|将表示一个元素|$\mathbb{R}^D_+$|带组件|$x_d\等于x(s_d)$||$(d=1,\点,d)$|简单Brown–Resnick过程的有限维指数测度|D美元$|变量是
\开始{方程式}\Lambda_\theta\{A_{rm-max}(x)\}={E}\!\左[\max_{d=1,\dots,d}\left\{\frac{Z(s_d)-\sigma^2_{theta}(s.d)/2}{x_d}\right\}\rift]\!,\结束{方程式}
(8)
哪里|$\Lambda_\theta(\cdot)$|是中定义的度量值的有限维投影(). 然后我们可以写(Huser&Davison,2013年)
\开始{方程式}\Lambda_\theta\{A_{rm-max}(x)\}=\sum_{d=1}^d\frac{1}{x_d}\,\Phi\{eta-d(x),R_d},\结束{方程式}
(9)
哪里|$\eta_d(美元)$||美元(D-1)$|-维向量|1美元$|第th个分量|$\eta{d,i}=({\gamma_{d,i}/2})^{1/2}+\log(x_i/x_d)/({2\gamma_}d,i)^{1/2}$|,|$\gamma_{d,i}$|表示|$\gamma(s_d,s_i)$||$(s_d,s_i\,{\in}\,s)$|、和|$\Phi(\cdot,R_d)$|是具有均值零和协方差矩阵的多元正态分布函数|$卢比(_d)$||$(i,j)$|进入|$(\gamma{d,i}+\gamma_{d,j}-\gamma_{i,j})/\{2(\gamma{d,i}\gamma_a{d,j})^{1/2}\}$|,其中|$i,j\in\{1,\ldot,d-1,d+1,\ldots,d\}$|.
这个|${r}$|-与log-Gaussian随机函数相关联的Pareto过程与强度函数密切相关|$\lambda_{\theta}$|与测量值相对应|$\Lambda_\theta$|,可以通过对|$\Lambda_{\theta}(x)$|关于|$x_1,\点,x_D$|,屈服(Engelke等人,2015年)
\开始{方程式}\lambda_{\theta}(x)=\frac{|\Sigma_{\tea}|^{-1/2}}{x_1^2x_2\cdotsx_D(2\pi)^{(D-1)/2}}\,\exp\!\左(-\frac{1}{2}\tilde{x}^{\mathrm{\scriptscriptstyleT}}\Sigma{\theta}^{-1}\tilde{x}\right)\!,\四边形x\in\mathbb{R}^D_+,\结束{方程式}
(10)
哪里|$\波浪线{x}$||$(D-1)$|-带分量的维向量|$\{\log(x_i/x_1)+\gamma_{i,1}:i=2,\点,D\}$||$\Sigma_{\theta}$||$(D-1)\次(D-1$|带元素的矩阵|$\{gamma{i,1}+\gamma{j,1}-\gamma_{i,j},j\{2,\dots,D\}}$|.Wadsworth&Tawn(2014)导出了的另一个对称表达式(10)这在§3.3,但是(10)更容易解释。极值存在类似的表达式-|$t(美元)$|过程(Thibaud和Opitz,2015年).

3.推断|${r}$|-帕累托过程

3.1. 概述

在本节中,|$x^1,\ldot,x^N$||D美元$|-维度的|${r}$|-帕累托随机向量|P美元$|带尾部索引|$\beta=1$|、和|$y^1,\ldot,y^N$|是有规律变化的|D美元$|-维随机向量|Y美元^*$|具有标准化边距。

与单变量设置一样,基于块最大值和最大稳定框架的统计推断通过关注最大值而不是单个事件来丢弃信息。最大值模型很难拟合,不仅因为重复次数少,而且因为可能性通常太复杂,无法在高维中计算(Castruccio等人,2016年). 对于Brown–Resnick过程,无法计算|D美元$|大于约10(Huser&Davison,2013年),特殊情况除外。当最大值的出现时间可用时,推断通常可以达到|D美元\约30$|(Stephenson&Tawn,2005年;Thibaud等人,2016年).

一个有用的替代方法是复合似然推理(Padoan等人,2010年;Varin等人,2011年)基于尺寸小于|$D$|美元它权衡了计算效率的提高和统计效率的损失。可能的子集的数量随着|$D$|美元,并且它们的选择可能很麻烦,尽管可以通过采用更高维的子集来检索一些统计效率。Castruccio等人(2016)发现高阶复合似然比谱估计更稳健,但在实际情况下,这些方法仅限于相当小的维数。

基于阈值超越和Pareto过程的估计具有使用单个事件的优点,似然函数通常更简单,风险函数的选择可以是根据应用定制超越定义的一种方法。方程式(4)建议风险函数的选择不应影响估计,但这并不完全正确,因为阈值不能任意高,所选事件取决于风险函数,选择哪种方法可以检测极端情况下的混合物,并可以通过仅使用与所选极端事件类型最接近的观测值拟合模型来改善亚症状行为。例如,我们可以预计,即使在同一地理区域,强局部降雨事件的极端依赖性也不同于强大规模降雨事件。

Pareto过程的概率密度函数|${r}$|-阈值向量上的超越|$u\in\mathbb{右}_+^D类$|可以通过重新缩放强度函数来找到|$\λ_\θ$|通过|$\Lambda_{\theta}\{A_{r}}(u)\}$|,屈服
\开始{方程式}\lambda{theta,u}^{r}}(x)=\frac{\lambda_\theta(x)}{\lambda_{theta}\{A{r}(u)\}},\quadre x\在A{r{}}中,\结束{方程式}
(11)
哪里
\开始{方程式}\Lambda_{\theta}\{A_{r}}(u)\}=\int_{A{r}(u)}\Lambda_\theta(x)\,{{rmd}}x\结束{方程式}
(12)
|$A_{r}}(u)$|是超标区域|$\{x\in\mathbb{R}^D_+:{R}(x/u)\geqslate 1\}$|.方程式(11)产生对数似然
\开始{方程式}\ell(\theta;x^1,\ldots,x^N)=\sum_{N=1}^{N}{\rm1}\kern-0.24em{\rmI}\!\left\{r}\left(\frac{x^n}{u}\right)\geqslide 1\right\}\log\!\左[\frac{\lambda{\theta}(x^n)}{\lambda{\theta}\{A{r}}(u)\}}\right]\!,\结束{方程式}
(13)
其中向量的除法是按分量进行的,并且|${\rm 1}\kern-0.24em{\rm-I}$|表示指示器功能。最大化|$\ell美元$|给出估计量|$\hat{θ}_{r}}(x^1,\ldots,x^N)$|这在温和条件下是一致的、渐近正态的和有效的。

数值评估|$D美元$|-量纲积分|$\Lambda_{θ}\{A_{r}}(u)\}$|一般来说是难以控制的|$D$|美元尽管它简化了某些风险功能;一个例子是|${r}(x)=\max_d x_d$|,其中积分是多元概率函数的和;参见(9). 同样,|$\Lambda_{\theta}\{A_{r}}(u)\}$|不依赖于|$\θ$|什么时候|${r}(x)=D^{-1}\sum_D x_D$|(科尔斯·唐恩出版社,1991年); 我们将相应版本的(13)谱对数似然及其最大化谱估计量。

实际上,不能假设观测值是精确的帕累托分布;通常更合理的说法是,它们位于某些极值过程的吸引域中。根据的定理3.1de Haan&Resnick(1993),的渐近性质|$\hat{\theta}_{r}}(x^1,\ldots,x^N)$|等待|$\hat{\theta}_{r}}(y^1,\ldots,y^N)$|作为|$N\rightarrow\infty(右箭头)$||$u\rightarrow\infty(右箭头)$|超过的次数|$N_u=o(N)\to\infty$|; 参见§3.3然而,阈值|$u(美元)$|是有限的,因此|A_{r}}(u)中的$y^n\$|可能会导致有偏见的估计。由于模型错误,这种偏差是不可避免的;而且,它会随着|$D$|,因此这些方法可能表现不佳,尤其是在极值相关性较弱的情况下,因为很可能至少有一个|美元^n$|会很小(Engelke等人,2015年;Thibaud和Opitz,2015年;Huser等人,2016年). 可以通过在多元环境中提出的截尾似然来减少偏差Joe等人(1992年)并用于Brown–Resnick模型Wadsworth&Tawn,(2014)对于极值-|$t(美元)$|处理依据Thibaud&Opitz(2015)此方法在实践中效果良好,但通常需要计算多元正态分布和|$t(美元)$|概率,如果使用标准代码,则在实际情况下可能会遇到挑战。§3.2.

对于时空应用,推断|${r}$|-必须使用数千个位置的数据执行Pareto过程3.3我们讨论了一种适用于广泛风险泛函的方法,该方法在有限阈值下计算速度快、统计效率高且鲁棒。

3.2. 高效截尾似然推理

与log-Gaussian随机函数相关的极值过程的截尾似然估计由Wadsworth&Tawn(2014)并且基于(13)带有|$\最大_d\,x_d/u_d$|风险函数和低于阈值向量的任何组件|$(u_1,\点,u_D)>0$|被视为审查。相应的估计器比谱估计器具有更高的方差但更低的偏差。Brown–Resnick过程的截尾似然密度函数为(Asadi等人,2015年)
\开始{align*}&\lambda{theta,u}^{text{cens}}(x)=\frac{1}{\lambda_{theta}\{A{rmmax}(u)}}\frac}{x_1^2x2\cdotsxk}\phi{k-1}(\波浪线{x}_{2:k};\西格玛{2:k})\Phi{D-k}\{\mu{\text{cens}}(x{1:k}\\&x\在A_{rm-max}(u)中,\结束{align*}
哪里|千美元$|组件超过它们的阈值,|$\波浪线{x}_{2:k}$||$\西格玛_{2:k}$|是变量的子集|$\颚化符{x}$||$\西格玛_\θ$|在方程式中(10)、和|$\phi_{k-1}$||$\Phi_{D-k}$|是均值为零的多元高斯密度和分布函数。的参数和协方差矩阵|$\Phi_{D-k}$|
\开始{eqnarray*}\mu_{text{cens}}(x_{1:k})&=&\{log(u_j/x_1)+\gamma_{j,1}\}_{j=k+1,点,D}-\Sigma{(k+1):D,2:k}\Sigma{2:k,2:k{{-1}\波浪线{x}_{2:k}\\\西格玛{\text{cens}}(x{1:k})&=&\Sigma{(k+1):D,(k+1\结束{eqnarray*}
Wadsworth&Tawn(2014)导出了类似的表达式。估计员
\开始{方程式}\帽子{\theta}_{\text{cens}}(y^1,\ldots,y^N)=\mathop{\arg\max}_{theta\in\theta}\sum_{N=1,\dots,N}{\rm1}\kern-0.24em{\rm I}\!\left\{max_d\left(\frac{y^n_d}{u_d}\right)\geqsleat 1\right\}\log\lambda{theta,u}^{text{cens}}(\mathrm{y}^n)\结束{方程式}
(14)
也是一致的和渐近正态的|$u\rightarrow\infty$|,|$N\rightarrow\infty(右箭头)$||$N_u\rightarrow\infty(右箭头)$|具有|$N_u=o(N)$|。对于有限阈值,|$\hat{\theta}_{\text{cens}}$|已经发现,相对于光谱估计器而言,低成分的存在更为稳健(Engelke等人,2015年;Huser等人,2016年),但由于涉及的多元正态积分数量可能很大,因此它很难应用于|30美元以下$|(Wadsworth&Tawn,2014年;Thibaud等人,2016年).
当最大化(14),归一化常数|$\Lambda_{\theta}\{A_{rm-max}(u)\}$|中描述的(8)并且多元正态分布函数需要计算多维积分。第7个定理Geyer(1994)建议我们近似|$\hat{\theta}_{\text{cens}}$|通过最大化
\开始{align*}&\ell^p_{text{cens}}(\theta)\\&\quad=\sum_{n=1}^{n}{\rm1}\kern-0.24em{\rmI}\!\left\{max\!\left(\frac{x^n}{u}\right)\geqslate 1\!\右\}\!\左[\log\!\left\{\frac{\phi{k-1}(\波浪线{x}_{2:k};\西格玛{2:k})}{(x_1^n)^2x^n_2\cdots x^n_k}\right\}+\log\frac{\Phi^p_{D-k}\{\mu_{\text{cens}}(x^n_1:k}\!,\结束{align*}
哪里|$\粉碎{\Phi^p_{D-k}}$||$\粉碎{\Lambda^p_\theta}$|相应积分的蒙特卡罗估计基于|美元$|模拟样本,生成最大化|$\粉碎{\hat{\theta}^p_{\text{cens}}}$|几乎可以肯定的是|$\粉碎{\hat{\theta}_{\text{cens}}}$|作为|$p\rightarrow\infty$|.
多元积分的经典蒙特卡罗估计产生了概率误差界,即|$O(\omega p^{-1/2})$|,其中|$\omega=\omega(\phi)$|是被积函数方差的平方根|$\斐$|.准蒙特卡罗方法可以实现更高的收敛速度,从而提高计算效率,同时保持|$\hat{\theta}^p_{\text{cens}}$|.对于多元正态分布函数的估计,Genz&Bretz(2009年,§4.2.2)提倡使用随机移位的确定性格规则,这可以实现有序收敛速度|$O(p^{-2+\epsilon})$|对一些人来说|$\epsilon>0$|.格规则依赖于超立方体的常规采样|$[0,1]^D$|美元,采取
\开始{方程式*}\马特姆{z} (_q)=\bigh|2\times{\rm frac}({qv'+\Delta})-1\bigh|\四边形(q=1,\点,p),\结束{方程式*}
其中frac(z)表示|$\mathrm{z}\in\mathbb{R}^D$|,|美元$|是超立方体中的质数样本|$[0,1]^D$|,|$v'\in\{1,\dots,p\}^D$|是仔细选择的生成向量,并且|$\增量\英寸[0,1]^D$|是均匀随机移位。已经制定了快速构建规则,以找到最佳的|$v’$|对于给定的尺寸数|D美元$|和样品|美元$|(Nuyens&Cools,2004年). 证明了具有近似最优收敛速度且积分误差与维数无关的生成向量的存在性,并给出了其构造方法(Dick&Pillichshammer,2010年).

我们对该方法的实施适用于(14)再加上并行计算|D美元$|大约几百人;请参阅补充材料了解详细信息。我们的算法可以扩展到极值-|$t(美元)$|通过编写多元数据建立模型|$t(美元)$|多元正态分布函数的概率;看见Genz&Bretz(2009)了解更多详细信息。

3.3. 分数匹配

经典似然推断需要评估或简化标度常数|$\Lambda_{\theta}\{A_{r}}(u)\}$|,其复杂性随着维数的增加而增加。因此,我们寻求不需要计算的替代方案。

|$\mathscr{A}$|是一个示例空间,例如|$\mathbb美元{右}_+^D美元|,|$\mathscr{P}$|上的一类凸概率测度|$\mathscr{A}$|、和|X美元$|具有分布的随机变量|$F\in\mathscr{A}$|.正确的评分规则(Gneiting&Raftery,2007年)是功能性的|$\增量:\mathscr{P}\times\mathscr{A}\rightarrow\mathbb{R}$|这样的话
\开始{方程式*}\增量(G,F)={E} X(_X)\{\delta(G,X)\}-{E} X(_X)\{\delta(F,X)\}\geq斜面0,\quad G\in\mathscr{P}\text{.}\结束{方程式*}

如果|$\增量_\增量(G,F)=0$|当且仅当|$G=F$|,在这个假设下|$\增量_\增量$|在上定义发散度量|$\mathscr{P}$|(Thorarinsdottir等人,2013年).

|美元\ delta$|表示严格正确的评分规则,让|$\{F_\theta:\theta\in\theta\}\subset\mathscr{A}$|是分布的参数族,并且让|$X^1,\点,X^N$|独立观察|$F_{\theta_0}$|.散度的第一项|$\Delta_\Delta(F_\theta,{F_{\theta_0}})$|可以通过以下方式进行估算
$$\δ(θ)=\frac{1}{N}\sum_{i=1}^{N}\delta(F_\theta,X^i),$$
其最小化定义了|$\theta_0(美元)$|在适当的规则条件下(Dawid等人,2016,定理4.1)。因此,对于风险函数|${r}$|,估计器
\开始{方程式*}\帽子{theta}_{delta,u}^{r}(X^1,\ldots,X^N)=\mathop{\arg\min}_{theta\in\theta}\sum_{N=1}^N{\rm1}\kern-0.24em{\rmI}\!\left\{r}\left(\frac{X^n}{u}\right)>1\right\}\delta\!\左(\lambda_{theta,u}^{r}},\frac{X^n}{u}\right)\结束{方程式*}
也是一致的和渐近正态的。由于de Haan和Resnick(1993年,命题3.1和3.2),这些渐近性质可以推广到具有规范化边缘的正则变化随机向量的样本;请参阅补充材料作为证据。
 
提议1。
|$Y^1,\ldot,Y^N$|是规则变化随机向量的独立复制|Y美元^*$|具有归一化边缘和极限测度|$\Lambda_{\theta_0}$|,并让|美元\ delta$|是满足定理4.1条件的严格适当的评分规则Dawid等人(2016).如果|$N\rightarrow\infty(右箭头)$||$N_u\rightarrow\infty(右箭头)$|以这样的方式|$N_u/N\右箭头0$|作为|$N\rightarrow\infty$|,然后
$${N_u}^{1/2}\big\{\hat{\theta}_{\delta,N/N_u{r}(Y^1,\ldots,Y^N)-\theta_0\big\}\rightarrow{\cal N}\big \{0,K^{-1}焦耳(K^{-1})^{{mathrm{\scriptstyleT}}}\big\}$$
分布中,其中
\开始{方程式*}{J={E}\!\左{\frac{\partial\delta(\theta)}{\partic\theta}\frac}\partial/delta(\T)}{\ partial\theta^{\mathrm{\scriptstyle T}}}\right\}\bigg|_{\theta=\theta_0},\quadK={E}\!\left{\frac{\partial ^2}delta(θ)}{\partialθ\partialθ^{\mathrm{\scriptscriptstyle T}}}}}\right\}\bigg|_{\ttheta=\ttheta_0}\text{.}}\结束{方程式*}
Godambe信息矩阵的估计|${KJ^{-1}K}$|可用于推理,以及评分规则比率统计
$$W^\delta=2\left\{\frac{\partial\delta(\theta_0)}{\partical\theta}-\frac}\partial/delta(\hat{\theta}_{\delta,N/N_u}^{r})}{\partital\theta}\right\}\!,$$
正确校准,可用于比较嵌套模型(Dawid等人,2016年, §4.1).
对数似然是与Kullback–Leibler分歧相关的适当得分规则。虽然有效,但它并不稳健,这对于拟合渐近模型(如Pareto过程)和规范化系数的闭合形式来说是有问题的|$\Lambda_{\theta}\{A_{r}}(u)\}$|定义于(12)仅在特殊情况下可用。梯度计分规则(海瓦里宁,2005年)仅使用导数|$\nabla_{x}\log\lambda_{theta,u}^{r}}$|因此不需要计算|$\Lambda_{\theta}\{A_{r}}(u)\}$|.海瓦里宁(2007)将此评分规则应用于严格的正变量,我们建议将其扩展到形式的任何域|$A_{r}}(u)=\{x\in\mathbb{右}_+^D:{r}(x/u)\geqsleat1\}$|,使用散度度量
\开始{方程式}\Delta_{rm grad}(θ,θ_0)=\int_{A_{r}}(u)}\big\|\nabla_{x}\log\lambda_\theta(x)\otimes{w}(x)-\nabla _{x{log\lampda_{theta_0},\结束{方程式}
(15)
哪里|$\lambda_{\theta}$|对所有人都是可区分的|$\theta\in\theta$||$A_{r}}(u)\setminus\部分A_{r}},使用|$\部分A$|表示…的边界|$A$|,|$\nabla_x(美元)$|是梯度操作符,|${w}:A_{r}}(u)\rightarrow\mathbb{右}_+^D类$|是一个正权重函数,并且|$\音符$|表示哈达玛产品。如果|${w}$|在上可区分|$A_{r}}(u)$|并满足补充材料,然后是评分规则
\开始{方程式*}\三角{{w}}({\lambda_\theta},x)=\sum{d=1}^d\左(2w_d(x)\frac{\partial w_d c{1}{2}\left\{\frac{\partial\log{\lambda_\theta}(x)}{\paratilx_d}\right\}^2\right]\right)\结束{方程式*}
对于|A_{r}}(u)中的$x\$|完全正确。log-Gaussian Pareto过程的梯度得分满足中定理4.1的正则性条件Dawid等人(2016),因此得到的估计值|$\hat{\theta}_w$|是渐近正常的。
对于Brown–Resnick模型,两个可能的权重函数是
\开始{align}\开始{split}w^1_d(x)&=x_d\大[1-\exp\{1-{r}(x/u)\}\大]\四元(d=1,\ldot,d)\\w^2_d(x)&=大[1-\exp\{-3(x_d-u_d)/u_d\}\big]\big[1-\exp\{1-{r}(x/u)\}\大]\quad(d=1,\ldots,d),\结束{拆分}\结束{对齐}
(16)
哪里|${r}$|风险函数在|$\mathbb美元{右}_+^D类$|和阈值向量|$u(美元)$|位于|$\mathbb{R}^D_+$|.重量|${w}^1$|派生自Hyvärinen(2007年),而|${w}^2$|旨在通过降低以下分量的权重来近似审查的效果|$x^n美元$|近的|$u$|这些加权函数非常适合于极值:向量|$x\在A_{{r}}(u)中$|如果|${r}(x/u)$|接近|$1$|⁠和的低组件|x美元$|诱导相关偏导数的低权重。出于这些原因,使用|$\增量{w}$|加权函数在(16)对于低成分,应比光谱估计器更稳健。估计员|$\hat\theta_w$|计算成本比|$\hat\theta_{\text{cens}}$|并且可以针对任何可微的风险函数|$\mathbb美元{右}_+^D$|美元Brown–Resnick模型的梯度分数表达式可以在补充材料,这些推理程序的性能在§4.

梯度得分可以应用于任何具有多元密度函数的极值模型,该函数的对数在远离其支持边界的地方是两倍可微的,如果在该支持上存在不连续性,则可以使用精心选择的加权函数|${w}$|确保分数的存在和一致性。实际上,可以为极值导出类似的表达式-|$t(美元)$|模型,尽管权重函数的选择更加受限:|$w^2美元$|满足边界条件,但|$w^1$|无法确保分数正确。

4.仿真研究

4.1. 精确模拟

本文描述的推理程序和模拟算法包含在R包mvPot中(2017年音乐节;R开发核心团队,2018年).

我们首先通过仿真来说明高维推理的可行性|${r}$|-与对数正态随机函数相关的Pareto过程|$D美元$|中的位置|$S=[0100]^2$|。有关算法的详细信息,请参阅补充材料.

我们使用各向同性幂半变异函数,|$\gamma(s,s')=(\|s-s'\|/\tau)^\kappa/2$|,形状参数|$\kappa=0{\cdot}5,1,1{\cdot}3,{1{\cdote}8}$|、和比例参数|$\tau=2{\cdot}5$|,选择的依赖模型定义于|美元$|覆盖强到弱的极值依赖。对于此模拟,依赖模型|$\kappa=1{\cdot}8$|要求我们使用对数刻度,以避免舍入错误。对于每个模拟,|N=10000美元$||${r}$|-}Pareto过程,具有|${r}(x)=D^{-1}\sum_D x_D$|,定期模拟|$10\乘以10$|,|20美元\乘以10$||20美元\乘以15$|网格。网格大小限制在最多300个位置,以便与第二次模拟研究进行比较。对于梯度分数,我们使用|${r}(x)=D^{-1}\sum_D x(s_D)$|.阈值向量的组件|$u(美元)$|设置为等于经验值|$0{\cdot}99$|分位数|${r}(x^1),\ldot,{r}(x^N)$|,给予|$N_u=100美元|。对于删失似然推理,我们使用补充材料具有|$\bar{p}=10$|和阈值|$u(美元)$|等于经验值|0{\cdot}99美元$|分位数|$\max_dx^1_d,\ldot,\max_dx ^N_d$|,因此(6)都很满意。每种情况下使用100个重复。

表1显示基于截尾对数似然和带权重的梯度得分的估计的相对均方根误差|$w^1$||$w^2$|,与基于谱估计的结果相比。对于所有方法和参数组合,偏差可以忽略不计,性能主要由方差驱动。正如预期的那样,效率低于100%,因为在从真实模型进行模拟和拟合时,谱估计器表现最佳。梯度得分和截尾似然估计随着极值相关性的减弱和模拟向量中低分量的数量的增加而恶化。梯度得分优于删失似然,除非删失很低,即|$\kappa=0{\cdot}5$|.删失似然估计的性能随着|D美元$|增加,表明梯度分数在高维度中更可取。然而,这些结果并不真实,因为数据是从拟合的模型中模拟出来的,而实际上,该模型被用作数据分布的高阈值近似值。

表1。

相对均方根误差|$(\%)$|用于比较基于截尾对数似然、左和带权重的梯度得分的估计|$w^1$|、中间和|$w^2$|,右,相对于谱估计,对于参数|$\卡帕$||$\tau=2{\cdot}5$|.效率|$100\%$|将对应于谱估计,而较小的值对应于效率较低的估计。使用顶部进行推断|$1\%$|属于|$10\,000$|具有半变异函数的Pareto过程|$\gamma(s,s')=(\|s-s'\|/\tau)^\kappa/2$|定期模拟|$10\乘以10$|,|20美元\乘以10$||20美元\乘以15$|栅格

形状|$\卡帕$|
网格大小|$\kappa=0{\cdot}5$||$\kappa=1$||$\kappa=1{\cdot}3$||$\kappa=1{\cdot}8$|
|10美元\乘以10$||${53}/46/44$||$10/{32}/33$||$4{\cdot}7/{39}/39$||$1{\cdot}0/{51}/52美元$|
|20美元\乘以10$||${67}/51/52$||$10/{25}/24$||$5{\cdot}4/{34}/35$||$1{\cdot}0/{54}/55美元$|
|20美元\乘以15$||${67}/47/47$||$11/{30}/31$||$4{\cdot}1/{25}/25$||$1{\cdot}4/{49}/49美元$|
比例|美元\套$|
网格大小|$\kappa=0{\cdot}5$||$\kappa=1$||$\kappa=1{\cdot}3$||$\kappa=1{\cdot}8$|
|10美元\乘以10$||$52/{58}/57$||$19/{60}/59$||$10/{63}/66$||$1{\cdot}7/{53}/53美元$|
|20美元\乘以10$||41美元/{80}/79$||$17/{70}/70$||$9{\cdot}2/{71}/70$||3美元{\cdot}3/{52}/51$|
|20美元\乘以15$||38美元/{68}/69$||$17/{82}/81$||$7{\cdot}1/{62}/61$||$3{\cdot}9/{51}/52$|
形状|$\卡帕$|
网格大小|$\kappa=0{\cdot}5$||$\kappa=1$||$\kappa=1{\cdot}3$||$\kappa=1{\cdot}8$|
|10美元\乘以10$||${53}/46/44$||$10/{32}/33$||$4{\cdot}7/{39}/39$||$1{\cdot}0/{51}/52美元$|
|20美元\乘以10$||${67}/51/52$||$10/{25}/24$||$5{\cdot}4/{34}/35$||$1{\cdot}0/{54}/55美元$|
|20美元\乘以15$||${67}/47/47$||$11/{30}/31$||$4{\cdot}1/{25}/25$||$1{\cdot}4/{49}/49美元$|
比例|美元\套$|
网格大小|$\kappa=0{\cdot}5$||$\kappa=1$||$\kappa=1{\cdot}3$||$\kappa=1{\cdot}8$|
|10美元\乘以10$||$52/{58}/57$||19美元/{60}/59$||$10/{63}/66$||$1{\cdot}7/{53}/53美元$|
|20美元\乘以10$||$41/{80}/79$||17美元/{70}/70$||$9{\cdot}2/{71}/70$||$3{\cdot}3/{52}/51$|
|20美元\乘以15$||$38/{68}/69$||$17/{82}/81$||$7{\cdot}1/{62}/61$||$3{\cdot}9/{51}/52$|
表1。

相对均方根误差|$(\%)$|用于比较基于截尾对数似然、左和带权重的梯度得分的估计|$w^1$|、中间和|$w^2$|,右,相对于谱估计,对于参数|$\卡帕$||$\tau=2{\cdot}5$|.效率|$100\%$|将对应于谱估计,而较小的值对应于效率较低的估计。使用顶部进行推断|$1\%$|属于|$10\,000$|具有半变异函数的Pareto过程|$\gamma(s,s')=(\|s-s'\|/\tau)^\kappa/2$|定期模拟|$10\乘以10$|,|20美元\乘以10$||20美元\乘以15$|栅格

形状|$\卡帕$|
网格大小|$\kappa=0{\cdot}5$||$\kappa=1$||$\ kappa=1{\cdot}3$||$\kappa=1{\cdot}8$|
|10美元\乘以10$||{53}/46/44美元$||$10/{32}/33$||4美元{\cdot}7/{39}/39$||$1{\cdot}0/{51}/52美元$|
|20美元\乘以10$||${67}/51/52$||$10/{25}/24$||$5{\cdot}4/{34}/35$||$1{\cdot}0/{54}/55美元$|
|20美元\乘以15$||${67}/47/47$||$11/{30}/31$||$4{\cdot}1/{25}/25$||$1{\cdot}4/{49}/49美元$|
比例|美元\套$|
网格大小|$\kappa=0{\cdot}5$||$\kappa=1$||$\kappa=1{\cdot}3$||$\kappa=1{\cdot}8$|
|10美元\乘以10$||$52/{58}/57$||$19/{60}/59$||$10/{63}/66$||$1{\cdot}7/{53}/53美元$|
|20美元\乘以10$||$41/{80}/79$||$17/{70}/70$||$9{\cdot}2/{71}/70$||$3{\cdot}3/{52}/51$|
|20美元\乘以15$||$38/{68}/69$||$17/{82}/81$||$7{\cdot}1/{62}/61$||$3{\cdot}9/{51}/52$|
形状|$\卡帕$|
网格大小|$\kappa=0{\cdot}5$||$\κ=1$||$\kappa=1{\cdot}3$||$\ kappa=1{\cdot}8$|
|10美元\乘以10$||${53}/46/44$||$10/{32}/33$||$4{\cdot}7/{39}/39$||$1{\cdot}0/{51}/52美元$|
|20美元\乘以10$||${67}/51/52$||$10/{25}/24$||$5{\cdot}4/{34}/35$||$1{\cdot}0/{54}/55美元$|
|20美元\乘以15$||${67}/47/47$||$11/{30}/31$||$4{\cdot}1/{25}/25$||$1{\cdot}4/{49}/49美元$|
比例|$\tau美元$|
网格大小|$\kappa=0{\cdot}5$||$\kappa=1$||$\kappa=1{\cdot}3$||$\kappa=1{\cdot}8$|
|10美元\乘以10$||$52/{58}/57$||$19/{60}/59$||$10/{63}/66$||$1{\cdot}7/{53}/53美元$|
|20美元\乘以10$||$41/{80}/79$||$17/{70}/70$||$9{\cdot}2/{71}/70$||$3{\cdot}3/{52}/51$|
|20美元\乘以15$||38美元/{68}/69$||$17/{82}/81$||$7{\cdot}1/{62}/61$||3美元{\cdot}9/{51}/52$|

即使对于最精细的网格,基于谱密度和梯度得分函数的似然优化也只需十几秒。每个优化都使用相同的随机起点,以确保公平比较。使用截尾方法进行估计需要几分钟时间,并且随着维数的增加而大大减慢;请参阅补充材料.

4.2. 吸引力领域

由于在实践中从未达到渐近状态,我们现在比较不同推理程序对有限阈值的鲁棒性。Brown–Resnick过程属于它自己的最大吸引域,因此它的峰阈值分布收敛于具有log-Gaussian随机函数的广义Pareto过程。我们重复§4.1具有|$10\,000$|Brown–Resnick过程和相同的参数值。此模拟使用以下算法Dombry等人(2016)而且计算量很大,所以我们只使用了300个变量。使用16个岩芯大约需要三个小时才能生成|N=10000美元$|最好的网格上的样本。

表2显示了结果。正如预期的那样,当模型指定错误时,相对均方根误差主要由偏差驱动,偏差随形状增加而增加|$\卡帕$|和尺寸|$D$|美元谱估计总体上优于其他两种方法。对于|$\kappa=0{\cdot}5$|三种方法的总体性能相当相似,截尾似然法在捕捉形状参数方面更好,而梯度分数在尺度参数方面更好。中度极端依赖案例|$\kappa=1$||$1{\cdot}3$|,由截尾似然支配,而对于弱极值依赖,|$\kappa=1{\cdot}8$|对于100点网格,当极值相关性太弱时,优化过程不会收敛。权重函数的选择|$w美元$|影响梯度分数的稳健性。计算时间与§4.1.

表2。

作为表1但基于顶层推理|$1\%$|属于|$10\,000$|模拟Brown–Resnick过程

形状|$\卡帕$|
网格大小|$\kappa=0{\cdot}5$||$\κ=1$||$\kappa=1{\cdot}3$||$\ kappa=1{\cdot}8$|
|10美元\乘以10$||${154}/111/81$||${473}/183/108$||${196}/170/105$|数控
|20美元\乘以10$||${172}/122/95$||${413}/150/114$||${309}/181/137$||144美元/{168}/122$|
|20美元\乘以15$||${142}/119/99$||${369}/133/110$||${314}/170/140$||$163/{173}/137$|
比例|美元\套$|
网格大小|$\kappa=0{\cdot}5$||$\kappa=1$||$\kappa=1{\cdot}3$||$\kappa=1{\cdot}8$|
|10美元\乘以10$||$107/{127}/116$||${263}/38/35$||$109/231/{452}$|数控
|20美元\乘以10$||$105/{133}/119$||${206}/94/80$||${315}/66/53$||105美元/{336}/261$|
|20美元\乘以15$||$104/{138}/126$||${173}/102/90$||{290}美元/92/46$||$103/{211}/144$|
形状|$\卡帕$|
网格大小|$\kappa=0{\cdot}5$||$\κ=1$||$\kappa=1{\cdot}3$||$\kappa=1{\cdot}8$|
|10美元\乘以10$||${154}/111/81$||${473}/183/108$||${196}/170/105$|数控
|20美元\乘以10$||${172}/122/95$||${413}/150/114$||${309}/181/137$||$144/{168}/122$|
|20美元\乘以15$||${142}/119/99$||${369}/133/110$||${314}/170/140$||$163/{173}/137$|
比例|美元\套$|
网格大小|$\kappa=0{\cdot}5$||$\kappa=1$||$\kappa=1{\cdot}3$||$\kappa=1{\cdot}8$|
|10美元\乘以10$||$107/{127}/116$||${263}/38/35$||$109/231/{452}$|数控
|20美元\乘以10$||$105/{133}/119$||${206}/94/80$||${315}/66/53$||$105/{336}/261$|
|20美元\乘以15$||104美元/{138}/126$||${173}/102/90$||${290}/92/46$||103美元/{211}/144$|

NC,优化不收敛。

表2。

作为表1但基于顶部的推断|$1\%$|属于|$10\,000$|模拟Brown–Resnick过程

形状|$\卡帕$|
网格大小|$\kappa=0{\cdot}5$||$\kappa=1$||$\kappa=1{\cdot}3$||$\kappa=1{\cdot}8$|
|10美元\乘以10$||${154}/111/81$||${473}/183/108$||${196}/170/105$|数控
|20美元\乘以10$||${172}/122/95$||${413}/150/114$||${309}/181/137$||$144/{168}/122$|
|20美元\乘以15$||${142}/119/99$||${369}/133/110$||${314}/170/140$||$163/{173}/137$|
比例|美元\套$|
网格大小|$\kappa=0{\cdot}5$||$\kappa=1$||$\kappa=1{\cdot}3$||$\kappa=1{\cdot}8$|
|10美元\乘以10$||$107/{127}/116$||${263}/38/35$||109/231/{452}美元$|数控
|20美元\乘以10$||$105/{133}/119$||{206}/94/80美元$||${315}/66/53$||105美元/{336}/261$|
|20美元\乘以15$||$104/{138}/126$||${173}/102/90$||${290}/92/46$||$103/{211}/144$|
形状|$\卡帕$|
网格大小|$\kappa=0{\cdot}5$||$\kappa=1$||$\kappa=1{\cdot}3$||$\kappa=1{\cdot}8$|
|10美元\乘以10$||${154}/111/81$||${473}/183/108$||${196}/170/105$|数控
|20美元\乘以10$||${172}/122/95$||${413}/150/114$||${309}/181/137$||$144/{168}/122$|
|20美元\乘以15$||${142}/119/99$||${369}/133/110$||${314}/170/140$||$163/{173}/137$|
比例|美元\套$|
网格大小|$\kappa=0{\cdot}5$||$\kappa=1$||$\kappa=1{\cdot}3$||$\kappa=1{\cdot}8$|
|10美元\乘以10$||107美元/{127}/116$||${263}/38/35$||$109/231/{452}$|数控
|20美元\乘以10$||$105/{133}/119$||{206}/94/80美元$||${315}/66/53$||$105/{336}/261$|
|20美元\乘以15$||$104/{138}/126$||${173}/102/90$||${290}/92/46$||$103/{211}/144$|

NC,优化不收敛。

分位数图表明,记分匹配估计量非常接近正态分布,但由于拟蒙特卡罗近似,截尾似然估计可能会偏离正态分布;可以通过增加|$p$|.

总结一下:对于强极值相关性,这三种类型的估计量大致相等。对于中度极值相关性,如果变量数量允许,我们建议使用截尾似然;这是|500美元以下$|利用我们的计算能力,虽然如果在很远的距离上达到了极值独立性并且网格很密集,但梯度分数是一个很好的替代品。由于其鲁棒性和缺乏维数限制,梯度分数似乎是网格应用的最佳选择,具有很高的分辨率。实证研究表明,可以通过仔细设计权重函数来对其进行稳健性验证。

5.佛罗里达州极端降雨量

5.1. 实时数据应用程序

我们适合|${r}$|-基于Brown–Resnick模型的Pareto过程,用于雷达测量1999年至2004年雨季(6月至9月)每15分钟在120 km的常规2 km网格上采集的降雨量|$\,\次\$|佛罗里达州东部120公里地区;看见图1每个雷达图像中有3600个空间观测值,总共有70272个图像。选择该区域重复应用Buhl&Klüppelberg(2016),但仅在空间设置中;时空模型超出了本文的范围。Buhl&Klüppelberg(2016)分析10 km的日最大值|$\,\次\$|10km平方,但我们使用非聚合数据来拟合空间极值依赖性的不可分离参数模型,使用单个极值事件而不是每日最大值。

风险功能的观测(第一排)和模拟(第二排)15分钟累积降雨量(英寸)${右}_{\mathrm{sum}}$和${右}_{\text{max}}$,强度相当于第59次最强事件。
图1。

风险功能的观测(第一排)和模拟(第二排)15分钟累积降雨量(英寸)|${右}_{\mathrm{sum}}$||${右}_{\text{max}}$|强度相当于第59次最激烈的比赛。

首先使用经验分布函数将每个网格单元的边缘分布局部转换为单位Pareto。对于一般应用,如果我们希望外推观测强度以上的分布,则需要一个超越的边际分布模型,但由于我们的目标是说明在密集网格上进行依赖模型估计的可行性,因此我们认为边际建模超出了本研究的范围。

5.2. 多元极值依赖模型

的空间模型Buhl&Klüppelberg(2016)是完全可分离的,也就是说,它是两个独立的半变异函数的和。这样做的优点是可以分别对每个方向进行推断,但无法捕获不遵循网格轴的各向异性,即不在南北或东西方向。此外,他们的成对似然方法侧重于短距离对,因此可能会错误估计长距离的依赖性。为了更好地捕捉可能的各向异性,我们使用不可分离的半变异函数
\开始{方程式*}\伽玛(s_i,s_j)=\left\|\frac{\Omega(s_i-s_j,\结束{方程式*}
和各向异性矩阵
\开始{方程式*}\欧米茄=\左[\begin{array}{cc}\cos\eta\;&\;-\sin\eta\\a\sin\eta\;&\;a\cos\eta\end{arrary}\right]\!,\左(-\frac{\pi}{{4}},\frac}{4}{right]\!,\quada>{0}\text{.}\结束{方程式*}

半变异函数|$\伽马$|当站点之间的距离趋于无穷大时,即两两极值指数增加到|$2$|作为|$\|s-s'\|\rightarrow\infty$|.

为了应用峰值-阈值方法,我们必须通过选择风险泛函来定义超越。我们关注两种极端情况:该地区任何一点的局部强降雨和整个地区的高累积降雨量。因此,我们承担风险
$${右}_{max}(X^\ast)=\left\{sum_{d=1}^{3600}X^\asp(s_d)^{20}\right\}^{1/20},\quad{r}_{\mathrm{sum}}(X^\ast)=\left\{\sum_{d=1}^{3600}X^\asp(s_d)^{\xi_0}\right\}^{1/\xi_0{\text{.}$$

功能|${右}_{\text{max}}$|是对的可微近似|$\max_d X(s_d)$|,由于其不可微性,无法与梯度分数一起使用。在如此多的地点,经过审查的可能性在计算上是遥不可及的。直接求和归一化观测值|X美元^*$|没有物理意义,所以我们的功能|${右}_{\mathrm{sum}}$|选择空间范围较大的极端事件,尝试将数据转换回原始尺度;我们接受|$\xi_0=0{\cdot}114$|,这是广义Pareto分布的独立局部估计的平均值。

我们将一元广义Pareto分布拟合到|${右}_{\mathrm{sum}}(x_n^\ast)$||${右}_{\max}(x_n^\ast)$|(⁠|$n=1,\点,70\,272$|)随着阈值的增加。估计的形状参数在|99美元{\cdot}9$|百分位数,用于事件选择,给出59个超标;只有两个事件被发现相对于这两个风险功能而言是极端的。这个阈值可能看起来相当高,但每年大约有10起事件发生,从时间框架来看,这似乎是合理的。这里我们仅仅说明了高维推理的可行性,因此我们将其视为独立的,但实际上应该考虑时间去簇。

使用优化梯度分数|${w}^1$|根据初始点的不同,16核集群上的加权函数需要1-6个小时。由于存在局部极大值的可能性,必须考虑不同的初始点。结果如所示表3,其中标准偏差是使用带有20个块的顶刀程序获得的。估计偏差和方差都很低。对于|${右}_{\mathrm{sum}}(x_n^\ast)$|,我们得到了一个类似于Buhl&Klüppelberg(2016).

表3。

参数估计值(括号中有标准误差)|${r}$|-基于半变异函数的log-Gaussian随机函数的Pareto过程|$\gamma(s,s')=\{\|\Omega(s-s')\|/\tau\}^\kappa$|通过最大化与|$59$|风险泛函的最高超越|${右}_{\mathrm{sum}}$||${右}_{\最大}$|佛罗里达雷达雨量数据

风险职能|$\卡帕$||美元\套$||美元\eta$||美元$|
|${右}_{\mathrm{sum}}$||$0{\cdot}814(0{\cdot}036)$||25美元63(4美元70)$||$-0{\cdot}009(0{\cdot}458)$||$1{\cdot}059(0{\cdot}031)$|
|${右}_{\最大}$||$0{\cdot}955(0{\cdot}048)$||$3{\cdot}540(0{\cdot}67)$||$-0{\cdot}316(0{\cdot}410)$||$0{\cdot}940(0{\cdot}029)$|
风险职能部门|$\卡帕$||美元\套$||美元\eta$||美元$|
|${右}_{\mathrm{sum}}$||$0{\cdot}814(0{\cdot}036)$||25美元63(4美元70)$||$-0{\cdot}009(0{\cdot}458)$||$1{\cdot}059(0{\cdot}031)$|
|${右}_{\最大}$||$0{\cdot}955(0{\cdot}048)$||$3{\cdot}540(0{\cdot}67)$||$-0{\cdot}316(0{\cdot}410)$||$0{\cdot}940(0{\cdot}029)$|
表3。

参数估计值(括号中有标准误差)|${r}$|-基于半变异函数的log-Gaussian随机函数的Pareto过程|$\gamma(s,s')=\{\|\Omega(s-s')\|/\tau\}^\kappa$|通过最大化与|$59$|风险泛函的最高超越|${右}_{\mathrm{sum}}$||${右}_{\最大}$|佛罗里达雷达雨量数据

风险职能部门|$\卡帕$||美元\套$||$\埃塔$||美元$|
|${右}_{\mathrm{sum}}$||$0{\cdot}814(0{\cdot}036)$||25美元63(4美元70)$||$-0{\cdot}009(0{\cdot}458)$||$1{\cdot}059(0{\cdot}031)$|
|${右}_{\最大}$||$0{\cdot}955(0{\cdot}048)$||$3{\cdot}540(0{\cdot}67)$||$-0{\cdot}316(0{\cdot}410)$||$0{\cdot}940(0{\cdot}029)$|
风险职能|$\卡帕$||$\tau美元$||美元\eta$||美元$|
|${右}_{\mathrm{sum}}$||$0{\cdot}814(0{\cdot}036)$||25美元63(4美元70)$||$-0{\cdot}009(0{\cdot}458)$||1{\cdot}059美元(0{\cdot}031美元)$|
|${右}_{\最大}$||0{\cdot}955美元(0{\cdot}048美元)$||$3{\cdot}540(0{\cdot}67)$||$-0{\cdot}316(0{\cdot}410)$||$0{\cdot}940(0{\cdot}029)$|

两种风险泛函的估计参数明显不同,表明存在不同类型的极端事件的混合物。的结构|${r}_{\最大}$|与数据库一致,其中最激烈的事件往往在空间上集中。我们的模型表明,与Buhl&Klüppelberg(2016)但他们确实注意到,他们的模型低估了依赖性,尤其是对于高分位数。估计的平滑度参数非常接近|美元\eta$|与零显著不同,这是由Buhl&Klüppelberg(2016)。对于|${右}_{\mathrm{sum}}$|估计参数即使在长距离上也表现出很强的极值依赖性,对应于大空间覆盖下的累积降雨量超标。作为|大约1$|,没有各向异性的证据。

5.3。模型检查和仿真

对于模型检查,我们建议使用条件超越概率,
\开始{方程式*}\pi_{ij}={rm pr}\big[X^\ast(s_j)\geqsland u'\;\big|\;\{X^\last(s_i)\geq sland u'\}\cap\{r}(X^\ast/u)\gequsleat1\}\big]=2\left[1-\Phi\!\left\{left({frac{\gamma_{ij}{2}\right)^1/2}\reght\}\right]\!,\结束{方程式*}
哪里|$\gamma_{i,j}$|是站点的半变异函数|$s_i$||s_j美元$|(⁠|$i、 j=1,\点,3600$|),定义见(9)、和|$u'>0$|.的经验估计值|$\pi_{ij}$|
\开始{方程式*}\帽子{\pi}_{ij}=\frac{\sum_{n=1}^n{\rm1}\kern-0.24em{\rmI}\big[\left\{r}({x^{astn}}/{u})\geqslide 1\right\}\cap\{x^}\astn}_I\geqsplate u'\}\cap\{x_{astn{j\geqspelate u'\}n{\rm1}\kern-0.24em{\rm I}\big[\{r}({x^{astn}}/{u})\geqslate 1\}\cap\{x^}\astn}_I\geqtilate u'\}\big]}\!,\结束{方程式*}
其渐近行为来源于Davis和Mikosch(2009)。对于这两种风险函数,拟合模型由中的实心黑线表示图2,很好地遵循了估计的条件超越概率云,并捕获了总体趋势,但未能表示某些局部变化,可能是由于功率模型缺乏灵活性。
风险泛函(a)的估计条件超越概率$\pi_{ij}$${右}_{\mathrm{sum}}$和(b)${r}_{\text{max}}$是位置$s_i$和$s_j$($i,j=1,\dots,3600$)之间距离的函数。在每个面板中,实心黑色曲线表示使用梯度得分估计拟合的模型。
图2。

估计的条件超越概率|$\pi_{ij}$|风险职能人员(a)|${右}_{\mathrm{sum}}$|和(b)|${右}_{\text{max}}$|作为位置之间距离的函数|$s_i$||s_j美元$|(⁠|$i、 j=1,\点,3600$|). 在每个面板中,实心黑色曲线表示使用梯度得分估计拟合的模型。

最后,我们使用§5.2模拟强度相当于风险泛函发现的59个事件中最弱的事件。通过生成相应的|${r}$|-具有拟合依赖结构的帕累托过程,如§4.1.图1比较了数据库中的观测值和代表性模拟,这些模拟似乎成功地再现了所选观测值的空间相关性和强度。进一步的研究表明,在这两种情况下,模型都会产生过平滑的降雨场。这可以通过使用风险功能改进事件选择来解决|${r}$|具有特殊空间结构或物理过程特征的。尽管我们无法检测到各向异性,但更复杂的相关性模型可能值得考虑,因为这些模型允许空间模式的随机性。

这些模型可以重现空间累积和局部暴雨的空间模式和极端强度。在这两种情况下,拟合的相关性模型都提供了合理的拟合,模拟结果似乎与观察结果大体一致。然而,两种对比依赖结构的存在突显了极端降雨的复杂性,并表明可以考虑依赖性和裕度的混合模型。边缘参数和相关性参数通常是单独估计的,但由于存在可以使用不同风险泛函检测到的混合物,因此需要进行联合估计,这超出了本文的范围。因此,由于我们忽略了时间相关性,我们的模型应该被视为朝着时空降雨发生器迈出的第一步。

确认

我们感谢瑞士国家科学基金会的财政支持,感谢塞巴斯蒂安·恩格尔克(Sebastian Engelke)的有益评论,感谢评论员的建设性评论。Chin Man Mok善意地提供了数据,这些数据由佛罗里达州西南部水管理区提供。

补充材料

补充材料可在获取生物特征在线包括对计算考虑因素的讨论、运行模拟的代码、梯度评分规则的细节、命题1的证明以及进一步的数值结果。

工具书类

阿萨迪,
第页。
,
戴维森,
A.控制。
&
恩格尔克,
美国。
(
2015
).
河网上的极值。
附录申请。统计师。
9
,
2023
50
.

布尔,
美国。
&
克鲁珀伯格,
C、。
(
2016
).
各向异性Brown–Resnick时空过程:估计和模型评估。
极端
19
,
627
60
.

卡斯特鲁西奥,
美国。
,
胡塞尔,
R。
&
杰顿,
M.G.公司。
(
2016
).
最大稳定分布和过程的高阶复合似然推断。
J.公司。图表。统计师。
25
,
1212
29
.

奇利斯,
J.-P.公司。
&
德尔菲尔,
第页。
(
1999
).
地理统计学:建模空间不确定性
.
纽约
:
威利
.

科尔斯,
S.G.公司。
&
唐恩,
J.A.公司。
(
1991
).
极端多元事件建模。
J.R.统计。Soc.B公司
53
,
377
92
.

科尔斯,
S.G.公司。
&
唐恩,
J.A.公司。
(
1996
).
模拟区域降雨过程的极值。
J.R.统计。Soc.B公司
58
,
329
47
.

戴维斯,
注册会计师。
,
克鲁珀伯格,
C、。
&
斯坦科尔,
C、。
(
2013
).
模拟空间和时间中观测到的极值的最大稳定过程。
J.韩国统计师。Soc公司。
42
,
399
414
.

戴维斯,
注册会计师。
&
米科斯,
T。
(
2009
).
极值图:极端事件的相关图。
伯努利
15
,
977
1009
.

戴维森,
交流。
&
史密斯,
共和国。
(
1990
).
超出高阈值的模型(含讨论)。
J.R.统计。Soc.B公司
52
,
393
442
.

达维德,
A.P.公司。
,
穆西奥,
M。
&
文丘拉,
L。
(
2016
).
最小评分规则推断。
扫描。J.统计。
43
,
123
38
.

德丰德维尔,
R。
(
2017
).
mvPot:空间极端事件的多变量峰值-阈值模型
.
R包版本0.1.4,
可在获取https://cran.r-project.org/package=mvPot.

德哈恩,
L。
&
林,
T。
(
2001
).
关于极值分布的收敛性|${C}[0,1]$|.
Ann.Prob(年检)。
29
,
467
83
.

德哈恩,
L。
&
雷斯尼克,
S.I.公司。
(
1993
).
估计多元极值的极限分布。
Commun公司。统计师。斯托克。国防部。
9
,
275
309
.

家伙,
J。
&
皮利奇沙姆,
F、。
(
2010
).
数字网络和序列
剑桥:剑桥大学出版社。

董布里,
C、。
,
恩格尔克,
美国。
&
测试,
M。
(
2016
).
最大稳定过程的精确模拟。
生物特征
103
,
303
17
.

董布里,
C、。
&
里巴特,
M。
(
2015
).
功能规则变化、帕累托过程和峰值超过阈值。
统计师。接口
8
,
9
17
.

埃因马尔,
J·H·J。
,
基里略克,
答:。
,
克拉伊纳,
答:。
&
塞格斯,
J。
(
2016
).
空间尾部相关性的M估计。
J.R.统计。Soc.B公司
78
,
275
98
.

恩格尔克,
美国。
,
马林诺夫斯基,
答:。
,
卡布卢科,
Z.公司。
&
施拉瑟,
M。
(
2015
).
Hüsler–Reiss分布和Brown–Resnick过程的估计。
J.R.统计。Soc.B公司
77
,
239
65
.

费雷拉,
答:。
&
德哈恩,
L。
(
2014
).
广义Pareto过程;着眼于应用和模拟。
伯努利
20
,
1717
37
.

根茨,
答:。
&
布雷茨,
F、。
(
2009
).
多元正态和t吨可能性
多德雷赫特:施普林格。

盖尔,
C.J.公司。
(
1994
).
关于蒙特卡罗最大似然计算的收敛性。
J.R.统计。Soc.B公司
56
,
261
74
.

Gneiting、,
T。
&
拉夫特里,
答:E。
(
2007
).
严格正确的评分规则、预测和评估。
《美国统计杂志》。协会。
102
,
359
78
.

甘贝尔,
E。J。
(
1958
).
极值统计
.
纽约
:
哥伦比亚大学出版社
.

霍尔特,
H。
&
林德斯科,
F、。
(
2005
).
规则变化随机过程的极值行为。
斯托克。程序。应用。
115
,
249
74
.

胡塞尔,
R。
&
戴维森,
交流。
(
2013
).
Brown–Resnick过程的复合似然估计。
生物特征
100
,
511
8
.

胡塞尔,
R。
,
戴维森,
交流。
&
杰顿,
M.G.公司。
(
2016
).
多元极值的似然估计。
极端
19
,
79
103
.

海夫里宁,
答:。
(
2005
).
通过分数匹配估计非标准化统计模型。
J.马赫。学习。物件。
6
,
695
708
.

海夫里宁,
答:。
(
2007
).
分数匹配的一些扩展。
公司。统计师。数据分析。
51
,
2499
512
.

乔,
H。
,
史密斯,
共和国。
&
韦斯曼,
一、。
(
1992
).
极值的二元阈值法。
J.R.统计。Soc.B公司
54
,
171
83
.

卡布卢科,
Z.公司。
,
施拉特,
M。
&
德哈恩,
L。
(
2009
).
与负定函数相关的静态最大稳定场。
Ann.Prob(年检)。
37
,
2042
65
.

克鲁珀伯格,
C、。
&
雷斯尼克,
S.I.公司。
(
2008
).
Pareto copula、风险聚合和皇帝的袜子。
J.应用。探针。
45
,
67
84
.

林德斯科,
F、。
,
雷斯尼克,
S.I.公司。
&
罗伊,
J。
(
2014
).
度量空间上的正则变化测度:隐藏的正则变化和隐藏的跳跃。
探针。Surv公司。
11
,
270
314
.

马德森,
H。
,
拉斯穆森,
P.F.公司。
&
罗斯布杰格,
D。
(
1997
).
模拟极端水文事件的年最大序列和部分持续时间序列方法的比较。
水资源研究。
33
,
747
57
.

努延人,
D。
&
冷却,
R。
(
2004
).
快速的组件对组件的构建,对不同内核的重复。
2004年蒙特卡罗和准蒙特卡罗方法
,
尼德雷特
H。
&
塔莱,
D。
编辑。
柏林
:
施普林格
,页。
373
87
.

帕多安,
美国。
,
里巴特,
M。
&
Sisson,
美国。
(
2010
).
最大稳定过程的基于似然的推理。
《美国统计杂志》。协会。
105
,
263
77
.

R开发核心团队
(
2018
).
R: 一种用于统计计算的语言和环境
.
R统计计算基金会
,
奥地利维也纳。
国际标准图书编号(ISBN)3-900051-07-0。
http://www.R-project.org网站.

雷斯尼克,
S.I.公司。
(
2007
).
重尾现象:概率和统计建模
.
纽约
:
施普林格
.

根镇,
H。
&
塔伊维迪,
N。
(
2006
).
多元广义Pareto分布。
伯努利
12
,
917
30
.

斯蒂芬森,
A.G.公司。
&
唐恩,
J.A.公司。
(
2005
).
在分量极大值的似然推断中利用发生时间。
生物特征
92
,
213
27
.

蒂波德,
E.公司。
,
阿尔托,
J。
,
库利,
D.S.公司。,
戴维森,
交流。
&
海基宁,
J。
(
2016
).
Brown–Resnick过程的贝叶斯推断,以及极端低温应用。
附录申请。统计师。
10
,
2303
24
.

蒂波德,
E.公司。
&
奥皮茨,
T。
(
2015
).
椭圆Pareto过程的有效推理和模拟。
生物特征
102
,
855
70
.

托拉林斯多蒂,
T.L.公司。
,
Gneiting、,
T。
&
吉赛布尔,
N。
(
2013
).
使用适当的散度函数评估气候模型。
SIAM/ASA J.Uncert公司。数量。
1
,
522
34
.

瓦林,
C、。
,
里德,
N。
&
弗斯,
D。
(
2011
).
综合边际可能性概述。
统计师。西尼卡
21
,
5
42
.

Wadsworth,
J·L·。
(
2015
).
多元极大稳定分布的似然推断中分量极大值和偏差的出现时间。
生物特征
102
,
705
11
.

Wadsworth,
J·L·。
&
唐恩,
J.A.公司。
(
2014
).
对数高斯随机函数空间极值过程的有效推断。
生物特征
101
,
1
15
.

作者笔记

这是一篇根据知识共享署名许可条款发布的开放存取文章(http://creativecommons.org/licenses/by/4.0/)它允许在任何介质中不受限制地重用、分发和复制原始作品,前提是正确引用了原始作品。

补充数据