时间序列测试

代码
图书馆(ts测试)
图书馆(ts分布)
图书馆(茨加尔赫)
图书馆(柔性)
图书馆(xts)
数据(“间谍”)
数据(“arma_forecast”)
数据(“garch_forecast”)
间谍<- na.省略(差异(日志(间谍))

介绍

这个ts测试该软件包提供了许多不同的时间序列拟合优度的统计检验模型及其样本外预测。

下表汇总了当前实施的测试参考文件和测试类型。测试范围广泛分类为Wald[W]、似然比[LR]、豪斯曼[H]、拉格朗日乘数[LM]和Portmanteau[P]。

包装测试
测试 功能 参考 类型
GMM正交性测试 gmm测试 (L.P.Hansen 1982) [W]
Nyblom参数稳定性试验 nyblom测试 (Nyblom 1989) [流明]
符号偏差测试 符号_测试 (恩格尔和Ng,1993年) [W]
Berkowitz预测密度测试 berkowitz_测试 (伯克维茨,2001年) [参考文献]
宏利非参数密度试验。 宏利测试 (洪和李2005) 【P】
定向精度测试 dac_测试 (佩萨兰和蒂默曼1992),
(阿纳托利耶夫和格尔科2005)
【H】
Mincer-Zarnowitz试验 minzar_测试 (明瑟和扎诺维茨1969) [W]
预期短缺测试 短距离_测试 (Du和Escanciano2017) [左后]
风险价值测试 var_cp_test(变量_测试) (P.F.克里斯托弗森1998),
(P.F.Christoffersen和造粒机2004)
[左后]

该包的关键功能之一包括自定义使用测试输出as_flextable(灵活的)要生成的方法非唯一兼容且格式良好的表格。下一节提供了测试概述和示例。

拟合优度测试

GMM正交性

广义矩量法框架L.P.Hansen(1982)提供一组测试模型规格的正交条件。这些条件测试模型捕捉从低到高的一组数据的能力通过测试以下假设来排序矩和共矩:

\[\开始{对齐}E&\左[z_t\right]=0,\四元E\left[z_t^2-1\right]=0\\E&\左[z_t^3\右]=0,\四元E\左[z_t^3\右]-3=0\\E&\左[\左(z^2_t-1\右)\左(z_{t-j}^2-1\右)\right]=0,\四元j=1,\ldots,m\\E&\左[\left(z^3_t\right)\左(z_{t-j}^3\右)\右]=0,\四元j=1,\ldots,m\\E&\left[\left(z^4_t-3\right)\left(z_{t-j}^4-3\right)\right]=0,\quadj=1,\ldots,m\\\结束{对齐}\]

哪里\(z _ \)是标准化的吗估计模型的残差,以及\(米\)用于测试假设。

将力矩(M)产生条件定义为:

\[g_T左(θ右)=frac{1}{T}\sum^T_{T=1}M_T左(β右)\]

具有\(\θ\)作为参数矢量。对于大T,我们预计\(g_T\左(\theta\右)\)收敛到\(E\left[M_t\left(\theta\right)\right]\)、和在正确指定的模型下,应等于零。GMM公司估计量\(\θ\)通过以下方式获得最小化:

\[g_T\左(\theta\右)的^{-1}g_T\左(θ右)\]

其中S是加权矩阵,定义为

\[S公司=\frac{1}{T}\sum^T_{T=1}M_T\left(\theta\right)M_T\left(\theta\right)'。\]

这就是渐近协方差矩阵。1

该测试在单个力矩条件下进行,作为t测试具有\(T-1)自由度,在作为Wald测试的共同力矩条件2具有\(j)自由度,以及共同力矩条件下的联合试验条件(\(J\))Wald用\(米\)\(4+3米)自由度,分别是。

例如,我们使用SPY对数回报来估计指数使用约翰逊SU分布的GARCH(2,1)模型,并对所有这些进行测试条件使用gmm测试.

代码
规范<- garch_modelspec公司(间谍,模型= “egarch”,订单= c(c)(2,1),常数= 真的,
分配= “jsu”)
国防部<- 估计(规范)
偏斜度<- dskewness公司(“jsu”,倾斜= 系数(修订版)[“歪斜”],形状= 系数(修订版)[“形状”])
峰度<- 峭度(“jsu”,偏斜= 系数(修订版)[“歪斜”],形状= 系数(修订版)[“形状”])+ 
测试<- gmm测试(残余沉积物(修订版,使标准化= 真的),滞后= 2,偏斜度=偏斜度,
                 峰度=峰度,conf级别= 0.95)
打印(测试)
##GMM正交性测试##假设(H0):E[力矩]=0## ##平均标准误差t值Pr(>|t|)##M1 0.0004718 0.01152 0.04095 0.96734##M2 0.0081345 0.02585 0.31473 0.75297##立方米-0.1599485 0.15545-1.02894 0.30354##M4 1.2079047 1.26430 0.95540 0.33941##Q2[J]NA NA 2.18549 0.33530##Q3[J]NA NA 4.74401 0.09329。##Q4[J]NA NA 1.60572 0.44805问题[J]不适用##日本NA 11.04053 0.35437## ## ---##Signif(签名)。代码:0’***’0.001’**'0.01’*'0.05’0.1 ' ' 1

没有一个p值低于5%,因此我们无法拒绝无效假设。注意,接头条件(Q2-Q4和J)没有平均值或标准误差,因为这些是向量值。也可以使用符号创建一个外观更好的表可弯曲的、和我们还在脚注中加入了试卷参考。

代码
as_flextable(灵活的)(测试,包括.决策= 错误的,脚注.参考= 真的)
GMM正交性测试

力矩

平均值

标准误差

t值

优先级(>|t|)

E类[z(z)t吨]E\左[z_t\右]

0.0005

0.0115

0.0409

0.9673

E类[z(z)t吨21]E\左[z^2_t-1\右]

0.0081

0.0258

0.3147

0.7530

E类[z(z)t吨]E \左[z^3_t\右]

-0.1599

0.1554

-1.0289

0.3035

E类[z(z)t吨4]E \左[z^4_t-3\右]

1.2079

1.2643

0.9554

0.3394

E类[(z(z)t吨21)(z(z)t吨j个21)]E \左[(z^2_t-1)(z^1_{t-j}-1)\右]

2.1855

0.3353

E类[(z(z)t吨)(z(z)t吨j个)]E \左[(z^3_t)(z^3 _{t-j})\右]

4.7440

0.0933

.

E类[(z(z)t吨4)(z(z)t吨j个4)]E \左[(z^4_t-3)(z^_{t-j}-3)\右]

1.6057

0.4480

J型J型

11.0405

0.3544

签名。代码:0’***’0.001’**'0.01’*'0.05’0.1 ' ' 1

假设(H0):E[力矩]=0

参考文献:Hansen,L.P.(1982),广义矩估计方法的大样本性质,《计量经济学》,50(4),1029--1054。

非参数密度测试

洪和李(2005)引入了非参数组合检验,建立在Ait-Sahalia(1996)用于测试接头i.i.d假说 \(U(0,1)\)对于序列\(x_t\)如作者所述,测试\(x_t\)使用标准射门质量测试(如科尔莫戈罗夫·斯米尔诺夫)只会检查这个\(U(0,1)\)身份证下的假设。而不是联合假设\(U(0,1)\)他们的方法是比较核估计量\(\帽子g_j\左(x_1,x_2\右)\)接头密度\(g_j\左(x_1,x_2\右)\)这对的\(\左\{{x_t,x{t-j}}\右\}\)(其中\(j)是滞后阶)二的乘积\(U(0,1)\)密度。给定样本大小\(n\)和滞后顺序\(j>0),其接头密度估计器为:

\[{{\hat g}_j}\left({{x1},{x2}}\right)\equiv{\left\右)^{-1}}\sum\limits_{t=j+1}^n{{K_h}\left({{x_1},{\hat十} _t}}\右){K_h}\左({{X_2},{{\hat X}_{t-j}}}\左)}\]哪里\({{\hat X}_t}={X_t}\左({\hat\theta}\right)\)、和\(\帽子\θ\)是一个\(\平方英尺\)一致估计\(\theta_0).功能\(K_h\)是一个边界修改后的内核定义为:

\[K_{h}\左({x,y}\右)\等式\左\{{矩阵{{小时^{-1}k\左({{x-y}\在{h}}}\右上)/\int_{-\left({x/h}\右)}^{1}{k\左({u}\right)du},\quad\textbf{if}\quad x\in\left[{0,h}\right)}\cr{小时^{-1}k\左({{x-y}\over{h}}\right),\quad\textbf{if}\quadx\in\left[{h,1-h}\right]}\cr{小时^{-1}k\left({{x-y}\ over{h}}}\ right)/\int_{-1}^{左({1-x}\右)/h}{k\左({u}\right)du,\quad\textbf{if}\四个x\在\左({1-h,1}\右]}}\cr}}\对。\]

哪里\(h等于h向左(n向右))是这样的带宽\(h\向右箭头0\)作为\(n\rightarrow\infty\),和内核\(k(.)\)是一个预先指定的对称概率密度,实现为作者建议使用四次核,

\[k\左(u\右)=\压裂{{15}}{{16}}{\左({1-{u^2}}\右)^2}{\bf{1}}\left({\left|u\right|\le1}\right),\]

哪里\(\bf{1}\left(.\right)\)指示器功能。定义了它们的组合测试统计作为:

\[\帽子W\左(p\右)\等于{p^{-1/2}}\sum\limits_{j=1}^p{\hatQ\左(j\右)},\]

哪里

\[\帽子Q\左(j\右)\等于{{left[{\左({n-j}\右)h\hatM\左(j\右)-A_h^0}\右]}\mathord{\左/{\vphantom{\left〔{\left({n-j}\right)h}hat M}left(j\right)-A_h^0}\右]}{V_0^{1/2}}}}\右。}{V_0^{1/2}}},\]

\[\帽子M\左(j\右)\equiv\int_0^1{\int_0 ^1{{\left[{{\hatg} _j}\左({{x_1},{x_2}}\右)-1}\右]}^2}d{x1}天{x2}}}。\]

定心和缩放因子\(A_h^0\)\(V_0\)定义为:\[\开始{数组}{l}A_h^0\equiv{\left[{\left({h^{-1}}-2}\right)\int_{-1}^1{{k^2}\左(u\右)du+2\int_0^1{\int_{-1}^b{k_b^2\left(u\右)dudb}}}\右]^2}-1\\{V_0}\equiv 2{\left[{\int_{-1}^1{{\left[{\in_{-1{^1{k\left({u+v}\右)k\左(v\右)dv}}\右]}^2}du}}\左]^2}\结束{数组}\]

哪里,

\[{k_b}\左(.\右)\等于{k\左(.\右)}\mathord{\left/{\vphantom{{k\left(.\right)}{\int_{-1}^b{k\leaft(v\右)dv}}}\右。}{\int_{-1}^b{k\左(v\右)dv}}}。\]

在正确的模型规范下,作者表明\(\hat W\左(p\右)\右箭头N\左(0,1\右)\)分配中。因为的负值测试统计仅在正确的零假设下发生指定的模型,作者指出只有上尾临界需要考虑值。该测试对模型非常稳健参数不确定性导致的错误指定对检验统计量与参数的渐近分布\(\sqrt n\)一致。最后,在为了探讨统计时出现错误说明的可能原因拒绝模型,作者开发了以下测试统计数据:

\[M \左({M,l}\右)\相等\左[{sum\limits_{j=1}^{n-1}{w^{2}\左({j/p}\right)\左(}n-j}\rift){\rm{ha\rho}}_{ml}^{2}\左({j}\右)-\sum\limits_{j=1}^{n-1}{w^{2{左({j/p}\右\]

哪里\({\hat\rho}_{ml}}\left(j\右)\)是样本之间的互相关\(\hat X_t^m\)\(\hat X_{t-\left|j\right|}^l\)、和\(w\左(.\右)\)是权重滞后阶j的函数,如作者建议的那样,实现为巴特利特内核。正如在\(左边的W(p\右)\)统计量的渐近分布\(M\左({M,l}\右)\)\(左侧为N(右侧为0,1))和上临界应该考虑值。

我们考虑下面一个使用SPY数据集的示例子样本。注意,临界值是标准化正态分布,我们使用95%的置信水平因此,对于这个示例,根据测试的执行方式,我们如果统计值大于此值,则拒绝该null(q范数(0.95)).

根据所示的示例,我们无法正确拒绝指定了此简短子样本的模型,但请注意,使用完整的样本会导致彻底的拒绝,从而引发问题关于参数稳定性(下一节)和/或结构断裂系列。

代码
规范<- garch_modelspec公司(间谍[1:1000],模型= “女王”,订单= c(c)(1,1),常数= 真的,
分配= “jsu”)
国防部<- 估计(规范)
z(z)<- 残差(修订版,使标准化= 真的)
第页<- 个人数据表(“jsu”,z,亩= 0,西格玛= 1,偏斜= 系数(修订版)[“歪斜”],形状= 系数(修订版)[“形状”])
as_flextable(灵活的)(宏利测试(as.数字(p) ,滞后= 4,conf级别= 0.95),包括.决策=T、,脚注.参考= 真的)
宏利非参数密度试验

测试

统计(z)

临界值

决策

M(1,1)

-0.9449

1.6449

拒绝H0失败

M(2,2)

0.2038

1.6449

拒绝H0失败

M(3,3)

-0.1175

1.6449

拒绝H0失败

米(4,4)

-0.6516

1.6449

拒绝H0失败

M(1,2)

-0.7576

1.6449

拒绝H0失败

M(2,1)

0.2697

1.6449

拒绝H0失败

J型

-1.1106

1.6449

拒绝H0失败

置信水平(%):95

假设(H0):正确指定

参考文献:

Hong,Y.和Li,H.(2005),连续时间模型的非参数规范测试及其在利率期限结构中的应用,金融研究综述,18(1),37-84。

参数恒定性

参数恒定性测试尼布洛姆(1989)B.E.Hansen(1992)拉格朗日乘子参数稳定性试验。测试Nyblom(1989)检验无效假设参数相对于它们所遵循的备选方案是恒定的鞅过程,而B.E.汉森(1992)检验个体恒常性的零假设参数。统计数据的分布是非标准的,并且与独立布朗桥的平方分布有关具有以下系列扩展4:

\[\和^{\infty}_{k=1}\frac{1}{\left(\pik\右)^2}\池^2_{k}\左(p\右)\]

哪里\(p\)是的号码参数。B.E.Hansen(1992)提供了基于仿真的多达20个参数的临界值表在进行这个测试。相反ts测试包使用内部除了一个核平滑密度以直接生成p值。应注意,无论是单独测试还是联合测试都没有提供任何有关断点位置的信息,并且分布仅对固定数据有效。

为了说明测试的使用,我们继续使用与在上一节中,打开参数以提供指导是否拒绝5%水平的无效假设重要性。

代码
规范<- garch_modelspec公司(间谍,模型= “egarch”,订单= c(c)(2,1),常数= 真的,
分配= “jsu”)
国防部<- 估计(规范)
测试<- nyblom测试(残余沉积物(修订版,使标准化= 真的),分数= 埃斯特芬(修订版),
                    参数名称= 姓名(系数(修订版),
                    参数符号=国防部$parmatrix[估计== 1]$符号)
as_flextable(灵活的)(测试,使用.symbols= 真的,脚注.参考= 真的,包括.决策= 真的)
Nyblom-Hansen参数恒常性检验

统计的

压力(>t)

决策(5%)

μ\亩

0.1599

0.3499

拒绝H0失败

ω\欧米茄

0.5565

0.0285

*

拒绝H0

α1\字母_1

0.7846

0.0079

**

拒绝H0

α2\α_2

0.7569

0.0092

**

拒绝H0

γ1\γ_1

0.4700

0.0473

*

拒绝H0

γ2\γ_2

0.0714

0.7169

拒绝H0失败

β1\β_1

0.5187

0.0354

*

拒绝H0

ζ\泽塔

1.8639

0

***

拒绝H0

ν\努

0.8672

0.0050

**

拒绝H0

J型\数学{J}

5.3285

0

***

拒绝H0

Signif(签名)。代码:0’***’0.001’**'0.01’*'0.05’0.1 ' ' 1

假设(H0):常数参数

参考文献:Nyblom,J.(1989),参数随时间变化的恒常性测试,美国统计协会期刊,405223-230。

该表表明,我们可以单独拒绝大多数参数在5%水平上的参数恒定性以及联合(J型).

符号偏差

符号偏差测试恩格尔和吴(1993)评估标准化残差(捕捉GARCH的可能错误说明模型),通过回归滞后的平方标准化残差负面和正面冲击如下:

\[z^2_t=c_0+S^{-}_{t-1}+c_2 S^{-}_{t-1}\varepsilon{t-1{+c3S^{+}_{t-1}\varepsilon_{t-1}+u_t\]

哪里\(S^{-}_{t-1}=I_{\varepsilon_{t-1}<0}\),\(S^{+}_{t-1}=I_{\varepsilon_{t-1}\ge0}\).\(\varepsilon_t\)模型残差。零假设是所有系数\(c1、c2、c3)是单独的,并且共同归零。联合测试是Wald测试,分布如下\(卡^2(3)).

下表显示了该测试在到目前为止使用的模型,其中p值表示我们不能拒绝零符号偏差,无论是单独还是联合。

代码
测试<- 符号_测试(残余沉积物(修订版),西格玛= 西格玛(修订版)
as_flextable(灵活的)(测试,使用.符号= 真的,脚注.参考= 真的)
符号偏差测试

估算

标准错误

t值

优先级(>|t|)

S公司t吨1S公司^{-}_{t-1}

0.0648

0.0693

0.9347

0.3500

S公司t吨1εt吨1S公司^{-}_{t-1}\varepsilon{t-1{

3.9303

3.9425

0.9969

0.3189

S公司t吨1+εt吨1S^{+}_{t-1}\varepsilon_{t-1}

3.4217

4.2902

0.7976

0.4251

J型\数学{J}

1.6447

0.6493

Signif(签名)。代码:0’***’0.001’**'0.01’*'0.05’0.1 ' ' 1

假设(H0):无符号偏差

参考文献:Engle RF,Ng VK(1993)。衡量和测试新闻对波动性的影响。《金融杂志》,48(5),1749-1778。

预测评估测试

密度预测

分析条件密度与基础数据通过概率积分变换(个人识别号)在中讨论罗森布拉特(1952)定义为:

\[{x_t}=\int\limits_{-\infty}^{{y_t}}{左(右)du=\帽子F\左({{y_t}}\右)}\]

它转换数据\(y_t\),使用估计的分布\(\帽子F\)到身份证上。\(U(0,1)\)在下面正确指定的模型。

由于测试\(U(0,1)\)序列,PIT数据(\(x_t\))被转化为\(N(0,1)\)通过Berkowitz(2001)使用正常分位数(\(\Phi^{-1}\))功能:

\[z_t=\Phi^{-1}\left(x_t\right)\]

在正确预测密度的零点下,值(\(z_t\))应该独立于观测值,均值为零,单位方差不显著自回归项(零)。例如,以下第一个订单可以测试自回归动力学:

\[z_t=\mu+\rho\left(z{t-1}-\mu\right)+\varepsilon_t\]

作为似然比(LR)测试中的不受限制方程限制方程,其中\(\mu=0\),\(σ=1)\(\rho=0\)LR测试为:

\[\mathrm{LR}=-2\左(L\左(0,1,0\右)-左(\hat\mu,\hat\sigma,\had\rho\right)\右)\]

哪里\(L \)是对数似然。LR检验统计量的渐近分布为\(2(2+m))哪里\(米\)是自回归数滞后。

最后一个测试步骤也可以包括在内,它着眼于优点将变换后的级数拟合为法线。以下Dowd(2004),输出包括“Normality”的测试贾克和贝拉(1987).

我们使用基于GARCH的预计算后验5在软件包中例子:

代码
第页<- 个人数据表(“jsu”,q个=garch_预测$实际,亩=garch_预测$预测,
西格玛=garch_预测$西格玛,倾斜=garch_预测$倾斜,
形状=garch_预测$形状)
as_flextable(灵活的)(伯克维茨测试(p) )
Berkowitz密度预测试验

测试

国防部

统计的

Pr(>Chisq)

伯克维茨

3.2655

0.3525

雅克贝拉

2

3.5131

0.1726

Signif(签名)。代码:0’***’0.001’**'0.01’*'0.05’0.1 ' ' 1

假设(H0):正常(0,1),无自相关

LR和Jarque-Bera测试的p值均大于5%因此,在这个层面上,我们无法拒绝零假设,并发现密度预测充分满足了这些试验的要求。

定向精度

高且显著的定向精度可能意味着能够预测平均预测的符号,或者仅仅是在缺乏平均可预测性的情况下波动相关性的结果争论的人P.F.Christoffersen和Diebold(2006).

Pesaran和Timmermann(1992)提供一个非参数检验评估预测的方向准确性。\(y_t\)表示实际序列\(x_t\)该系列的预测,然后零假设是两者是独立的(预测不能预测实际情况)。这是一项豪斯曼型测试,统计数据如下:

\[S_n=\frac{P-P_*}{\sqrt{\left[V\left(P\right)-V\左(P_*\右)\右]}}\]

哪里:

\[P=\frac{1}{n}\sum^n_{t=1}H\左(y_tx_t\right)\]

表示x正确预测y的时间比例,具有\(H(.)\)成为天堂如果预测和实际的符号为1,则取值的函数同意,否则为0。

此外,

\[P_*=P_y P_x+\左(1-P_y\右)\左(1-P_x\右)\]

具有\(_y\)\(P_x\)y中阳性病例的比例和x。该方程表示x可以正确预测y的次数,前提是独立分布(null)。这两者之间的差异空值下的已实现比例和预期比例豪斯曼检验统计的基础。分母将其标准化比例的差异由两者方差的差异决定比例,具有:

\[V\左(P\右)=\压裂{1}{n} P(P)_*\左(1-P_*\右)\]

\[\开始{对齐}V\左(P_*\右)=&\压裂{1}{n}\左(2P_y-1\右)^2P_x\左(1-P_x\右)+\\&\ frac{1}{n}\左(2P_x-1\右)^2P_y\左(1-P_y\右)+\\&\ frac{4}{n^2}P_y P_x\左(1-P_y\右)\左(1-P_x\右)\结束{对齐}\]

统计数据\(S_n\)渐近分布为\(左侧为N(右侧为0,1)).

While期间Pesaran和Timmermann(1992)符号可预测性测试,安纳托利耶夫和格尔科(2005)基于归一化超额的平均可预测性检验长期或短期定向策略所隐含的盈利能力取决于天气预报的信号。关键区别之一这两个测试之间的关系是观察到的\(y_t\),这意味着这可能很重要什么时候\(x_t\)无法预测\(y_t\)如果在此期间发生损失(或错失收益)足以使战略相对无利可图尽管具有显著的定向精度。考虑1周期交易策略回报:

\[r_t=\textrm{符号}\左(x_t\右)y_t\]

预期回报

\[A_n=\压裂{1}{n}\总和^n_{t=1}r_t\]

基准策略,随机发出买入和卖出信号买卖比例与交易策略中的比例相同预期回报如下:

\[B_n(B_n)=\左(\frac{1}{n}\sum^n{t=1}\textrm{sign}\left(x_t\right)\right\]

在条件平均独立性为零的情况下,那么\(E\左[y_t|I_{t-1}\右]=\mathrm{常量}\)如果战略具有预测力将产生比基准更高的平均回报,以及\(A_n-B_n\)将大于零并且重要。为了测试这种差异的重要性,需要通过这个差异的方差进行标准化(\(五)):

\[V=\frac{4}{n^2}p_y\左(1-p_y\右)\sum^n_{t=1}\左(y_t-y\右)^2\]

哪里\(p_y=\压裂{1}{2}\左(1+\frac{1}{n}\sum^n_{t=1}\mathrm{sign}\left(y_t\right)\right).

类似于佩萨兰和蒂默曼(1992),这也是一个Hausman检验\(压裂{A_n-B_n}{\sqrt(V)}\),渐近分布为\(左侧为N(右侧为0,1)).

为了说明这一点,我们使用了ARMA(1,1)预计算的回溯预测包装中提供:

代码
as_flextable(灵活的)(dac_测试(arma_预测$实际,arma_forecast$预测))
定向精度测试

测试

统计的

Pr(>|t|)

PT:(签字)

0.3594

0.3596

AG:(平均值)

0.1144

0.4545

Signif(签名)。代码:0’***’0.001’**'0.01’*'0.05’0.1 ' ' 1

Obs:250,准确度:0.5,患病率:0.464

假设(H0):PT:无可预测性(符号)

假设(H0):AG:无可预测性(平均值)

上表中两个测试的p值表明我们失败了以高度的信心拒绝无可预测性的零。

预测无偏性

为了理解好的预测的属性,我们首先考虑一下最佳预测应该是什么样子。考虑Wald代表\(年\),在地平线上小时:

\[y{n+h}=\mu+\epsilon{n+h2}+b1\epsilon_{n+h-1}+b2\epsilon_{n+h-2}+\ldot\]

最优h步预测是

\[y{n+h|n}=\mu+bh\epsilonn+b{h+1}\epsilen{n-1}+\ldots\]

具有最佳预测误差

\[\ε{n+h|n}=\ε{n+h}+b1\ε{n+h-1}+b2\epsilon{n+h-2}+\ldots+b{h-1}\epsilen{n+1}\]

h步预测误差方差在h中增加。

最佳预测误差与\(左[\epsilon_{n+h|n}\right]=0\),使用h步预测误差最多具有MA(h-1)结构提前1步预测错误\(\epsilon_{n+1|n}=\epsilon_{n+h}\)白噪音。这意味着:

\[\ε{n+h|n}=\alpha+\betay{n+h2|n}+\varepsilon{n+h}\]

将会有\(阿尔法=0)\(β=0).

\[\ε_{n+h|n}=y_{n+h}-y_{n+h|n}\]

然后,

\[y{n+h|n}=\alpha+\betax{n+h2|n}+\varepsilon{n+h |n}\]

可以在无偏零点下用\(阿尔法=0)\(β=1)使用Wald测试。这是回归测试的本质Mincer和扎诺维茨(1969)。但它有效地测试了预测偏差它没有说明任何关于预测方差的内容。

下表显示了提前15步测试的输出根据ARMA(15.0)对SPY对数回报的选定子样本进行预测模型。我们无法拒绝的NULL\(阿尔法=0)\(β=1)根据Wald的结果用Pr(>Chisq)=0.96进行测试。

代码
间谍<- na.省略(差异(日志(间谍))
国防部<- 阿里马(as.数字(每年[2000:2500]),订单= c(c)(15,0,0),变压器参数= 真的,包括平均值= 真的)
第页<- 预测(修订版,n.前方= 15)
测试<- minzar_测试(实际的,实际的= as.数字(间谍[2501:2515]),
                    预测= as.数字(第页$pred))
as_flextable(灵活的)(测试,脚注.参考=T、,数字= 2)
Mincer-Zarnowitz试验

估算

标准错误

t值

优先级(>|t|)

常数

0

0

0.28

0.79

预测

1.04

2.46

0.42

0.68

J型

0.09

0.96

Signif(签名)。代码:0’***’0.001’**'0.01’*'0.05’0.1 ' ' 1

假设(H0):无偏预测

参考:Mincer JA。和Zarnowitz V.(1969),“经济预测评估”《经济预测与预期:预测行为与绩效分析》,NBER,3-46

预计短缺

测试Du和Escanciano(2017)结合了来自Berkowitz(2001)P.F.Christoffersen(1998)创建基于概率的无条件和条件短缺检验以预测为条件的积分转换实现分配,以评估短缺的严重性和独立性残差。

无条件测试

无条件测试评估累积值的预期值超出风险值(VaR)阈值的违规行为,使用双边t检验,采用以下统计数据:

\[U_{ES}=\frac{\sqrt{n}\left(\bar H\ left(\ alpha\right)-\frac{\alpha}{2}\right)}{\sqrt{\alfa\left(\frac{1}{3}-\压裂{\alpha}{4}\right)}}\]

其中术语\(\压裂{\alpha}{2}\)是正确校准风险模型下的预期值。\(\bar H\左(\alpha\右)\)表示样本平均值\(H_t\左(\alpha\右)\):

\[\bar H\left(\alpha\right)=\frac{1}{n}\sum^n_{t=1}H_t\left\]

具有\(H_t\左(\alpha\右)\)这个累计故障(超出风险值的违规行为),使得:

\[H_t\left(\alpha\right)=\frac{1}{\alpha}\ left(\ alpha-u_t\right)\mathrm{I}\left(u_t\le\alpha\ right)。\]

向量\(u\)是概率给出预测的未来实现的整体转换分配。

测试统计的分布\(U_{ES}\)渐近分布为\(N(0,1)\)。因为统计数据是在单位区间内有界,置信区间需要约束为介于[0,1]之间。因此,p值将以下形式:

\[Pr(>|t|)=2\min{\left(\mathrm{Pr}\left[|U_{ES}|\lex\右],1-\mathrm{Pr}\left[|U_{ES}|\le x\右]\right)}\]

条件测试

条件测试不仅评估正确性和累计失效的预期值的重要性他们的独立性。考虑累积值的自协方差滞后j的违规:

\[\gamma_j=\frac{1}{n-j}\sum^n_{t=j+1}\left(H_t-\压裂{\alpha}{2}\右)\左(H_{t-j}-\压裂{\alpha}{2}\right)。\]

然后,自相关等于:

\[\rhoj=\frac{\gammaj}{\gamma0}\]m滞后的测试统计为:

\[C_{ES}=n\sum^m_{j=1}\rho^2_j\]

其渐近分布为\(\chi^2_m\),并且独立于\(\字母\).

例子

以下示例使用预先计算的GARCH后验数据,强调使用短距离_测试功能。

代码
#矿坑数据
x个<- 数据列表(“jsu”,q个=garch_预测$实际,亩=garch_预测$预测,
西格玛=garch_预测$西格玛,倾斜=garch_预测$倾斜,
形状=garch_预测$形状)
测试<- 短距离_测试(x,阿尔法= 0.05,滞后= 4)
as_flextable(灵活的)(测试,脚注.参考=T)|> 宽度(j个= 1:,宽度= 1.2)
预期短缺测试(Du和Escanciano)

测试

统计的

优先级(>|t|)

德国(U)

0.0277

0.7377

德国(C)

2.7680

0.5974

Signif(签名)。代码:0’***’0.001’**'0.01’*'0.05’0.1 ' ' 1

覆盖范围:0.05,Obs:250

假设(H0):无条件(U)和独立(C)

参考文献:Du Z.和Escanciano J.C.(2017)。回溯测试预期缺口:考虑尾部风险。管理科学,63(4),940--958。

风险价值:覆盖范围和持续时间

风险价值(VaR)测试ts测试程序包是基于故障测试的比例库皮克(1995),的条件覆盖测试P.F.Christoffersen(1998)、和故障间隔时间测试P.F.公司。Christoffersen和Pelletier(2004)。这些总结在下一节。

故障比例(UC公司)

测试库皮克(1995)评估故障比例是否与预期相符给定VaR水平下的故障比例。这是通过求和实现的违规次数(二进制),并除以预测。6在无效假设下故障率(\(\pi\))是等于风险值水平(\(\字母\)),则受限模型的似然为:

\[\数学{五十} _r(r)=\left(1-\alpha\right)^{n}\alpha^{k}\]以及无限制(观测)模型的可能性:

\[\数学{L} 使用(_u)=\左(1-\pi\右)^{n}\pi^{k}\]哪里\(\pi=\frac{n}{左(n+k \右)}\),\(n\)观察次数,以及\(k\)这个失败次数。然后可以使用统计的:

\[\数学{LR}(左后)_{uc}=-2\log{\frac{\mathrm{五十} _r(r)}{\mathrm(马特姆){五十} u(_u)}}\]

其分布为\(\chi^2_1).

故障的独立性(CCI公司)

失败(或无条件)测试的比例库皮克(1995)测试间隔的覆盖范围但没有能力检测它们是否独立。P.F.Christoffersen(1998)建议测试根据一阶命令明确检查独立性假设马尔可夫替代。考虑一个二元一阶马尔可夫链转移概率矩阵:

\[\图片_1=\开始{bmatrix}1-\pi_{01}&\pi_}01}\\1-\pi{11}&p{11}\结束{bmatrix}\]

哪里\(\pi_{ij}=Pr\左(I_t=j|I_{t-1}-i\右)\),\(I _ \)是指示器功能表示故障。这个过程的大概可能性是然后

\[\数学{五十} u(_u) =\左(1-\pi{01}\右)^{n_{00}}\pi{01}^{n{01}}\左(1-\ pi{11}\右\]哪里\(n_{ij}\)值i后跟j的观察数。例如,\(n{10}\)表示时段数先是失败,然后是没有失败的时期。对于受限制的模型在零独立性下,一阶马尔可夫链具有以下转移概率矩阵:

\[\图片_1=\开始{bmatrix}1-\pi_2和\pi_2\\1-\pi_2和\pi_2\\\结束{bmatrix}\]可能性如下:

\[\数学{五十} _r(r)=\左(1-\pi_2\右)^{n_{00}+n_{10}}\pi_2^{n_01}+n{11}}\]

最后,独立性测试的似然比可以是表示为:

\[\数学{LR}(左后)_{cci}=-2\log\frac{L_r}{L_u}\]

其渐近分布为\(\chi^2\左(1\右)\).

有条件覆盖(科科斯群岛)

覆盖度和独立性联合测试的似然比就是Kupiec覆盖和独立可能性的总和比率:

\[\数学{LR}(左后)_{cc}=\mathrm{LR}(左后)_{uc}+\mathrm{LR}(左后)_{cci}\]其渐近分布为\(\ chi^2\left(2\right)\).

故障间隔时间(D类)

上一节中的条件覆盖独立性测试在检测时间依赖性方面的能力有限一阶马尔可夫结构。提供更强大的测试P.F.Christoffersen和Pelletier(2004)提出了一种更通用的结构,使用VaR之间的持续时间故障(no-hit持续时间),定义为:

\[D_i=t_i-t_{i-1}\]

哪里\(t_i)表示时间索引违规次数\(i)。在正确指定风险模型的无效假设持续时间(\(D\))应该没有内存平均持续时间为\(\frac{1}{\alpha}\)时期。因为只有连续无记忆随机分布是指数的,那么在零假设下,no-hit持续时间的分布应该是:

\[f_{\mathrm{exp}}\左(D;\alpha\right)=p\exp\左(-\alpha D\右)。\]

为了测试这一点,一个包含的分布允许对于持续时间相关性,也需要嵌入指数。这个威布尔分布提供了一个这样的示例,其中包括分布:

\[f_{\mathrm{W}}\左(D;a,b\右)=a ^bbD^{b-1}\exp\左(-\左(aD\右)^b\右)。\]

指数是一种特殊情况,当\(b=1)因此无记忆持续时间过程对应于\(b=1)\(a=\alpha\),可以使用似然比检验分布为\(\chi^2\左(1\右)\).7

例子

下表显示了VaR的4项测试,p值远高于10%表示在测试的样本外周期。

代码
q个<- 量子列表(“jsu”,第页= 0.05,亩=garch_预测$预测,西格玛=车库_预制$西格玛,
倾斜=garch_预测$倾斜,形状=车库_预制$形状)
测试<- var_cp_test(变量_测试)(实际的,实际的=garch_预测$实际,预测=问题,阿尔法= 0.05)
as_flextable(灵活的)(测试,脚注.参考=T)|> 宽度(j个= 1:,宽度= 1.2)
风险价值测试(Christoffersen和Pelletier)

测试

国防部

统计的

Pr(>Chisq)

库皮埃克(加州大学)

1

0.9514

0.3294

CP(CCI)

1

0.0009

0.9763

CP(CC)

2

0.9522

0.6212

CP(D)

1

0.0821

0.7745

Signif(签名)。代码:0’***’0.001’**'0.01’*'0.05’0.1 ' ' 1

覆盖范围:0.05,Obs:250,失败次数:16,E[失败次数]:12

假设(H0):无条件(UC)、独立(CCI)、联合覆盖(CC)和持续时间(D)

参考文献:

Kupic,P.(1995),《验证风险计量模型准确性的技术》,《衍生品杂志》,第3期,第73-84页。

Christoffersen,P.(1998),《评估区间预测》,《国际经济评论》,39,841--862。

Christoffersen,P.和Pelletier,D.(2004),《后验价值-风险:基于持续时间的方法》,《金融计量经济学杂志》,2(1),84-108。

工具书类

Ait-Sahalia,Y.1996年。“测试现场的连续时间模型利率。” 金融研究综述9 (2):385–426.
Anatolyev,S.和A.Gerko。2005“测试的交易方法可预测性。” 商业与经济杂志统计23 (4): 455–61.
Berkowitz,J.2001年。“测试密度预测及应用风险管理。” 商业与经济杂志统计19 (4): 465–74.
Christoffersen,P.F.1998年。“评估间隔预测。” 国际经济评论, 841–62.
Christoffersen,P.F.和F.X.Diebold。2006“金融资产收益率、方向变化预测和波动率动力学。” 管理科学52 (8): 1273–87.
Christoffersen、P.F.和D.Pelletier。2004“回测价值与风险:基于持续时间的方法。” 第页,共页金融计量经济学2 (1): 84–108.
Dowd,K.,2004年。“改进的Berkowitz回测。” 风险杂志17 (4): 86–87.
Du,Z.和J.C.Escanciano。2017“预计进行回溯测试不足:尾部风险会计。” 管理科学63 (4): 940–58.
恩格尔、R.F.和V.K.Ng.1993年。“测量和测试新闻对波动性的影响。” 《金融杂志》48(5): 1749–78.
哈密尔顿,J.D.2020。时间序列分析.普林斯顿大学出版社。
Hansen,B.E.1992年。“线性参数不稳定性测试模型。” 政策建模杂志14 (4): 517–33.
Hansen,L.P.1982年。“广义方法的大样本特性力矩估计器。” 计量经济学50 (4): 1029–54.
Hong,Y.和H.Li.2005。“非参数规范测试连续时间模型及其在术语结构中的应用利率。” 金融研究综述18 (1):37–84.
C.M.Jarque和A.K.Bera。1987“正态性测试观察值和回归残差。” 国际统计评论/国际统计评论, 163–72.
Kupiec,P.H.1995年。“验证风险准确性的技术测量模型。” 衍生品杂志3 (2):73–84.
Mincer,J.A.和V.Zarnowitz。1969“经济评估预测。”经济预测和预期:分析预测行为和绩效, 3–46. 丁腈橡胶。
Nyblom,J.1989年。“测试时间。” 美国统计协会杂志84 (405): 223–30.
Pesaran,M.H.和A.Timmermann。1992“一个简单的非参数预测性能测试。” 商业杂志&经济统计10 (4): 461–65.
罗森布拉特,M.1952。“关于多元的评论转型。” 数理统计年报23 (3): 470–72.

  1. 也可以对序列进行此估计修正建议的相关性汉密尔顿(2020),但我们将此留待以后调查。↩︎

  2. 渐近分布为\(2).↩︎

  3. 所有联合测试均以大写字母表示\(J\)在包中。↩︎

  4. 根据的方程式3.3Nyblom公司(1989).↩︎

  5. 基于SPY日志,使用GARCH(1,1)-JSU返回数据模型(有关详细信息和复制代码,请参阅文档)。↩︎

  6. 在i.i.d观察的假设下,序列失效次数按伯努利分布(\(\字母\)).↩︎

  7. 实际实现需要计算命中序列的持续时间、截尾观测值和组合所有这些都是为了构建对数似然性,需要使用无限制似然的数值方法。↩︎