摘要

样本相关矩阵的统计推断在高维数据分析中非常重要。基于此,本文建立了高维样本相关矩阵线性谱统计量的一个新的中心极限定理,其中维数为第页和样本量n个具有可比性。这一结果在大维随机矩阵理论中具有独立的意义。我们还进一步研究了元素具有特殊相关结构的高维向量的样本相关矩阵,并发展了相应的中心极限定理。同时,我们将线性谱统计应用于独立性测试第页随机变量,然后对第页系数载荷和n个因子模型中的因子。该测试的有限样本性能表明了其在实践中的适用性和有效性。本文还进行了实证应用,以检验中国各城市家庭收入的独立性。

1.简介

各个领域出现的“大数据”问题给经典统计推断带来了巨大挑战。高维度和大样本量是大数据的两个关键特征。在统计推断中,由于高维性,存在诸如噪声积累、伪相关和偶发同质性等严重问题。有鉴于此,开发新的统计模型和方法对于大数据研究是必要的。因此,我们在本文中的任务是分析第页-维随机向量x个=(X(X)1,X(X)2,,X(X)第页)*,有可用样本x个1,x个2,,x个n个,其中x个=(X(X)1,X(X)2,,X(X)第页)*,和“*”表示传统的共轭转置。我们考虑维度的设置第页和样本量n个具有相同的顺序。

相关矩阵通常用于统计中,以调查组中不同变量之间的关系。众所周知,当数字第页调查中的随机变量与样本量相当n个因此,理解和研究高维数据样本相关矩阵的渐近行为是非常有趣的。样本相关矩阵出现在一些用于假设检验的经典统计学中。斯科特(2005)利用样本相关矩阵检验具有多元正态分布的大量随机变量的独立性。此外,关于高维数据的统计推断,有许多基于样本协方差矩阵的可用研究方法,例如Johnstone(2001)、蔡. (2010)和平移. (2014). 由于原始数据的总体均值和方差通常是未知的,样本协方差矩阵不能为我们提供关于数据的足够和正确的信息。为了说明这一点,一个简单的例子是,如果调查数据的方差不等于1,而基于样本协方差矩阵的统计数据要求方差为1,那么我们在独立性测试中会得出错误的结论。此外,与使用样本协方差矩阵相比,使用样本相关矩阵的主要优点是它不需要x个待查。这一点使得基于样本相关矩阵的线性谱统计在应用中更加实用。相比之下,样本协方差的线性谱统计(LSS)涉及未知矩,因此实际上是不可行的。

大维随机矩阵理论为我们建立高维样本协方差矩阵的渐近理论提供了有力的工具。Bai和Silverstein(2004)有助于建立基于高维样本协方差矩阵的LSS渐近理论。同时,文献中很少有研究高维样本相关矩阵的结果。江(2004)其中,建立了样本相关矩阵的极限谱分布。蔡和江(2011)发展了样本相关矩阵相干性的一些极限定律。此外,两个包. (2012)皮莱和尹(2012)建立了样本相关矩阵极值特征值的渐近分布。通过进一步,本文发展了一个新的LSS中心极限定理(CLT),该定理基于样本相关矩阵的经验谱分布(ESD)x个LSS类是一个通用的统计类,它能够涵盖许多常用的统计数据。平移. (2014)研究了LSS在线性过程样本协方差矩阵中的应用。本文中给出的样本相关矩阵的新发展的CLT在大维随机矩阵理论中也有独立的意义。

除了建立一个新的CLT之外,我们还考虑了一个特殊的情况,当x个相互关联。开发了此示例的LSS的CLT。此外,我们讨论了样本相关矩阵的LSS和由此得到的渐近理论的两个相关统计应用。第一个是独立性测试第页随机变量,向量的项x个相关研究是Schott(2005),他讨论了这种独立性测试第页正态随机变量。第二个应用是测试因子负荷或因子模型中因子的等效性。正如我们在第节中讨论的那样,样本相关矩阵可以直接用于测试目的,而无需首先估计因子负载和因子。

论文的其余部分组织如下。章节2介绍了一类LSS。在第节中建立了一个渐近分布3.1相关结构的渐近分布在第节中给出3.2此外,第节中给出了两种应用3.2仿真结果见第节4详细说明,第节4.2给出了估计和测试理论在实际中应如何实现的计算算法,而第节报告并讨论了所提出测试的有限样本性能4.3第节提供了一个实证应用,以测试中国各城市家庭收入的独立性5.第节6结束了本文的主要讨论。第节中所述主要定理的证明概述3.1见附录A类。第节中使用的一些代码函数4显示在附录A在线补充文件。文中给出了这两个定理和一些必要引理的详细证明附录B补充文件。

用于分析数据的程序可以从

http://wileyonlinelibrary.com/journals/rssdatasets

2.线性光谱统计

x个1,x个2,,x个n个是由第页-维随机向量x个=(X(X)1,X(X)2,,X(X)第页)*.让X(X)n个=(1负极¯1,2负极¯2,,第页负极¯第页)*,其中=(X(X)1,X(X)2,,X(X)n个)T型对于= 1, 2,…,第页¯=(1/n个)Σj个=1n个X(X)j个e(电子)具有e(电子)成为第页-元素都是1s的维向量,其中T表示矩阵或向量的转置。

考虑样本相关性矩阵B类n个=(ρk个)第页×第页具有
ρk个=(负极¯)*(k个负极¯k个)负极¯k个负极¯k个,
其中,‖·‖是通常的欧几里德规范。请注意B类n个也可以写成
B类n个=Y(Y)n个*Y(Y)n个=D类n个X(X)n个*X(X)n个D类n个,
(2.1)
具有
Y(Y)n个=1负极¯11负极¯1,2负极¯22负极¯2,,第页负极¯第页第页负极¯第页
D类n个=诊断(1/负极¯)第页×第页是一个对角矩阵。

让我们考虑一类与B类n个为此,定义样本相关矩阵的ESDB类n个通过如果B类n个(x个)=(1/第页)Σ=1第页(λx个),其中λ1λ2λ第页是的特征值B类n个(·)是一个指示函数。

如果X(X)1,X(X)2,,X(X)第页是独立的,如果B类n个(x个)以概率1收敛于Marcenko–Pastur定律如果c(c)(x个)具有c(c)=n个第页/n个(见江(2004)),其密度具有形式的显式表达式
(f)c(c)(x个)=12πx个c(c){(b条负极x个)(x个负极)},   x个b条,0,   否则,
和点质量1−1/c(c)在原点,如果c(c)>1,其中=(1负极c(c))2b条=(1+c(c))2.
样本相关矩阵的LSS的形式如下
1第页j个=1第页(f)(λj个)=(f)(x个)d日如果B类n个(x个),
哪里(f)是[0,∞)上的解析函数。其归一化和标度LSS的形式为
T型n个((f))=(f)(x个)d日G公司n个(x个),
(2.2)
哪里G公司n个(x个)=第页{如果B类n个(x个)负极如果c(c)n个(x个)}.

测试统计T型n个((f))是一种一般统计,因为它涵盖了许多特殊情况下的经典统计,例如。

  • 斯科特统计(斯科特,2005),
    (f)1(x个)=x个2负极x个,T型n个((f)1)=信托收据(B类n个2)负极第页负极第页(x个2+x个)d日如果c(c)n个(x个),
  • 似然比检验统计量(Morrison,2005),
    (f)2(x个)=日志(x个),T型n个((f)2)==1第页日志(λ)负极第页日志(x个)d日如果c(c)n个(x个),
    哪里λ,=1,2,,第页,是的特征值B类n个.
一个重要的工具,用于为T型n个((f))是Stieltjes变换。Stieltjes变换G公司对于任何累积分布函数G公司由定义
G公司(z(z))=1λ负极z(z)d日G公司(λ),   (z(z))>0.
Stieltjes变换G公司(z(z))以及相应的分布G公司(x个)满足关系
G公司([x个1,x个2])=1πε0x个1x个2G公司(x个+ε)d日x个,
哪里x个1x个2连续点是G公司.
此外,LSS可以通过ESD的Stieltjes变换表示B类n个如下:
(f)(x个)d日如果B类n个(x个)=负极12πC类(f)(z(z))如果B类n个(z(z))d日z(z),
(2.3)
其中轮廓C类包含支持如果B类n个概率为1。

3.渐近理论及其两个应用

首先,我们为线性统计量建立了一个新的CLT(2.2)在定理1中。此外,还讨论了相关结构,并开发了相应的CLT。最后,我们展示了如何将线性统计量及其产生的极限分布应用于第页随机变量,然后分别对因子载荷或因子进行等价性测试。

3.1、。渐近理论

在我们建立主要定理之前,我们先介绍一些符号。B类̲n个=Y(Y)n个Y(Y)n个*ESD和极限光谱分布的Stieltjes变换B类̲n个表示为̲n个(z(z))̲c(c)(z(z))分别是。它们的类似物B类n个表示为n个(z(z))c(c)(z(z))分别是。此外,̲c(c)n个(z(z))c(c)n个(z(z))成为̲c(c)(z(z))c(c)(z(z))分别,当c(c)被替换为c(c)n个为了便于记法,我们表示c(c)(z(z))̲c(c)(z(z))通过(z(z))和(z(z))分别省略下标c(c)此外,让(z(z))是的一阶导数(z(z))关于z(z)贯穿本文其余部分。

以下定理用于为相关矩阵的LSS建立联合CLTB类n个.

定理1
假设{X(X)j个:=1,2,,第页j个=1,2,,n个}独立令人满意啜饮1第页E类|X(X)1|4<.让第页/n个c(c)∈(0,∞)为n个→ ∞
κ=第页1第页=1第页E类|X(X)1负极E类[X(X)1]|4(E类|X(X)1负极E类[X(X)1]|2)2.
(f)1,(f)2,,(f)第页是上的函数R(右)关于一个包含
[(1负极c(c))2,(1+c(c))2].
然后,随机向量((f)1(x个)d日G公司n个(x个),,(f)第页(x个)d日G公司n个(x个))弱收敛到高斯向量(X(X)(f)1,,X(X)(f)第页).
什么时候?X(X)j个是真实随机变量,渐近平均值为
E类第页[X(X)(f)j个]=κ负极12πC类(f)j个(z(z))c(c)̲(z(z))[{1+̲(z(z))}2负极c(c)̲2(z(z))]1+̲(z(z))d日z(z)+κ负极|ψ|2负极22πC类(f)j个(z(z))c(c)z(z)2(z(z))1+̲(z(z))̲2(z(z))[{1+̲(z(z))}2负极c(c)̲2(z(z))]1+c(c)(z(z))d日z(z)负极12πC类(f)j个(z(z))c(c)̲(z(z))̲(z(z)){1+̲(z(z))}[{1+̲(z(z))}2负极c(c)̲2(z(z))]d日z(z)负极12πC类(f)j个(z(z))c(c){1+z(z)̲(z(z))负极z(z)(z(z))̲(z(z))负极z(z)2(z(z))̲2(z(z))}1+̲(z(z))̲(z(z))z(z){1+c(c)(z(z))}[{1+̲(z(z))}2负极c(c)̲2(z(z))]d日z(z)+12πC类(f)j个(z(z))c(c)(z(z))z(z)负极c(c)z(z)(z(z))̲(z(z))d日z(z)
和渐近协方差函数
覆盖(cov)第页(X(X)(f)j个,X(X)(f)第页)=负极12π2C类1C类2(f)j个(z(z)1)(f)第页(z(z)2)c(c)(z(z)1)(z(z)2)[1+c(c){(z(z)1)+(z(z)2)}+c(c)(c(c)负极1)(z(z)1)(z(z)2)]2d日z(z)1d日z(z)2+κ负极14π2C类1C类2(f)j个(z(z)1)(f)第页(z(z)2)c(c)̲(z(z)1)̲(z(z)2){1+̲(z(z)1)}2{1+̲(z(z)2)}2d日z(z)1d日z(z)2负极κ负极|ψ|2负极24π2C类1C类2(f)j个(z(z)1)(f)第页(z(z)2)V(V){c(c),(z(z)1),(z(z)2)}d日z(z)1d日z(z)2,
在哪儿ψ=E类[X(X)1负极E类[X(X)1]]2/E类|X(X)1负极E类[X(X)1]|21在真实情况下,
V(V){c(c),(z(z)1),(z(z)2)}=c(c)(z(z)1)̲(z(z)1)+z(z)1(z(z)1)̲(z(z)1)+z(z)1(z(z)1)̲(z(z)1)×(z(z)2)̲(z(z)2)+z(z)2(z(z)2)̲(z(z)2)+z(z)2(z(z)2)̲(z(z)2)
对于j个,k个= 1, 2,…,第页和轮廓C类是闭合的,并在复合平面的正方向上取下,每一个都围绕着如果c(c)(·).
什么时候?{X(X)j个}是复杂变量,假设ψ=E类[X(X)1负极E类[X(X)1]]2/E类|X(X)1负极E类[X(X)1]|2对于= 1, 2,…,第页,渐近平均值为
E类c(c)[X(X)(f)j个]=E类第页[X(X)(f)j个]负极12πC类(f)(z(z))z(z)̲(z(z)){1+̲(z(z))}{z(z)+z(z)̲(z(z))负极c(c)}负极c(c)|ψ|22(z(z)){1+c(c)(z(z))}[{1+c(c)(z(z))}2负极c(c)|ψ|22(z(z))]×负极c(c){1+̲(z(z))}[z(z){1+̲(z(z))}+1负极c(c)]z(z)̲(z(z))([z(z){1+̲(z(z))}负极c(c)]2负极c(c))d日z(z),
渐近方差为
覆盖(cov)c(c)(X(X)(f)j个,X(X)(f)第页)=覆盖(cov)第页(X(X)(f)j个,X(X)(f)第页)+14π2C类1C类2(f)j个(z(z)1)(f)第页(z(z)2)c(c)(z(z)1)(z(z)2)d日z(z)1d日z(z)2[1+c(c){(z(z)1)+(z(z)2)}+c(c)(c(c)负极1)(z(z)1)(z(z)2)]2负极|ψ|24π2C类1C类2(f)j个(z(z)1)(f)第页(z(z)2)c(c)(z(z)1)(z(z)2)d日z(z)1d日z(z)2[{1+c(c)(z(z)1)}{1+c(c)(z(z)2)}负极c(c)|ψ|2(z(z)1)(z(z)2)]2.
特别是当X(X)j个N个(μ,σ2),=1,2,,第页,j个=1,2,,n个,我们有κ≡3.

备注1

尽管上面给出的渐近平均值和方差看起来很复杂,但它们很容易计算。极限光谱分布(z(z))和(z(z))由蒋的定理2有明确的表达式(2004). 例如,(z(z))=[1负极c(c)负极z(z)+{(z(z)负极1负极c(c))2负极4c(c)}]/(2c(c)z(z))对于c(c)<1,在这里我们选择ℑ(z(z))对于ℑ>0z(z)> 0. 实际上,可以通过以下公式进行估算(1/第页)信托收据(B类n个负极z(z)第页)负极1(1/n个)信托收据(B类̲n个负极z(z)n个)负极1分别是。此外,根据江的定理2,估计值是一致的(2004)或者这篇论文的证明。同样,(z(z))̲(z(z))也可以通过以下公式进行估算(1/第页)信托收据(B类n个负极z(z)第页)负极2(1/n个)信托收据(B类̲n个负极z(z)n个)负极2分别是。

3.2. 一种特殊的相关结构

我们现在考虑第页-维随机向量x个=(X(X)1,X(X)2,,X(X)第页)*其元素具有特殊的相关结构,如下所示:
X(X)=Z轴+σu个,   =1,2,,第页,
(3.1)
哪里{Z轴:=1,2,,第页}是独立的随机变量,与随机变量无关u个.在这里σ,=1,2,,第页,是确定性常数。
来自模型(3.1),可以看出X(X)X(X)j个由于常见的随机部分而相互关联u个,及其相关性ρj个
ρj个=σσj个无功功率,无功功率(u个){无功功率,无功功率(Z轴)+σ2无功功率,无功功率(u个)}{无功功率,无功功率(Z轴j个)+σj个2无功功率,无功功率(u个)},
(3.2)
其中,var(·)表示括号中随机变量的方差。
对于目标随机向量x个,我们有可用的样品x个1,x个2,,x个n个具有x个=(X(X)1,X(X)2,,X(X)第页)*= 1, 2,…,n个.让=(X(X)1,X(X)2,,X(X)n个)*,= 1, 2,…,第页然后是模型的向量形式(3.1)样品为
=z(z)+σu个,   =1,2,,第页,
(3.3)
哪里z(z)=(Z轴1,Z轴2,,Z轴n个)*u个=(u个1,u个2,,u个n个)*.

在下面的定理中,我们发展了随机向量的样本协方差矩阵的LSS的CLTx个在表达式中定义的(3.1).

定理2
假设{X(X)j个:=1,2,,第页j个=1,2,,n个}满足模型(3.3)具有啜饮1第页E类|X(X)1|4<E类|Z轴1|2=E类|u个|2, ∀= 1, 2,…,第页.让第页/n个c(c)∈(0,∞)为n个→ ∞ κ=第页(1/第页)Σ=1第页E类|Z轴1负极E类[Z轴1]|4/(E类|Z轴1负极E类[Z轴1]|2)2.假设σ,=1,2,,第页,满足
=1第页σ2σ2,=1第页|σ|=o个(n个),=1第页σ4=o个(1).
(3.4)
(f)1,(f)2,,(f)第页是上的函数R(右)关于包含的开区间的分析
[(1负极c(c))2,(1+c(c))2].
然后是随机向量(¦Β(f)1(λ)d日G公司n个(λ),(f)2(λ)d日G公司n个(λ),,(f)第页(λ)d日G公司n个(λ))弱收敛到高斯向量(X(X)(f)1,X(X)(f)2,,X(X)(f)第页).渐近平均值为
E类˜[X(X)(f)j个]=E类[X(X)(f)j个]负极12πC类(f)j个(z(z))σ2_(z(z))_(z(z)){_(z(z))负极2}{1+_(z(z))}{1+_(z(z))负极σ22_(z(z))}d日z(z)+12πC类(f)j个(z(z))σ2_(z(z)){1+_(z(z))}2 d日z(z)负极12πC类(f)j个(z(z))σ2_(z(z))[{1+2_(z(z))}{1+_(z(z))负极σ22_(z(z))}负极_(z(z)){1+_(z(z))}{1负极2σ2_(z(z))}]{1+_(z(z))负极σ2_2(z(z))}{1+_(z(z))+σ2_(z(z))}d日z(z),
哪里E类[X(X)(f)j个]等于渐近平均值E类第页[X(X)(f)j个](或E类c(c)[X(X)(f)j个])在定理1中定义。以及渐近协方差覆盖(cov)(X(X)(f)j个,X(X)(f)第页)与渐近协方差相同覆盖(cov)第页(X(X)(f)j个,X(X)(f)第页)(或覆盖(cov)c(c)(X(X)(f)j个,X(X)(f)第页))在定理1中导出。

备注2

例如,σ=1/n个,= 1, 2,…,第页,满足条件(3.4)从定理2中,此相关结构的LSS的渐近性质不同于定理1中研究的独立情况的渐近性质。渐近方差是相同的;然而,与独立情况相比,相关情况的渐近平均值增加了三项。此外,作为σ=0,定理2中渐近平均的附加三项消失,因此它与定理1的结果相同。

3.3. 两种应用

在本节中,我们提供了样本相关矩阵LSS的两个统计应用。它们是高维随机向量的独立性检验,也是因子模型中因子负荷或因子的等价性检验。

3.3.1. 独立性测试

对于第页向量中分组的随机变量,我们的目标是测试以下假设:
H(H)10:X(X)1,,X(X)第页是独立的H(H)1:X(X)1,,X(X)第页依赖于.
(3.5)
对于这个独立性测试,我们充分利用了LSS(2.2)基于样本相关矩阵x个有可用的n个样品x个1,x个2,,x个n个如前一节所述,在零假设下B类n个是Marcenko–Pastur定律。我们用这一点来暗示应用LSS时的独立性。为了简单起见,我们选择(f)(x个)=x个2在方程式中(2.2).

3.3.2. 因子载荷或因子等效性测试

因子模型允许降维,是一种有用的统计工具,相当于主成分分析(例如,参见Fan. (2013))。许多经济分析很自然地符合这个框架。例如,在金融文献中,套利定价理论假设可以使用少量因素来解释大量资产回报。

由于很难找到未知因子和载荷的一致估计量,本节建议使用样本相关矩阵的拟议LSS直接测试因子或载荷的等效性,而不需要一致估计量。

考虑因素模型
X(X)t吨=λT型如果t吨+εt吨,   =1,2,,第页,t吨=1,2,,n个,
(3.6)
哪里λ是一个第页-尺寸系数载荷,如果t吨是相应的第页-尺寸公因数,{εt吨:=1,2,,第页t吨=1,2,,n个}是特殊组件,它们独立于= 1, 2,…,第页t吨= 1, 2,…,n个.
一个目标是测试
H(H)20:λ1=λ2==λ第页.
(3.7)
提出的统计是基于样本相关矩阵的LSSB类n个.低于H(H)20,型号(3.6)减少到
X(X)t吨=λT型如果t吨+εt吨.
(3.8)
来自模型(3.8),我们有
X(X)t吨负极X(X)¯t吨=εt吨负极ε¯t吨,
哪里X(X)¯t吨=(1/N个)Σ=1N个X(X)t吨ε¯t吨=(1/N个)Σ=1N个εt吨.

有鉴于此,在零假设下H(H)20,的样本相关矩阵x个=(X(X)1,X(X)2,,X(X)n个)T型与的相同ε=(ε1,ε2,,εn个)T型.由于ɛ独立,LSS(2.2)遵循定理1中的渐近分布。这就是为什么所建议的统计数据在这种情况下有效。

另一个目标是测试
H(H)30:如果1=如果2==如果n个.
(3.9)
类似地,我们还提出了基于样本相关矩阵的LSSB类n个.低于H(H)30,型号(3.6)减少到
X(X)t吨=λT型如果+εt吨,
(3.10)
根据方程式(3.10),我们有
X(X)t吨负极X(X)¯=εt吨负极ε¯,
哪里X(X)¯=(1/n个)Σt吨=1n个X(X)t吨ε¯=(1/n个)Σ=1n个εt吨.

然后,在虚假设下H(H)30,的样本相关矩阵x个~=(X(X)1t吨,X(X)2t吨,,X(X)第页t吨)T型与的相同ε~=(ε1t吨,ε2t吨,,ε第页t吨)T型。这一点构成了建议的统计(2.2)在这种情况下适用且有用。为了简单起见,我们还选择(f)(x个)=x个2在方程式中(2.2).

我们考虑交互因子模型的一个特殊示例(3.6)表单的
X(X)t吨=α+(f)t吨+εt吨,   =1,2,,第页,  t吨=1,2,,n个,
(3.11)
哪里α是与节相对应的特定固定效果对于= 1, 2,…,n个(f)t吨=(f)(t吨/T型)是一个趋势函数,{εt吨:=1,2,,第页t吨=1,2,,n个}是特殊组件,它们独立于= 1, 2,…,第页t吨= 1, 2,…,n个.
对于模型(3.11),我们考虑零假设检验
H(H)40:α1=α2==α第页.
(3.12)
我们可以提出与测试相同的统计数据(3.7).

4.有限样本分析

目前正在研究所提出的LSS在两种应用中的有限样本性能。我们展示了该测试的经验规模和威力。

4.1. 经验规模和权力

首先,我们介绍了计算经验大小和幂的方法。由于拟议测试统计量的渐近分布R(右)n个是一个标准正态分布,计算经验大小和幂并不困难。z(z)1负极α/2z(z)α/2成为100(1负极12α)%-和12α-标准正态分布的分位数。使用K(K)在零假设下模拟数据集的复制,我们将经验大小计算为
α^={Ş属于R(右)n个H(H)z(z)1负极α/2R(右)n个H(H)z(z)α/2}K(K),
(4.1)
哪里R(右)n个H(H)表示测试统计值R(右)n个基于零假设下模拟的数据。
在我们的模拟中,我们选择K(K)=1000作为复制数。显著性水平为α= 0.05. 类似地,经验功率计算如下
β^={Ş属于R(右)n个A类z(z)1负极α/2R(右)n个A类z(z)α/2}K(K),
(4.2)
哪里R(右)n个A类表示测试统计值R(右)n个基于替代假设下模拟的数据。

4.2. 计算方面

在计算公式中的经验大小和经验幂的过程中(4.1)(4.2)我们需要分别计算定理1中导出的渐近平均值和方差。由于计算相对复杂,我们提供了关键步骤的摘要,以说明如何进行计算。所涉及的代码功能显示在附录A在线补充文件。

计算渐近均值和方差函数的数值涉及三个关键步骤。它们概括如下。

  • 步骤1:

    极限谱分布(z(z))和(z(z))被估值器取代^(z(z))=(1/第页)信托收据(B类n个负极z(z)第页)负极1̲^(z(z))=(1/n个)信托收据(B类̲n个负极z(z)n个)负极1(根据蒋的说法,估计值是一致的(2004)或本文中的证明)。

  • 第二步:

    的导数(z(z))̲(z(z))估计依据为^(z(z))=(1/第页)信托收据(B类n个负极z(z)第页)负极2̲^(z(z))=(1/n个)信托收据(B类̲n个负极z(z)n个)负极2分别(类似于步骤1)。

  • 第三步:

    对于渐近平均值,我们让z(z)=第页exp(i)θ)通过极坐标变换,然后替换轮廓C类通过圆圈{(第页,θ):θ∈ [0, 2π]},包括轮廓C类内部。渐近平均值中的积分可以通过MATLAB函数quad进行数值计算。类似地,为了计算渐近方差,极坐标变换z(z)1=第页1经验(θ1)z(z)2=第页2经验(θ2)以及两个轮廓C类1C类2然后被圆取代O(运行)1:={(第页1,θ):θ[0,2π]}O(运行)2:={(第页2,θ):θ[0,2π]}分别,其中O(运行)1O(运行)2包括C类1C类2分别是。渐近方差中涉及的二重积分可以用MATLAB函数dblquad进行模拟。

  • 第4步:

    步骤1-3的实施在第节中实现4.3通过中的代码函数附录A在线补充材料。

4.3. 实施示例

4.3.1. 独立性测试

首先,我们生成数据x个=(X(X)1,X(X)2,,X(X)第页)具有n个随机抽样x个1,x个2,,x个n个在以下数据生成过程中。x个=T型z(z),其中z(z)=(Z轴1,Z轴2,,Z轴第页)T型用第一个[第页/2] 组件(Z轴1,Z轴2,,Z轴[第页/2])由标准正态分布和其余分量生成(Z轴[第页/2]+1,,Z轴[第页/2]+2,,,Z轴第页)由gamma(1,1)生成,其中[] ⩽表示的最大整数. The第页×第页确定性矩阵T型在以下场景中生成:

  • a。

    独立案例,T型=第页,其中第页是单位矩阵;

  • b。

    从属情况1,T型=第页+(1/n个)u个v(v)T型,其中u个v(v)第页×1随机向量,其元素由标准正态分布生成;

  • c。

    从属情况2,T型=第页+d日e(电子)T型+e(电子)d日T型,其中d日=(0.5,0,0,,0)T型是一个第页×1向量,第一个元素为0.5,其余元素为0,以及e(电子)是一个第页×1向量,其元素均为1。

表中列出了与独立案例相对应的经验大小1,这表明,作为一对(n个,第页)共同增加时,尺寸接近真实值0.05。表中列出了两种相依情况1和2下的经验功率2分别是。权力倾向于1,如(n个,第页)增加,说明了有限样本的适用性和所提出的测试统计量的有效性。

表1。

独立测试:大小(半伽马)

n个以下c值的结果:
0.20.40.60.812
200.02480.03100.03760.03660.03740.0448
300.03600.03760.04400.04000.04160.0430
400.03600.04240.04460.04520.04360.0492
500.04100.04820.04840.05120.04400.0492
600.04280.04860.04480.04820.05160.0526
n个以下c值的结果:
0.20.40.60.812
200.02480.03100.03760.03660.03740.0448
300.03600.03760.04400.04000.04160.0430
400.03600.04240.04460.04520.04360.0492
500.04100.04820.04840.05120.04400.0492
600.04280.04860.04480.04820.05160.0526
表1。

独立测试:大小(半伽马)

n个以下c值的结果:
0.20.40.60.812
200.02480.03100.03760.03660.03740.0448
300.03600.03760.04400.04000.04160.0430
400.03600.04240.04460.04520.04360.0492
500.04100.04820.04840.05120.04400.0492
600.04280.04860.04480.04820.05160.0526
n个以下c值的结果:
0.20.40.60.812
200.02480.03100.03760.03660.03740.0448
300.03600.03760.04400.04000.04160.0430
400.03600.04240.04460.04520.04360.0492
500.04100.04820.04840.05120.04400.0492
600.04280.04860.04480.04820.05160.0526
表2。

独立测试:电源(+(1/n个)u个第页v(v)第页*)

n个以下c值的结果:
0.20.40.60.812
100.16400.29020.47040.64040.76820.9866
200.40920.73420.91140.98160.99521
300.62440.93840.99420.999811
400.80760.98900.9994111
500.90220.99861111
n个以下c值的结果:
0.20.40.60.812
100.16400.29020.47040.64040.76820.9866
200.40920.73420.91140.98160.99521
300.62440.93840.99420.999811
400.80760.98900.9994111
500.90220.99861111
表2。

独立测试:电源(+(1/n个)u个第页v(v)第页*)

n个以下c值的结果:
0.20.40.60.812
100.16400.29020.47040.64040.76820.9866
200.40920.73420.91140.98160.99521
300.62440.93840.99420.999811
400.80760.98900.9994111
500.90220.99861111
n个以下c值的结果:
0.20.40.60.812
100.16400.29020.47040.64040.76820.9866
200.40920.73420.91140.98160.99521
300.62440.93840.99420.999811
400.80760.98900.9994111
500.90220.99861111
表3。

独立测试:电源(= 0.5)

(n个,c(c))以下d值的结果:
0.10.20.30.40.50.60.70.8
(20, 0.4)0.29160.63680.63100.80820.89300.93180.95060.9534
(20, 0.8)0.24160.37000.58060.66620.78080.84520.86920.9066
(30, 0.4)0.31020.69160.93260.96680.97840.98840.98920.9928
(30, 0.8)0.25800.63840.78280.90480.94440.96220.98360.9902
(40, 0.4)0.70000.88260.97620.98740.99740.99760.99880.9996
(40, 0.8)0.40800.76280.92840.97300.98700.99440.99840.9994
(n个,c(c))以下d值的结果:
0.10.20.30.40.50.60.70.8
(20,0.4)0.29160.63680.63100.80820.89300.93180.95060.9534
(20, 0.8)0.24160.37000.58060.66620.78080.84520.86920.9066
(30, 0.4)0.31020.69160.93260.96680.97840.98840.98920.9928
(30, 0.8)0.25800.63840.78280.90480.94440.96220.98360.9902
(40,0.4)0.70000.88260.97620.98740.99740.99760.99880.9996
(40, 0.8)0.40800.76280.92840.97300.98700.99440.99840.9994
表3。

独立测试:电源(= 0.5)

(n个,c(c))以下d值的结果:
0.10.20.30.40.50.60.70.8
(20, 0.4)0.29160.63680.63100.80820.89300.93180.95060.9534
(20, 0.8)0.24160.37000.58060.66620.78080.84520.86920.9066
(30,0.4)0.31020.69160.93260.96680.97840.98840.98920.9928
(30, 0.8)0.25800.63840.78280.90480.94440.96220.98360.9902
(40, 0.4)0.70000.88260.97620.98740.99740.99760.99880.9996
(40, 0.8)0.40800.76280.92840.97300.98700.99440.99840.9994
(n个,c(c))以下d值的结果:
0.10.20.30.40.50.60.70.8
(20, 0.4)0.29160.63680.63100.80820.89300.93180.95060.9534
(20, 0.8)0.24160.37000.58060.66620.78080.84520.86920.9066
(30, 0.4)0.31020.69160.93260.96680.97840.98840.98920.9928
(30, 0.8)0.25800.63840.78280.90480.94440.96220.98360.9902
(40, 0.4)0.70000.88260.97620.98740.99740.99760.99880.9996
(40, 0.8)0.40800.76280.92840.97300.98700.99440.99840.9994

4.3.2. 因子载荷或因子的等效性测试

至于等效性测试(3.7)对于因子载荷,我们生成因子和特殊成分的数据,如下所示。特殊成分{εt吨:=1,2,,第页t吨=1,2,,n个}由标准正态分布和因子生成如果t吨是自动累进AR(1)过程,即。
如果t吨=如果t吨负极1+ηt吨,   t吨=1,2,,n个,
哪里=0.2和{ηt吨}独立于标准正态分布生成。初始值如果0=0。因子的数量在模拟中取2和3的值。

因子载荷在以下两种情况下生成:

  • a。

    DGP(1),λ=λ对于= 1, 2,…,第页,其中λ由标准正态分布生成;

  • b。

    DGP(2),λ=λ对于= 1, 2,…,[dp(差分)],其中d日= 0.1;λj个独立于标准正态分布生成j个= [dp(差分)],[dp(差分)]+1,…,第页.

对于本试验,DGP(1)下的经验尺寸如表所示4而DGP(2)下的经验功率如表所示56.作为(n个,第页)联合增长,经验规模趋于5%的名义水平。功率表明,我们的测试统计数据可以有效地捕捉一些局部替代方案。作为第页=30,在替代假设下有三种不同的因子载荷,可以通过检验统计量加以区分。

表4。

因素负荷试验:尺寸

n个以下c值的结果:
0.20.40.60.81
200.02340.03200.03480.03240.0346
300.03280.03740.03760.03860.0404
400.03380.03860.04620.04440.0454
500.03480.04400.04560.04600.0424
n个以下c值的结果:
0.20.40.60.81
200.02340.03200.03480.03240.0346
300.03280.03740.03760.03860.0404
400.03380.03860.04620.04440.0454
500.03480.04400.04560.04600.0424
表4。

因素负荷试验:尺寸

n个以下c值的结果:
0.20.40.60.81
200.02340.03200.03480.03240.0346
300.03280.03740.03760.03860.0404
400.03380.03860.04620.04440.0454
500.03480.04400.04560.04600.0424
n个以下c值的结果:
0.20.40.60.81
200.02340.03200.03480.03240.0346
300.03280.03740.03760.03860.0404
400.03380.03860.04620.04440.0454
500.03480.04400.04560.04600.0424
表5。

因素负荷试验:功率(第页=2和不同因素荷载n个-方向)

(n个,第页)以下d值的结果:
0.10.20.30.40.50.60.70.80.9
(10, 10)0.06900.10960.14460.18120.20700.22560.24860.25260.2394
(20, 10)0.07260.11000.15360.18860.21800.23920.26460.26820.2700
(30, 10)0.07420.11340.16240.19640.22140.24320.25860.26340.2782
(20,20)0.11000.20700.30680.39640.46160.52160.55780.60920.6264
(30, 20)0.10100.18300.28840.37440.44640.49540.54860.60620.6126
(30, 30)0.14120.26240.40880.52660.61720.70040.74640.80500.8368
(n个,第页)以下d值的结果:
0.10.20.30.40.50.60.70.80.9
(10, 10)0.06900.10960.14460.18120.20700.22560.24860.25260.2394
(20, 10)0.07260.11000.15360.18860.21800.23920.26460.26820.2700
(30, 10)0.07420.11340.16240.19640.22140.24320.25860.26340.2782
(20,20)0.11000.20700.30680.39640.46160.52160.55780.60920.6264
(30, 20)0.10100.18300.28840.37440.44640.49540.54860.60620.6126
(30, 30)0.14120.26240.40880.52660.61720.70040.74640.80500.8368
表5。

因素负荷试验:功率(第页=2和不同因素荷载n个-方向)

(n个,第页)以下d值的结果:
0.10.20.30.40.50.60.70.80.9
(10, 10)0.06900.10960.14460.18120.20700.22560.24860.25260.2394
(20, 10)0.07260.11000.15360.18860.21800.23920.26460.26820.2700
(30,10)0.07420.11340.16240.19640.22140.24320.25860.26340.2782
(20, 20)0.11000.20700.30680.39640.46160.52160.55780.60920.6264
(30, 20)0.10100.18300.28840.37440.44640.49540.54860.60620.6126
(30, 30)0.14120.26240.40880.52660.61720.70040.74640.80500.8368
(n个,第页)以下d值的结果:
0.10.20.30.40.50.60.70.80.9
(10,10)0.06900.10960.14460.18120.20700.22560.24860.25260.2394
(20, 10)0.07260.11000.15360.18860.21800.23920.26460.26820.2700
(30, 10)0.07420.11340.16240.19640.22140.24320.25860.26340.2782
(20, 20)0.11000.20700.30680.39640.46160.52160.55780.60920.6264
(30、20)0.10100.18300.28840.37440.44640.49540.54860.60620.6126
(30, 30)0.14120.26240.40880.52660.61720.70040.74640.80500.8368
表6。

因素负荷试验:功率(第页=3,以及n个-方向)

(n个,第页)以下d值的结果:
0.10.20.30.40.50.60.70.80.9
(10, 10)0.09420.16480.20740.24180.28540.29560.28340.29640.2920
(20, 10)0.16180.29700.40780.48620.56420.60440.64660.68540.6826
(30, 10)0.22020.42300.56460.65780.73180.80280.83420.86120.8766
(20, 20)0.16920.28160.42520.52260.59980.65180.70260.74060.7438
(30, 20)0.20680.42280.57740.70240.78080.84780.88120.90740.9348
(30, 30)0.19540.40520.57700.69180.77680.83720.88480.90920.9320
(n个,第页)以下d值的结果:
0.10.20.30.40.50.60.70.80.9
(10, 10)0.09420.16480.20740.24180.28540.29560.28340.29640.2920
(20, 10)0.16180.29700.40780.48620.56420.60440.64660.68540.6826
(30, 10)0.22020.42300.56460.65780.73180.80280.83420.86120.8766
(20, 20)0.16920.28160.42520.52260.59980.65180.70260.74060.7438
(30, 20)0.20680.42280.57740.70240.78080.84780.88120.90740.9348
(30, 30)0.19540.40520.57700.69180.77680.83720.88480.90920.9320
表6。

因素负荷试验:功率(第页=3,以及n个-方向)

(n个,第页)以下d值的结果:
0.10.20.30.40.50.60.70.80.9
(10, 10)0.09420.16480.20740.24180.28540.29560.28340.29640.2920
(20, 10)0.16180.29700.40780.48620.56420.60440.64660.68540.6826
(30, 10)0.22020.42300.56460.65780.73180.80280.83420.86120.8766
(20, 20)0.16920.28160.42520.52260.59980.65180.70260.74060.7438
(30, 20)0.20680.42280.57740.70240.78080.84780.88120.90740.9348
(30, 30)0.19540.40520.57700.69180.77680.83720.88480.90920.9320
(n个,第页)以下d值的结果:
0.10.20.30.40.50.60.70.80.9
(10, 10)0.09420.16480.20740.24180.28540.29560.28340.29640.2920
(20, 10)0.16180.29700.40780.48620.56420.60440.64660.68540.6826
(30, 10)0.22020.42300.56460.65780.73180.80280.83420.86120.8766
(20, 20)0.16920.28160.42520.52260.59980.65180.70260.74060.7438
(30, 20)0.20680.42280.57740.70240.78080.84780.88120.90740.9348
(30, 30)0.19540.40520.57700.69180.77680.83720.88480.90920.9320

同样,对于等效性测试(3.9)对于因子,特质成分的生成方式与上述测试相同。因子加载{λ}独立于标准正态分布生成。

因子在以下两种情况下产生:

  • a。

    DGP(3),如果t吨=如果对于t吨= 1, 2,…,n个,其中如果独立于标准正态分布生成;

  • b。

    DGP(4),如果t吨=如果对于= 1, 2,…,[dn(数字网络)],其中d日= 0.1;如果t吨独立于标准正态分布生成t吨= [dn(数字网络)],[dn(数字网络)]+1,…,n个.

DGP(3)下的经验大小如表所示7而DGP(4)下的经验功率如表所示89尺寸和功率的行为与因子负载测试中讨论的相似。

表7。

因素测试:尺寸

n个以下c值的结果:
0.20.40.60.81
200.02860.03300.03480.03840.0390
300.03220.03520.03960.03980.0412
400.03220.03620.04100.04200.0414
500.03600.04420.04620.04560.0440
n个以下c值的结果:
0.20.40.60.81
200.02860.03300.03480.03840.0390
300.03220.03520.03960.03980.0412
400.03220.03620.04100.04200.0414
500.03600.04420.04620.04560.0440
表7。

因素测试:尺寸

n个以下c值的结果:
0.20.40.60.81
200.02860.03300.03480.03840.0390
300.03220.03520.03960.03980.0412
400.03220.03620.04100.04200.0414
500.03600.04420.04620.04560.0440
n个以下c值的结果:
0.20.40.60.81
200.02860.03300.03480.03840.0390
300.03220.03520.03960.03980.0412
400.03220.03620.04100.04200.0414
500.03600.04420.04620.04560.0440
表8。

因素测试:功率(第页=2,不同的因素在n个-方向)

(n个,第页)以下d值的结果:
0.10.20.30.40.50.60.70.80.9
(10, 10)0.06960.11700.15280.18220.19940.22480.22720.25300.2474
(20, 10)0.11460.20160.30240.36840.43860.48500.53160.56060.5710
(30, 10)0.15820.29700.42600.53380.60880.68500.71920.75640.7734
(20, 20)0.10240.20380.30020.39180.46120.52140.55480.59880.6158
(30, 20)0.13540.28960.41300.54920.63400.71160.75740.80960.8310
(30, 30)0.13580.28100.40580.53040.62680.69880.75940.80940.8302
(n个,第页)以下d值的结果:
0.10.20.30.40.50.60.70.80.9
(10, 10)0.06960.11700.15280.18220.19940.22480.22720.25300.2474
(20, 10)0.11460.20160.30240.36840.43860.48500.53160.56060.5710
(30, 10)0.15820.29700.42600.53380.60880.68500.71920.75640.7734
(20, 20)0.10240.20380.30020.39180.46120.52140.55480.59880.6158
(30, 20)0.13540.28960.41300.54920.63400.71160.75740.80960.8310
(30, 30)0.13580.28100.40580.53040.62680.69880.75940.80940.8302
表8。

因素测试:功率(第页=2,不同的因素在n个-方向)

(n个,第页)以下d值的结果:
0.10.20.30.40.50.60.70.80.9
(10,10)0.06960.11700.15280.18220.19940.22480.22720.25300.2474
(20, 10)0.11460.20160.30240.36840.43860.48500.53160.56060.5710
(30, 10)0.15820.29700.42600.53380.60880.68500.71920.75640.7734
(20, 20)0.10240.20380.30020.39180.46120.52140.55480.59880.6158
(30, 20)0.13540.28960.41300.54920.63400.71160.75740.80960.8310
(30, 30)0.13580.28100.40580.53040.62680.69880.75940.80940.8302
(n个,第页)以下d值的结果:
0.10.20.30.40.50.60.70.80.9
(10, 10)0.06960.11700.15280.18220.19940.22480.22720.25300.2474
(20, 10)0.11460.20160.30240.36840.43860.48500.53160.56060.5710
(30, 10)0.15820.29700.42600.53380.60880.68500.71920.75640.7734
(20, 20)0.10240.20380.30020.39180.46120.52140.55480.59880.6158
(30, 20)0.13540.28960.41300.54920.63400.71160.75740.80960.8310
(30, 30)0.13580.28100.40580.53040.62680.69880.75940.80940.8302
表9。

因素测试:功率(第页=3,不同的因素在n个-方向)

(n个,第页)以下d值的结果:
0.10.20.30.40.50.60.70.80.9
(10, 10)0.09960.15900.20880.25660.26880.29100.30040.29600.2930
(20, 10)0.16060.29960.39680.49840.55560.60160.62980.66320.6784
(30, 10)0.22720.41000.55020.65680.73340.79120.82980.86200.8748
(20,20)0.15540.29880.43580.52520.59060.65920.70100.73360.7584
(30, 20)0.21380.41660.57620.70240.78800.85060.88260.91200.9256
(30, 30)0.20740.40280.56600.69600.78500.83620.88420.92100.9304
(n个,第页)以下d值的结果:
0.10.20.30.40.50.60.70.80.9
(10, 10)0.09960.15900.20880.25660.26880.29100.30040.29600.2930
(20,10)0.16060.29960.39680.49840.55560.60160.62980.66320.6784
(30, 10)0.22720.41000.55020.65680.73340.79120.82980.86200.8748
(20, 20)0.15540.29880.43580.52520.59060.65920.70100.73360.7584
(30, 20)0.21380.41660.57620.70240.78800.85060.88260.91200.9256
(30,30)0.20740.40280.56600.69600.78500.83620.88420.92100.9304
表9。

因素测试:功率(第页=3,不同的因素在n个-方向)

(n个,第页)以下d值的结果:
0.10.20.30.40.50.60.70.80.9
(10, 10)0.09960.15900.20880.25660.26880.29100.30040.29600.2930
(20, 10)0.16060.29960.39680.49840.55560.60160.62980.66320.6784
(30, 10)0.22720.41000.55020.65680.73340.79120.82980.86200.8748
(20, 20)0.15540.29880.43580.52520.59060.65920.70100.73360.7584
(30, 20)0.21380.41660.57620.70240.78800.85060.88260.91200.9256
(30, 30)0.20740.40280.56600.69600.78500.83620.88420.92100.9304
(n个,第页)以下d值的结果:
0.10.20.30.40.50.60.70.80.9
(10,10)0.09960.15900.20880.25660.26880.29100.30040.29600.2930
(20, 10)0.16060.29960.39680.49840.55560.60160.62980.66320.6784
(30, 10)0.22720.41000.55020.65680.73340.79120.82980.86200.8748
(20, 20)0.15540.29880.43580.52520.59060.65920.70100.73360.7584
(30、20)0.21380.41660.57620.70240.78800.85060.88260.91200.9256
(30, 30)0.20740.40280.56600.69600.78500.83620.88420.92100.9304

另一个等效测试(3.12)也进行了分析。特殊成分{εt吨:=1,2,,第页t吨=1,2,,n个}独立于标准正态分布和趋势函数生成(f)t吨=t吨/n个.

具体特征α对于每个部分= 1, 2,…,第页在以下两种情况下生成:

  • a。

    DGP(5),α=α具有= 1, 2,…,第页哪里α由标准正态分布生成;

  • b。

    DGP(6),α=α具有= 1, 2,…,[dp(差分)]其中d日=0.1;αj个由标准正态分布独立生成j个= [dp(差分)],[dp(差分)]+1,…,第页.

经验大小和功率如表所示1011分别是。与因子负荷试验中的功率相比,功率相对较低。这是合理的,因为特定的特性α不受共同因素的影响。总之,在这种情况下,建议的测试在数值上运行良好。

表10。

特定特性测试:尺寸

(n个,第页)以下d值的结果:
0.10.20.30.40.50.60.70.80.9
(10, 10)0.02860.03020.02920.03180.02760.03480.03240.03440.0328
(20, 10)0.03640.03340.03500.03920.03660.04000.03600.03500.0334
(30, 10)0.03600.04240.03340.03380.03860.04000.03980.03600.0360
(20, 20)0.03720.03440.03920.03880.04020.03780.03860.04140.0392
(30, 20)0.03900.04080.03880.03560.04320.04180.04180.03900.0382
(30, 30)0.04400.04200.04340.04120.04320.03960.04340.04420.0436
(n个,第页)以下d值的结果:
0.10.20.30.40.50.60.70.80.9
(10, 10)0.02860.03020.02920.03180.02760.03480.03240.03440.0328
(20, 10)0.03640.03340.03500.03920.03660.04000.03600.03500.0334
(30, 10)0.03600.04240.03340.03380.03860.04000.03980.03600.0360
(20, 20)0.03720.03440.03920.03880.04020.03780.03860.04140.0392
(30, 20)0.03900.04080.03880.03560.04320.04180.04180.03900.0382
(30, 30)0.04400.04200.04340.04120.04320.03960.04340.04420.0436
表10。

特定特性测试:尺寸

(n个,第页)以下d值的结果:
0.10.20.30.40.50.60.70.80.9
(10, 10)0.02860.03020.02920.03180.02760.03480.03240.03440.0328
(20, 10)0.03640.03340.03500.03920.03660.04000.03600.03500.0334
(30, 10)0.03600.04240.03340.03380.03860.04000.03980.03600.0360
(20, 20)0.03720.03440.03920.03880.04020.03780.03860.04140.0392
(30, 20)0.03900.04080.03880.03560.04320.04180.04180.03900.0382
(30, 30)0.04400.04200.04340.04120.04320.03960.04340.04420.0436
(n个,第页)下列d值的结果:
0.10.20.30.40.50.60.70.80.9
(10, 10)0.02860.03020.02920.03180.02760.03480.03240.03440.0328
(20, 10)0.03640.03340.03500.03920.03660.04000.03600.03500.0334
(30, 10)0.03600.04240.03340.03380.03860.04000.03980.03600.0360
(20, 20)0.03720.03440.03920.03880.04020.03780.03860.04140.0392
(30, 20)0.03900.04080.03880.03560.04320.04180.04180.03900.0382
(30, 30)0.04400.04200.04340.04120.04320.03960.04340.04420.0436
表11。

特定特性测试:功率

(n个,第页)以下d值的结果:
0.10.20.30.40.50.60.70.80.9
(10,10)0.05600.08920.12980.16440.19980.22920.25440.27260.2822
(20, 10)0.06380.09400.12660.16700.19700.22560.23680.26640.2562
(30, 10)0.05320.08640.11580.15720.17680.20580.21500.24800.2392
(20, 20)0.07580.15340.22580.30760.37560.44280.50780.54300.5826
(30, 20)0.06440.14340.20560.27380.34040.41060.46080.50940.5396
(30, 30)0.09120.18520.29240.39460.49720.57660.65440.71020.7638
(n个,第页)以下d值的结果:
0.10.20.30.40.50.60.70.80.9
(10, 10)0.05600.08920.12980.16440.19980.22920.25440.27260.2822
(20, 10)0.06380.09400.12660.16700.19700.22560.23680.26640.2562
(30, 10)0.05320.08640.11580.15720.17680.20580.21500.24800.2392
(20, 20)0.07580.15340.22580.30760.37560.44280.50780.54300.5826
(30, 20)0.06440.14340.20560.27380.34040.41060.46080.50940.5396
(30, 30)0.09120.18520.29240.39460.49720.57660.65440.71020.7638
表11。

特定特性测试:功率

(n个,第页)以下d值的结果:
0.10.20.30.40.50.60.70.80.9
(10, 10)0.05600.08920.12980.16440.19980.22920.25440.27260.2822
(20, 10)0.06380.09400.12660.16700.19700.22560.23680.26640.2562
(30, 10)0.05320.08640.11580.15720.17680.20580.21500.24800.2392
(20, 20)0.07580.15340.22580.30760.37560.44280.50780.54300.5826
(30, 20)0.06440.14340.20560.27380.34040.41060.46080.50940.5396
(30, 30)0.09120.18520.29240.39460.49720.57660.65440.71020.7638
(n个,第页)以下d值的结果:
0.10.20.30.40.50.60.70.80.9
(10,10)0.05600.08920.12980.16440.19980.22920.25440.27260.2822
(20, 10)0.06380.09400.12660.16700.19700.22560.23680.26640.2562
(30, 10)0.05320.08640.11580.15720.17680.20580.21500.24800.2392
(20, 20)0.07580.15340.22580.30760.37560.44280.50780.54300.5826
(30, 20)0.06440.14340.20560.27380.34040.41060.46080.50940.5396
(30, 30)0.09120.18520.29240.39460.49720.57660.65440.71020.7638

5.实证应用

在这一部分中,我们分析了中国农村各城市之间的家庭收入关系。主要目标是测试他们是否独立。

数据集来自中国国家统计局和中国社会科学院进行的“农村家庭收入和支出调查”。该数据集收集于1995年,提供了中国19个省份7998户农村家庭的有用信息。

在这项研究中,我们重点测试了不同城市家庭收入的独立性。在删除了家庭收入变量缺失值或难以置信值的观察结果后,对69个城市的96户家庭进行了抽样调查。

提出的LSS适用于此独立性测试。考虑了不同数量的城市和不同数量的家庭。这个第页-表中报告了试验值12. The第页-值随着城市数量的增加而减少。这是有道理的,因为随着城市数量的增加,依赖的可能性也会增加。自从第页-数值均大于0.01,我们得出结论,不同城市的家庭收入是独立的。

表12。

第页-不同城市居民收入的独立性检验值

(第页,n个)(5, 10)(15, 20)(40, 50)(50, 60)(60、70)(69, 80)(69, 96)
第页-值0.52600.44300.56200.52900.08900.06800.0540
(第页,n个)(5, 10)(15, 20)(40, 50)(50, 60)(60, 70)(69, 80)(69, 96)
第页-值0.52600.44300.56200.52900.08900.06800.0540
表12。

第页-不同城市家庭收入的独立性检验值

(第页,n个)(5, 10)(15, 20)(40, 50)(50, 60)(60, 70)(69, 80)(69, 96)
第页-值0.52600.44300.56200.52900.08900.06800.0540
(第页,n个)(5, 10)(15, 20)(40,50)(50, 60)(60, 70)(69, 80)(69, 96)
第页-值0.52600.44300.56200.52900.08900.06800.0540

6.结论和讨论

在本文中,我们建立了一个新的样本相关矩阵LSS的CLT,其中维数为第页和样本量n个具有可比性。此外,还发展了具有特殊相关结构的高维随机向量的CLT。本文考虑了两个有用的统计应用。第一个是独立性测试第页随机变量,而第二个是因子模型中的等价性检验。与样本协方差矩阵相比,使用基于样本相关矩阵的LSS的优点是,我们不需要了解前两个矩或基本分布第页正在调查的随机变量。对提出的测试统计量的有限样本性能进行了评估。本文讨论了中国各城市家庭收入横截面独立性的实证检验。

在渐近理论方面,新发展的样本相关矩阵CLT对大维随机矩阵理论具有独立的兴趣。平移. (2014)利用基于样本协方差矩阵的最小二乘法对大量线性过程进行独立性检验。作为未来的工作,CLT将扩展到线性过程案例和其他一些相关模型。此外,我们还将研究其他一些高维设置,包括维度比第页超过样本量n个趋于∞。

鸣谢

作者感谢联合主编、副主编和两位裁判的建设性意见。第一和第四位作者得到了澳大利亚研究委员会发现拨款DP130104229和DP150101012的支持。第二和第三作者感谢新加坡政府的财政支持。

G.M.Pan获得了教育部2014-T2-2-060二级拨款和新加坡南洋理工大学教育部RG25/14一级拨款的部分支持。

工具书类

,
Z.D.公司。
西尔弗斯坦
,
J·W。
(
2004
)
大维样本协方差矩阵线性谱统计的CLT
.
安·普罗巴伯。
,
32
,
553
605
.

,
Z.G.公司。
,
平移
,
总经理。
,
西。
(
2012
)
样本相关矩阵极值特征值的Tracy-Widom定律
.
电子。J.概率。
,
17
,
1
32
.

,
T.T.公司。
,
总飞行高度。
(
2011
)
随机矩阵相干性的限制律及其在协方差结构测试和压缩传感矩阵构造中的应用
.
安。统计师。
,
39
,
1496
1525
.

,
T.T.公司。
,
,
C、。
,
H.H.公司。
(
2010
)
协方差矩阵估计的最优收敛速度
.
安。统计师。
,
38
,
2118
2144
.

风扇
,
J·Q。
,
,
年。
明切瓦
,
M。
(
2013
)
通过阈值化主正交分量进行大协方差估计(附讨论)
.
J.R.统计。Soc公司。
,
75
,
603
680
.

喇叭
,
R.编号。
约翰逊
,
C.R.公司。
(
1999
)
矩阵分析
.
剑桥
:
剑桥大学出版社
.

约翰斯通
,
国际货币基金组织。
(
2001
)
主成分分析中最大特征值的分布
.
安。统计师。
,
29
,
295
327
.

,
总飞行高度。
(
2004
)
样本相关矩阵特征值的极限分布
.
桑赫亚
,
66
,
35
48
.

莫里森
,
D.F.公司。
(
2005
)
多元统计方法
,第4版。
布鲁克斯-科尔
.

平移
,
总经理。
,
,
J。
,
Y.R.公司。
(
2014
)
测试大量高维随机向量的独立性
.
《美国统计杂志》。助理。
,
109
,
600
612
.

皮莱
,
美国。
,
J。
(
2012
)
Edge关联矩阵大学
.
安。统计师。
,
40
,
1737
1763
.

斯科特
,
J.R.公司。
(
2005
)
高维完全独立性测试
.
生物特征
,
92
,
951
956
.

附录A:主要定理的证明

我们证明的总体策略与Bai和Silverstein中的策略类似(2004). 由于Bai和Silverstein提出了许多工具(2004)不能用于样本相关矩阵的情况,因此我们开发了一些新的技术来证明定理1。其中,将柯西积分公式应用于方程(A.1)下面,为了证明紧密性,我们开发引理7在线附录B以确保B类n个高度集中在支架的两个边缘。为了将随机二次型转换为相应的迹,我们在引理5在线附录B.引理6在线附录B在我们对鞅差应用CLT之前,还建立了两个随机二次型乘积的期望的精确估计。此外,我们发现二次型的极限1T型E类[B类̲n个负极z(z)]负极11/n个独立于(z(z)),这与协方差矩阵的情况下可能获得的结果大不相同(这里是向量的所有项1为1s)。请参阅引理8有关详细信息,请参阅补充文件。

根据柯西积分公式,我们得到
¦Β(f)(x个)d日G公司(x个)=负极12πC类(f)(z(z))G公司(z(z))d日z(z)
(A.1)
对于任何累积分布函数都有效G公司和任何功能(f)包含支持度的开集的解析G公司在我们的情况下,G公司(x个):=G公司n个(x个)=第页{如果B类n个(x个)负极如果c(c)n个(x个)}.

请注意G公司n个(x个)是随机的。幸运的是,可以证明B类n个高度集中在极限Marcenko–Pastur定律支持的两个边缘如果c(c)(x个)(请参见引理7在线附录B). 然后是轮廓C类可以适当地选择。此外,正如白和西尔弗斯坦(2004),由引理7在线附录B,我们可以替换该过程{M(M)n个(z(z)),C类}通过稍作修改的过程{M(M)^n个(z(z)),C类}下面我们介绍轮廓的定义C类以及修改后的流程M(M)^n个(z(z)).让x个第页大于的任何数字(1+c(c))2.让x个为负数,如果c(c)⩾ 1. 否则我们选择x个(0,(1负极c(c))2).现在让我们C类u个={x个+v(v)0:x个[x个,x个第页]}.

然后我们定义C类+{x个+v(v):v(v)[0,v(v)0]}C类u个{x个第页+v(v):v(v)[0,v(v)0]}、和C类=C类+C类+¯。现在我们定义子集C类n个属于C类在其中M(M)n个(·)等于M(M)^n个(·).让{εn个}是一个递减到0的序列,对某些人来说是令人满意的α∈ (0, 1),εn个n个负极α.

现在我们开始
C类={x个+v(v):v(v)[n个负极1εn个,v(v)0]}   如果x个>0,{x个+v(v):v(v)[0,v(v)0]}   如果x个<0,
C类第页={x个第页+v(v):v(v)[n个负极1ε,v(v)0]}.
然后我们定义C类n个=C类C类u个C类第页.过程M(M)^n个(z(z))定义为
M(M)^n个(z(z))=M(M)n个(z(z)),   对于z(z)C类n个,M(M)n个(x个第页+n个负极1εn个),   对于x个=x个第页,v(v)[0,n个负极1εn个],M(M)n个(x个+n个负极1εn个),   对于x个=x个,v(v)[0,n个负极1εn个].

证明定理1,如Bai和Silverstein(2004),足以证明M(M)^n个(z(z))具有z(z)C类。我们在以下命题中陈述结果。

提议1
在定理1的条件下,{M(M)^n个(·)}在上形成一个紧密的序列C类+.和{M(M)^n个(·)}弱收敛到二维高斯过程{M(M)(·)}用于z(z)C类+.在实际随机变量情况下,
E类[M(M)(z(z))]=负极κ负极1c(c)̲(z(z))[z(z){1+̲(z(z))}+1负极c(c)]([z(z){1+̲(z(z))}负极c(c)]2负极c(c))[z(z){1+̲(z(z))}负极c(c)]+(κ负极|ψ|2负极2)c(c)z(z)̲(z(z))2(z(z))1+̲(z(z))[z(z){1+̲(z(z))}+1负极c(c)]([z(z){1+̲(z(z))}负极c(c)]2负极c(c))1+c(c)(z(z))+c(c)̲(z(z))[z(z){1+̲(z(z))}+1负极c(c)]̲(z(z))z(z)+z(z)̲(z(z))负极c(c)([z(z){1+̲(z(z))}负极c(c)]2负极c(c))负极c(c){1+z(z)̲(z(z))负极z(z)(z(z))̲(z(z))负极z(z)2(z(z))̲2(z(z))}1+̲(z(z))[z(z){1+̲(z(z))}+1负极c(c)]z(z){1+c(c)(z(z))}([z(z){1+̲(z(z))}负极c(c)]2负极c(c))负极c(c)(z(z))z(z)+c(c)z(z)(z(z))̲(z(z))
(A.2)
和用于z(z),z(z)j个C类 
覆盖(cov){M(M)(z(z)),M(M)(z(z)j个)}=2c(c)(z(z)1)(z(z)2)[1+c(c){(z(z)1)+(z(z)2)}+(c(c)2负极c(c))(z(z)1)(z(z)2)]2负极κ负极1c(c)̲(z(z)1)̲(z(z)2){1+̲(z(z)1)}2{1+̲(z(z)2)}2+(κ负极|ψ|2负极2)V(V){c(c),(z(z)1),(z(z)2)},
(A.3)
哪里V(V){c(c),(z(z)1),(z(z)2)}在定理1中定义。
什么时候?{X(X)j个}是复杂变量,假设ψ=E类[X(X)1负极E类[X(X)1]]2/E类|X(X)1负极E类[X(X)1]|2都是一样的= 1, 2,…,第页,渐近平均值为
(A类.2)+z(z)̲(z(z)){1+̲(z(z))}{z(z)+z(z)̲(z(z))负极c(c)}负极c(c)|ψ|22(z(z)){1+c(c)(z(z))}[{1+c(c)(z(z))}2负极c(c)|ψ|22(z(z))]×负极c(c){1+̲(z(z))}[z(z){1+̲(z(z))}+1负极c(c)]z(z)̲(z(z))([z(z){1+̲(z(z))}负极c(c)]2负极c(c)),
(A.4)
渐近方差为
(A类.)负极c(c)(z(z)1)(z(z)2)[1+c(c){(z(z)1)+(z(z)2)}+c(c)(c(c)负极1)(z(z)1)(z(z)2)]2+|ψ|2c(c)(z(z)1)(z(z)2)[{1+c(c)(z(z)1)}{1+c(c)(z(z)2)}负极c(c)|ψ|2(z(z)1)(z(z)2)]2.
(A.5)

通过在Bai和Silverstein的讨论(2004),如果命题1被证明,则定理1成立。因此,剩下的工作将用于证明命题1。在线上给出了命题1的详细证明补充材料.

本文根据牛津大学出版社标准期刊出版模式的条款出版和发行(https://academic.oup.com/journals/pages/open_access/funder_policies/chorus/standard_publication_model)