1.简介
估计相关矩阵是一项基本的统计任务。它广泛应用于生物学中的病毒序列分析和疫苗设计等领域(Dahirel等人,2011年,Quadeer等人,2014年,2018)金融领域的大型投资组合设计(Plerou等人,2002年)射电天文学中的信号检测(Leshem和van der Veen,2001年)和协作筛选(刘等人,2014,阮等,2016)等等。在经典统计设置中,变量数量有限第页和大量样本n个,样本相关矩阵表现良好,并且很好地理解了其统计特性;例如,请参见,吉希克(1939),Konishi(1979),Fang和Krishnaiah(1982),斯科特(1991),Kollo和Neudecker(1993)、和Boik(2003)然而,现代应用程序往往表现出高维度第页在许多情况下n个在这种情况下,由于统计噪声在本征谱中可见的矩阵坐标上的聚集,样本相关矩阵变得不准确(El Karoui,2009年). 这在主成分分析(PCA)中尤其重要,PCA通常涉及将数据投影到样本相关矩阵的主要特征向量上,或者在对数据进行标准化后,将其等效投影到样本协方差矩阵的特征向量上。
尽管广泛使用了样本相关矩阵,但对其高维特征谱的理论性质知之甚少。相比之下,样本协方差矩阵已经被广泛研究,并且现在有大量的文献(例如。,Yao等人(2015)). 它们的渐近性质通常是在高维环境中描述的,在这种环境中,根据随机矩阵理论,样本和变量的数量都会增加,但通常不是以相同的速度增长。样本协方差矩阵的特征值和特征向量的具体一阶和二阶结果在Bai和Silverstein(2009),Couillet和Debbah(2011年)、和Yao等人(2015).
对于高维样品的光谱相关性矩阵,当前的理论结果集中于最简单的“零模型”场景,其中假设数据是独立的。在这个零模型中,相关矩阵与来自独立同分布(i.i.d.)数据的协方差矩阵具有许多相同的渐近性质,平均值和单位方差为零。因此,经验特征值分布几乎可以肯定地收敛到Marchenko–Pastur分布(江,2004b),最大和最小特征值收敛到该分布的边(江,2004b,肖和周,2010). 此外,重标的最大和最小特征值渐近遵循Tracy–Widom定律(Bao等人,2012年,Pillai和Yin,2012年). 还导出了线性谱统计的中心极限定理(CLT)(Gao等人,2017). 另一项工作是研究样本相关矩阵的最大绝对非对角项,称为“相干性”(江,2004a,蔡和江,2011,2012),已被提议作为进行独立性测试的统计数据;另请参见Cochran等人(1995年),梅斯特和瓦莱特(2017)以及其中的参考文献。《英雄与拉贾拉特南》(2011),2012)使用相关统计来识别表现出强相关性的变量,这种方法被称为“相关性筛选”
然而,对于非平凡相关模型,样本相关矩阵谱的渐近结果非常稀少。尤其是,El Karoui(2009年)研究表明,对于谱范数有界的一类比较一般的协方差模型,样本相关矩阵的特征值与单位方差数据的样本协方差矩阵的特征值渐近重合,推广了前人的结果江(2004b)和肖和周(2010)在类似的协方差假设下,最近的工作还提出了样本相关矩阵线性谱统计的CLT(梅斯特和瓦莱特,2017年),扩展了Gao等人(2017)。一阶行为再次与样本协方差的行为一致。然而,样本相关矩阵的渐近涨落是完全不同的。
这项研究考虑了一类特殊的相关矩阵模型,即所谓的“尖峰模型”,其中假设种群协方差(或相关)矩阵的几个大或小的特征值与其他特征值很好地分离(约翰斯通,2001). 峰值协方差模型与主要协方差信息位于相对较少的特征模式中的应用相关。这些应用包括认知无线电系统中的协作信号检测(Bianchi等人,2009年),传感器网络中的故障检测(Couillet和Hachem,2013年)阵列处理中的自适应波束形成(Hachem等人,2013年,Vallet等人,2015年,Yang等人,2018)以及生物学中的蛋白质接触预测(Cocco等人,2011年,2013). 对尖峰协方差模型的谱特性进行了深入研究,建立了特征值和特征向量的一阶渐近性质和分布性质的精确分析结果;例如,请参见,Baik等人(2005年),Baik和Silverstein(2006),保罗(2007),白和姚(2008),Benaych-Georges和Nadakuditi(2011年),Couillet和Hachem(2013),Bloemendal等人(2016)。有关评论,另请参阅Couillet和Debbah(2011年,第9章)和Yao等人(2015),第11章)。
对于尖峰模型下样本相关矩阵的谱知之甚少。虽然渐近一阶行为预计与样本协方差的行为一致El Karoui(2009年)一个简单的模拟揭示了样本特征值和特征向量波动的显著差异;看见.
一个简单的模拟显示了样本协方差和样本相关性之间显著的分布差异。发件人n个=200 i.i.d.高斯样本,,协方差∑=blkdiag(∑秒,我90),其中,用于第页=0.95,我们计算样本协方差和样本相关性,并显示:(a)最大样本特征值的经验密度(归一化直方图),以及高斯分布及其估计平均值和标准偏差(实线),以及(b)投影到第二个(x轴)上的领先样本特征向量的散点图和第四(y轴)种群特征向量。在(A)和(b)的样本相关性中观察到显著的方差减少。对于(b)中不同的种群特征向量选择,观察到类似的方差减少;所选择的选择(作为第二和第四特征向量)有助于说明样本到群体特征向量投影中的附加相关性效应。
在这里,我们给出了描述这些观察到的现象的理论结果。在尖峰模型下,我们得到了样本相关矩阵的特征值和特征向量的渐近一阶和分布结果。保罗(2007)在高斯数据的特殊情况下,证明了样本协方差矩阵的定理。本质上,我们给出了样本相关矩阵的这些定理的类比,并将其扩展到非高斯数据。到一阶,特征值和特征向量与样本协方差矩阵的特征值和特点向量渐近重合;然而,它们的波动可能会有很大不同。事实上,对于两个最大样本相关特征值(定理1)以及相应特征向量的投影(定理2),渐近方差允许分解为三项。第一项是高斯数据产生的样本协方差矩阵的渐近方差;第二种方法添加由于非高斯性引起的校正,第三种方法捕获由于样本相关矩阵施加的数据归一化引起的进一步校正。(这最后相当于使用样本方差对样本协方差矩阵的条目进行归一化)。与中所示的示例一致在领先样本特征值的CLT中,样本相关特征值通常表现出较低的波动,但方差归一化除外,这与样本协方差特征值相比。如中所示,(归一化)特征向量投影通常是渐近相关的,即使是高斯数据,与保罗(2007),定理5)。
技术贡献
我们建立并扩展了一组随机矩阵工具,用于研究峰值协方差模型。配套手稿(Johnstone和Yang,2018年)[JY]对样本协方差矩阵进行了阐述和并行处理。这里需要进行重要的调整,以说明样本相关矩阵所施加的数据归一化。在我们工作的关键技术贡献中,以我们的主要定理为基础的是双线性形式和具有归一化项的矩阵二次形式的渐近一阶和分布性质,第4节.在“亚临界”特征值尖峰的情况下,使用一种新的基于正则化的证明策略来确定特征向量投影的不一致性,定理3.
M型
让是有限(4)的随机向量+δ)对一些人来说是第几刻δ> 0. 考虑分区
假设具有均值零和协方差∑,并且与,具有i.i.d成分η我均值为零,单位方差为。让是包含方差的对角矩阵ξ我,并让是的相关矩阵ξ特征分解Γ=PLP公司T型,其中P(P)= [第页1, …,第页米]是特征向量矩阵,并且L(左)=诊断(ℓ1, …,ℓ米)包含峰值相关特征值ℓ1≥ … ≥ℓ米> 0.
的相关矩阵x因此为Γx=blkdiag(Γ,我),具有特征值ℓ1, …,ℓ米、1、…、1和相应的特征向量,e(电子)米+1, …,e(电子)米+第页,其中和e(电子)j个是j个第个规范向量(即除j个th坐标)。
考虑一系列的身份证副本x,第一个n个其中填充了(米+第页) ×n个数据矩阵X(X)= (xij公司). 我们假设米是固定的,而第页和n个增加
符号
让S公司=n个−1XX年T型是样本协方差矩阵,以及是包含样本方差的对角矩阵。让为样本相关矩阵,对应ν样本特征值和特征向量满足
其中,为了以后使用,我们对。在这里是的子向量限制在第一个米协调。
对于,定义
对于索引ν,其中是一个简单的特征值集
我们指满足的特征值作为“超临界”作为“次临界”,数量称为“相变”
为了描述和解释要遵循的极限分布中的方差项,我们需要一些定义。让和表示的缩放分量ξ及其协方差;当然κii(ii)= 1. 相应的缩放四阶累积量为
什么时候?ξ是高斯的,.
相关矩阵中方差缩放的效果使用以下附加的二次函数进行描述,由定义
张量表示法
为了方便起见,可以考虑和作为四维张量阵列的项κ和分别定义一个附加数组包含个条目此外,定义作为最后,对于第二个阵列A类尺寸相同,
2.主要成果
我们的第一个主要结果在第5节,给出了样本相关矩阵最大(峰值)特征值的渐近性质:
定理1
假设模型M、,还有那个
是一个简单的特征值。按p/n→γ> 0,
哪里
居中于ρνn而不是在ρν非常重要。例如,如果,γn个=γ+一个−1/2,然后
我们看到了一个有限的转变。此外,考虑而不是,通过替换获得具有在里面(2.6),因此
中的渐近一阶极限(我),这很容易导致El Karoui(2009年),与ν从总体协方差Γ数据计算样本协方差矩阵的第h个最大特征值(保罗,2007). 这意味着,在构建R(右)样本方差的归一化对主要特征值没有影响,至少对一阶特征值没有。
然而,当观察渐近分布时,可以看到关键差异,如(ii(ii)),以及方差公式中的(2.6)特别地。这很容易解释。第一项对应于高斯协方差情况下的方差Paul(2007),对于协方差Γ的样本也是如此。第二种方法对非高斯数据的结果进行了修正,请参阅配套文章[JY]。第三项描述了样本相关矩阵的特定贡献,表示样本方差对数据归一化的影响。该项通常为负值,并在推论1如下所示,在补充材料,第1.1节.
推论1
对于ξ高斯定理1简化为
其中PD类,ν=诊断(第页ν,1, …,第页ν,米).
因此,计算样本相关性会导致渐近方差按,相对于样本协方差,其中
通常是正的,这意味着样本相关性的峰值特征值通常表现出比样本协方差的方差小的方差。事实上,如果
最后一个身份来自以下事实.条件(2.7),以及方差减少,适用于以下情况:
Γ和第页ν有非负条目,或
,或
在情况(i)中,不等式产量(2.7)注意,如果Γ具有非负项,则Perron–Frobenius定理建立了具有非负分量的特征向量的存在性ℓ1; 此外,如果Γ有正项,根据相同的定理,ℓ1是简单的并且与具有正分量的特征向量相关联。案例(ii)源自,如果ℓν>米/2,因为案例(iii)源自不等式和注意,这是相当特殊的,因为它与特征向量无关,并且它保持不变的必要条件是ℓ1≤ 2.
条件(2.7)然而,可能会失败。例如,即使米和第页∈(0,1),考虑
其中1米/2是(米/2) -所有一的维向量,对应于相同随机向量的两个负相关组。这有简单的超临界特征值ℓ1= (1 +第页)米/2和ℓ2= (1 −第页)米/2时,使用对于ν= 1, 2. 我们发现Δ2= (1 − 2第页−第页2)/2<0,尽管Δ1>0是因为ℓ1>米/2,这意味着情况(ii)。
我们现在讨论特征向量。同样,修复索引ν对于其中是Γ的简单特征值,具有相应的特征向量回忆一下是ν的第个样本特征向量R(右),并让是对应的归一化子向量,限制为第一个米协调。下一个结果确定了特征向量投影的极限和用于标准化交叉投影的CLT; 看见第6.1节和6.2.
定理2
假设模型M、,还有那个
是一个简单的特征值。然后,作为p/n→γ> 0,
哪里
具有
其中δk、 我= 1如果k=l,否则为零.
CLT导致(ii(ii))可以根据以下条目重新表述一ν我们很容易获得; 注意∑ν中有零ν第行和ν第th列。
至于特征值,定理2结果表明,样本相关矩阵的峰值特征向量与样本协方差的峰值特征矢量表现出相同的一阶行为(保罗,2007). 差异再次在于由协方差矩阵∑捕获的渐近波动ν。请注意,它被分解为对角矩阵与矩阵,其中包括(2.9)。这些术语的解释与之前在(2.6)也就是说,第一项捕获高斯-协方差模型的渐近波动(保罗,2007)第二项捕获协方差情况下非高斯性的影响[JY],第三项捕获特定于相关情况的信息,表示由于样本方差归一化而产生的波动。注意,只有第一项通常是对角的,这表明特征向量投影可能是渐近相关的,如前面所示,右侧面板。这也适用于高斯数据,在推论2下方;看见补充材料,第1.2节为了证明。我们注意到协方差矩阵的特征向量投影有一个有趣的对比(保罗,2007),仅由中的前导词描述(2.9).
推论2
对于ξGaussian定理2减少到
,
哪里
,,和∘表示哈达玛产品.
因此,对于高斯数据,渐近协方差矩阵的条目由(k个,我≠ν)
现在考虑次临界情况,其中ν是这样的.让表示相应的种群特征向量,并让和分别表示相应的样本特征值和特征向量。证据延期至第5.1节和6.3,我们得到以下结果:
定理3
假设模型M之间,还有那个
是一个简单的特征值。然后,作为p/n→γ> 0,
同样,样本特征值及其相关特征向量的一阶渐近极限与样本协方差的渐近极限相同(Paul,2007年).
回想一下,我们的高维结果假设了一个渐近状态,其中零件编号→γ>0,与经典体制相反,其中第页是固定的,并且n个→ ∞. 固定的情况第页对应于γ=0,并且很好地理解了样本相关矩阵的光谱特性;例如,吉希克(1939),Konishi(1979),Fang和Krishnaiah(1982),斯科特(1991),Kollo和Neudecker(1993)、和Boik(2003).何时γ=0,函数ρ(ℓ)还原为身份。的确,对于固定第页,没有高维分量η在模型M中,因此对ρ(ℓ,γ)在以下情况下发生γ> 0. 特别是对于固定第页我们没有对手定理3.
总之,与高维相比(零件编号→γ>0)样本协方差设置,我们对样本相关矩阵的尖峰特征值和特征向量的结果证实了一阶渐近行为确实等价于样本协方差矩阵的渐近行为,与以前的结果和观察结果一致(El Karoui,2009年,梅斯特和瓦莱特,2017年). 而特征值限制在定理1和定理3作为直接的结果El Karoui(2009年),特征向量结果定理2-(我)和定理3-(ii(ii))不要。与一阶等价物相反,特征值和特征向量的涨落都存在重要差异,如定理1-(ii(ii))和定理2-(ii(ii)).
我们用一个具有协方差的简单示例来说明这些差异,其中第页∈ [0, 1]; 也就是说,一个具有单位方差和常数相关性的模型第页跨所有组件。此外,ξ为简单起见,假设为高斯。在这种情况下,L(左)=诊断(ℓ1, 1 −第页, …, 1 −第页),其中ℓ1= 1 +第页(米−1)为超临界iff.考虑最大样本特征值在这种超临界情况下。发件人推论1,可以计算样本协方差和样本相关性的渐近方差,从而得出
分别使用,以及其中
绘制这些渐近方差与第页用于各种(γ,米). 事实上,样本相关性的方差(波动)始终小于样本协方差的方差。差异是惊人的,随着第页↗ 1.在各种选择中观察到类似的趋势米和γ,越高越明显米,虽然受变化的影响不大γ这可以从以下事实中理解:=第页(2 −第页) + (1 −第页)2米−1= 1 − (1 −第页)2(1 −米−1),
现在转到前面的样本特征向量的波动,与上面的设置相同。请注意,在推论2对于这种特殊情况,可以从P(P)T型ΓP(P)=L(左)那个
也来自推论2,归一化样本对种群特征向量投影的渐近方差,在样本协方差和样本相关情况下,计算如下
分别,其中我们记得ℓ1= 1 −第页+rm(毫米)和ℓ2= 1 −第页。这些差异在以下方面进行了数值评估对于与之前相同的参数选择,以及作为的函数第页然而,请注意,为了更好地进行视觉欣赏第页被限制在临界点以上的超临界值,因为方差在那一点爆炸。比较评估再次显示样本相关性的较小方差。这里的方差减少在图中不太明显,因为∑1,22和消失为第页→ 1.然而,该比率的表现与方差比率非常相似:
样本特征值和特征向量波动的差异对于(a)最大样本特征值,示出了非对称方差和(b)归一化样本对种群特征向量投影.
我们在结束对主要结果的讨论时,对可能的扩展进行了几点评论。我们的结果假设ℓν>1是一个简单的特征值,但对具有ℓν<1,对于具有多重性的峰值应是可能的。对于样本协方差矩阵,已获得特征值的类似结果ℓν<1,包括大于1的多重数(例如,参见白和姚(2008)),给出了期望相关矩阵得到相应结果的理由。简单样本相关矩阵特征值和特征向量结果的推广ℓν<1应该相当简单,尽管情况如此γ< 1,γ=1,和γ>1需要单独治疗。对具有多重性的峰值的扩展也是可能的,但在这种情况下,特征向量没有很好地定义,需要考虑子空间投影,需要对我们的技术论点进行非平凡的修改。
本文的其余部分进行如下。首先,在第3节,我们介绍了推导中使用的关键量和恒等式。第4节给出了双线性形式和具有归一化项的矩阵二次形式的必要渐近性质,并将相应的证明归结为补充材料,S3剖面这些性质为描述样本相关矩阵的特征值和特征向量的渐近收敛性和分布提供了基础第5节和6分别是。
如前所述,协方差矩阵的简单情况的并行处理在补充手稿[JY]。这旨在统一阐述加标协方差矩阵的已知光谱性质,作为当前工作的基准,以及对文献的额外引用。
3.前期工作
我们从块表示和样本相关矩阵的一些相关约简开始R(右)这些在协方差矩阵设置中是众所周知的。与分区一样x在模型M中,考虑
写入S公司D类=blkdiag(S公司D类1,S公司D类2),带有S公司D类1包含对应于ξ、和S公司D类2包含对应于η定义“标准化”数据矩阵和,因此
特征向量方程的这种划分,以及,收益率
根据第二个方程,。将其代入第一个方程式中,得出
因此,是的特征值,带有相关特征向量; 这是我们推导的核心。请注意定义明确,如果与R(右)22;第5.1节表明这种情况发生的概率为1n个什么时候ℓν是超临界的。此外,归一化条件,产量
用信号空间归一化特征向量表示,我们有
还要注意的是,样本到群体的内积可以重写为
在CLT结果的推导中,我们使用了一个特征向量扰动公式,其二次误差界在[JY,引理13]中给出,它本身是对保罗(2007)。这将产生密钥扩展
哪里
我们的特征值和特征向量结果的推导,如第5节和6分别取(3.10),(3.11)和(3.12)作为出发点,并依赖于关键对象的渐近性质和问ν特别是,K(K)(t吨)可以表示为随机矩阵二次型
使用伍德伯里的身份,
因此,我们的主要目标是涉及规范化数据矩阵的随机二次型和这些形式的渐近性质是我们结果的基础,下面将介绍。
4.具有规范化条目的二次型
在本节中,我们建立了该类型矩阵二次型的一阶(确定性)收敛性和CLT,其中B类n个是谱范数有界的矩阵。虽然对我们的目的至关重要,但一些技术成果可能具有独立的意义;因此,我们首先给出一般结果,然后将其应用于模型M的上下文中。
4.1. 一阶收敛
为了建立一阶收敛性,我们首先需要关于单位长度相关随机向量双线性形式的一些结果。主要技术成果(见补充材料,第3.1条)如下所示:
引理1
设B是一个n×n非随机对称矩阵是平均值为零、方差为一的身份证条目的随机向量,,、和.让和.然后,对于任意s≥1,
哪里是一个仅依赖于s的常数。
这是对Gao等人(2017年),引理5),其建立了归一化二次型的对应界。引理1导致以下一阶收敛结果:
推论3
让x,y是i的随机向量.我.d日.平均值为零的条目,方差一,,
对于某些δ> 0,和.定义和,然后让Bn个
是n的序列×n个对称矩阵,具有‖B类n个‖有界的.然后,
证明.因为(4+δ)th力矩和‖B类n个‖有界,从引理1,
然后根据马尔可夫不等式和Borel-Cantelli引理进行收敛。☐
我们现在将其应用于M型随机的,随机的矩阵,独立于:
引理2
假设模型M,并假设是随机对称矩阵序列,其中‖Bn个‖为O美国。(1). 然后,
证明这遵循福比尼定理。具体来说,可以使用[JY,引理5]的证明中的参数,应用推论3,并注意到独立于. ☐
4.2. 中心极限定理
为了建立我们的主矩阵二次型CLT结果,我们首先推导了涉及归一化随机向量的标量双线性形式的CLT。为此,我们必须引入一些进一步的符号。考虑零位随机向量,使用
哪里.假设; 也就是说x和年向量具有单位方差和。我们首先介绍一些二次函数的符号x我,年我.让,使用
让X(X)= (x锂)M(M)×n个和Y(Y)= (年锂)M(M)×n个be数据矩阵基于n个i.i.d.观察(x,年),并定义“标准化”数据矩阵和,其中,、和,。然后,我们对行使用以下符号和标准化数据矩阵的
通过这种设置,我们得到了以下结果,在补充材料,第3.2条:
提议1
让Bn个=(b)n、 ij公司)是随机对称的n×n矩阵,与X、Y无关,因此对于某些有限的β,‖Bn个‖所有n≤β,以及
都是有限的。此外,定义,带组件
然后,,使用
其中K=K1−J和J、K1,K2矩阵定义为
的条目K(K)是的四阶累积量x和年:
因此,K(K)消失,如果x,年均为高斯分布。
在[JY定理10]中建立了具有非正规化向量的相应结果。条款θJ+ωK出现在这种情况下,以及附加条款K2反映了和和[JY]一样,证明是基于鞅CLT,而不是基于白和姚(2008),对涉及未归一化随机向量的二次型给出了类似的结果。
虽然可能具有独立利益,提议1通过将其应用于M型,对我们的目的很重要。
提议2
假设模型M,考虑Bn个如中所示提议1.然后,
其中W是具有项目W的对称m×m高斯矩阵ij公司,均值为零,协方差由
对于i≤j和i′≤j′。
证明结果如下:提议1通过旋转矩阵二次型变成双线性形式的向量;例如,参见[JY,Proposition 6]和白和姚(2008,建议3.1)。具体来说,使用索引我对于M(M)=米(米+ 1)/2对(我,j个),1≤我≤j个≤米.构建随机向量(x,年)的提议1如下所示:如果我= (我,j个),然后设置x我=ξ我/σ我和年我=ξj个/σj个在得到的协方差矩阵中C类的(x,年),如果也是我′ = (我′,j个′),
尤其是,和,而.组件W公司n个,ij公司对应于组件Z轴我在里面提议1因此,我们得出结论:,其中W公司是均值为零的高斯矩阵,由提供提议1.仍需解释(4.14)就M型而言,替代和进入之内(4.16)并追踪定义,我们得到和.观察z(z)我=x我年我=χij公司和,我们同样发现. ☐
5.特征值结果的证明
在本节中,我们推导了主要的特征值结果,如定理1和定理3-(我).
5.1. 前期工作
特征值的收敛性R(右)22
众所周知S公司22弱a.s.收敛于Marchenko–Pastur(MP)定律F类γ,并且极值非平凡特征值收敛到F类γ。对于样本相关性情况,江(2004b)表明同样适用于R(右)22即特征值的经验分布μ1≥ … ≥μ第页“噪声”相关矩阵的弱a.s.收敛于MP定律F类γ,支持于,如果γ≤1,且在{0}к上[一γ,b条γ]否则。此外n个×n个伴随矩阵,用F表示n个,弱收敛于“伴随MP定律”Fγ= (1 −γ)1[0,∞)+γFγ,其中1A类表示集合A上的指示器功能。
此外,江(2004b)说明了这一点
根据这些结果,如果(f)n个→(f)一致地作为闭包上的连续函数F的支撑的有界邻域γ,然后:
如果支持(Fn个)不包含在中,则可能无法定义左侧积分。然而,这样的事件发生的次数最多是有限的n个概率为1。
高盈利活动Jnϵ,Jnϵ1
必要时,我们可以将注意力集中在该事件上或,使用ϵ>0选择为ρν–b条γ≥ 3ϵ,因为来自(2.5)(如上所述)和(5.18),这些事件发生的概率为1n个.
的渐近展开
我们建立了二次型的渐近随机展开式具体来说,使用分解
我们证明了这一点
和
其中,对于,
这里,m是伴随分布F的Stieltjes变换γ.
在建立(5.22),先取足够大的n个使得|ρνn–ρν| ≤ϵ,使用ϵ定义如上。对于这种情况n个,上的Jnϵ1,我们有
因为Jnϵ1持有概率为1的所有大n个, ‖B类n个(ρ¦Αn)‖ =O(运行)美国。(1) 因此,它是由引理2那个
此外,(5.19)产量
显式求值给出m(ρν;γ) = −1/ℓν[JY,附录A],以及(5.22)跟随。
建立(5.23),我们首先回顾一下,并介绍预解式表示法Z轴(t吨) = (tI公司n个−C类n个)−1,因此B类n个(t吨) =tZ(tZ)(t吨)和。从预解恒等式,即,A类−1−B类−1=A类−1(B类−A类)B类−1对于正方形可逆A类和B类,并注意到tZ(tZ)(t吨) =C类n个Z轴(t吨) +我从伍德伯里的身份来看t吨1,t吨2>b条γ,
因此,
此外,根据预解恒等式,,它产生
具有B类编号(t吨1,t吨2)定义为
我们现在描述了中两个矩阵二次型的一阶行为(5.24)首先,我们简单地反映了(5.22)以获得
对于第二种情况,我们再次应用类似的推理,对事件进行操作Jnϵ具体来说,很容易在Jnϵ、和用于n个足够大|ρνn–ρν| ≤ϵ,有界。因此,,它是从引理2和(5.19)那个
年的扩张(5.23)通过将后两个方程与(5.24).
的CLTK(K)(ρνn)
我们现在专攻提议2对于矩阵二次型K(K)(ρνn).
提案3
假设模型M,并定义ρνn通过(1.1)和K(ρνn)由(3.13).然后,
它是一个带有入口的对称高斯随机矩阵,均值为零,协方差由
其中ρν和定义于(1.1),括号中的术语定义见(1.2)和(1.4).
证明回忆一下Jnϵ1= {μ1≤b条γ+ϵ},并考虑足够大n个这样的话ρνn>ρν–ϵ.然后,我们可以申请提议2具有,独立于,其中‖B类n个‖有界。具体来说,结果如下:提议2到以及以下事实和详细说明ω,θ、和ϕ在里面(4.17)。这些数量分别表示为ων,θν、和ϕν,可按[JY,附录A]计算,得出
密封性能
最后,我们建立了推导二阶结果所必需的一些紧性。
我们首先建立了(5.22).定义K(K)0(ρ;γ) := −ρ米(ρ;γ)Γ,这样(5.22)被重写为.设置克ρ(x) =ρ(ρ−x)−1,然后写入
此外,引入
我们有
引理3
假设模型M成立,并且很简单。对于某些b>ρ1,让我表示间隔[bγ+3ϵ,b]。然后,
证明.的证明(5.28)–(5.30)出现在补充材料,S2系列.我们展示(5.31)使用扩展,中给出(3.12),我们回忆起‖第页ν‖ =O(运行)(‖D类ν‖2)并注意到和。然后我们有一ν−第页ν=O(运行)第页(‖D类ν‖ + ‖D类ν‖2). 此外,从
第一学期是O(运行)第页(n个−1/2)由(5.23)和(5.30)第二学期(5.29)因此,
证明已经完成。☐
5.2. 特征值推论(定理1-(ii(ii)))
证明定理1-(ii(ii))依赖关键扩展
通过组合向量方程得到和K(K)0(ρνn;γn个)第页ν=ρνn第页ν带有扩展(5.24)对于和(5.27)对于K(K)(ρνn) −K(K)0(ρνn;γn个). 具体来说,我们首先使用以获得
因为从(5.21)–(5.23)和(2.5)、和一ν−第页ν=O(运行)第页(n个−1/2)来自引理3。此外,因为[K(K)0(ρνn;γn个) −ρνn我米]第页ν=0,如下所示
其中最后一个等式来自(5.23),(5.27)、和(5.28).组合(5.34)和(5.35)产量(5.33).
的渐近正态性现在从提案3,具有渐近方差
哪里W公司ν是米×米中定义的对称高斯随机矩阵提案3,具有协方差由提供(5.26)。在上述方差的开发表达式中使用此项将导致
通过对称性和本征方程,我们有
因此(5.36)减少到,屈服公式(2.6)属于定理1.
6.特征向量结果的证明
我们现在推导出主要特征向量结果,如定理2和定理3-(ii(ii)).
6.1. 特征向量不一致(定理2-(我))
的收敛结果定理2-(我)以下是两个事实:和,如下所示。一旦这些事实成立(3.10),
这将导致
的证明
使用,我们有
重写,使用.关于高概率事件Jnϵ1= {μ1≤b条γ+ϵ},使用ϵ>0,这样ρν–b条γ≥ 2ϵ,很容易确定是有界的,因此因此,引理2可以应用于问ν1此外,来自(5.19)并注意到
具有B类n个1定义于(5.25),我们有
这个和引理2暗示.
还有待展示。使用预解式标识的变体,即,A类−2−B类−2= −A类−2(A类2−B类2)B类−2对于正方形可逆A类和B类,我们重写
具有.处理高概率事件Jnϵ,可以验证因此,引理2与一起(5.19)暗示.因为,我们得出结论.
6.2. 特征向量波动(定理2-(ii(ii)))
同样,我们使用密钥扩展(3.12).因为‖第页ν‖ =O(运行)(‖D类ν‖2) =O(运行)第页(n个−1)来自(5.32),我们有
此外,使用类似的分解推导(5.35),
我们使用的位置(5.23)和(5.27),以及(5.28)和(5.30)属于引理3因此,请注意从定义在里面(3.12),我们有
或同等标准,
哪里
的CLTP(P)T型
一ν现在从提案3特别是,
哪里,召回(2.8)、和w个ν=P(P)T型
W公司ν第页ν,使用W公司ν定义于提案3.协方差矩阵,使用. Thek个的第个分量w个ν由提供因此,
定理2-(ii(ii))替换后跟随(5.26)对于并注意到,当k个,我≠ν,
6.3. 亚临界情况下的特征向量不一致性(定理3-(ii(ii)))
发件人(3.10)和(3.11),足以证明为了定理3-(ii(ii))等待。我们通过展示。该方法使用的是问ν,
对于ϵ> 0. 请注意,因此
哪里(回忆一下。我们证明了这一点、和
说。因为λ最小值(·)是上的连续函数米×米矩阵,我们得出以下结论
而且因为cγ(ϵ) ≥c(b条γ+ϵ)和c(b条γ+ϵ) ↗ ∞ 作为ϵ↘ 0,通过[JY,附录A],我们获得.我们写作,使用
如果我们写下奇异值分解,使用并定义显然,几乎肯定是有界的。因此,引理2可以应用于问νϵ(b条γ),因为
从(5.19),我们的索赔(6.38)跟随。
现在考虑Δνϵ.修复这样‖一‖2=1,并设置.我们有
因为,用于μ,ϵ>0,通过算术平均-几何平均不等式,我们得到
根据对称矩阵特征值的柯西交错不等式,定理1-(我)和定理3-(我). 因此,和证明(6.39)因此定理3-(ii(ii))已完成。