Asymptotics of eigenstructure of sample correlation matrices for high-dimensional spiked models

David Morales-Jimenez; Iain M. Johnstone; Matthew R. McKay; Jeha Yang

doi:10.5705/ss.202019.0052

统计正弦。作者手稿；PMC 2021年4月7日提供。

以最终编辑形式发布为：

统计正弦。2021年4月；31(2): 571–601.

数字对象标识：10.5705/ss.202019.0052

预防性维修识别码：项目管理委员会8026145

美国国立卫生研究院：美国国家卫生研究院1602372

PMID：33833489

高维尖峰模型样本相关矩阵特征结构的渐近性

大卫·莫拉莱斯·希梅内兹,¹ 伊恩·约翰斯通,² 马修·麦凯,^三和杰哈·杨²

作者信息版权和许可信息 PMC免责声明

关联数据

补充资料: supp_sinica_final.pdf。
NIHMS1602372-补充-支持_初始_最终_pdf.pdf（249000）
指南：0EE71CB9-58B3-4B28-BA77-3597F8F04F25

摘要

样本相关矩阵被广泛使用，但对于高维数据，除了“零模型”（假设数据具有独立坐标）外，对其光谱特性知之甚少。在尖峰模型类中，我们应用随机矩阵理论推导了样本相关矩阵的主导特征值和特征向量的渐近一阶和分布结果，假设高维区域中零件编号，变量数量第页按样本大小n个，收敛到一个正常量。虽然样本相关矩阵的一阶谱特性与样本协方差矩阵的谱特性相匹配，但它们的渐近分布可能会显著不同。事实上，样本特征值和特征向量的基于相关性的波动通常显著小于其样本协方差对应项的波动。

关键词：样本相关性、特征结构、峰值模型

1.简介

估计相关矩阵是一项基本的统计任务。它广泛应用于生物学中的病毒序列分析和疫苗设计等领域(Dahirel等人，2011年,Quadeer等人，2014年,2018)金融领域的大型投资组合设计(Plerou等人，2002年)射电天文学中的信号检测(Leshem和van der Veen，2001年)和协作筛选(刘等人，2014,阮等，2016)等等。在经典统计设置中，变量数量有限第页和大量样本n个，样本相关矩阵表现良好，并且很好地理解了其统计特性；例如，请参见，吉希克（1939）,Konishi（1979）,Fang和Krishnaiah（1982）,斯科特（1991）,Kollo和Neudecker（1993）、和Boik（2003）然而，现代应用程序往往表现出高维度第页在许多情况下n个在这种情况下，由于统计噪声在本征谱中可见的矩阵坐标上的聚集，样本相关矩阵变得不准确(El Karoui，2009年). 这在主成分分析（PCA）中尤其重要，PCA通常涉及将数据投影到样本相关矩阵的主要特征向量上，或者在对数据进行标准化后，将其等效投影到样本协方差矩阵的特征向量上。

尽管广泛使用了样本相关矩阵，但对其高维特征谱的理论性质知之甚少。相比之下，样本协方差矩阵已经被广泛研究，并且现在有大量的文献（例如。，Yao等人（2015）). 它们的渐近性质通常是在高维环境中描述的，在这种环境中，根据随机矩阵理论，样本和变量的数量都会增加，但通常不是以相同的速度增长。样本协方差矩阵的特征值和特征向量的具体一阶和二阶结果在Bai和Silverstein（2009）,Couillet和Debbah（2011年）、和Yao等人（2015）.

对于高维样品的光谱相关性矩阵，当前的理论结果集中于最简单的“零模型”场景，其中假设数据是独立的。在这个零模型中，相关矩阵与来自独立同分布（i.i.d.）数据的协方差矩阵具有许多相同的渐近性质，平均值和单位方差为零。因此，经验特征值分布几乎可以肯定地收敛到Marchenko–Pastur分布(江，2004b)，最大和最小特征值收敛到该分布的边(江，2004b,肖和周，2010). 此外，重标的最大和最小特征值渐近遵循Tracy–Widom定律(Bao等人，2012年,Pillai和Yin，2012年). 还导出了线性谱统计的中心极限定理（CLT）(Gao等人，2017). 另一项工作是研究样本相关矩阵的最大绝对非对角项，称为“相干性”(江，2004a,蔡和江，2011,2012)，已被提议作为进行独立性测试的统计数据；另请参见Cochran等人（1995年）,梅斯特和瓦莱特（2017）以及其中的参考文献。《英雄与拉贾拉特南》（2011）,2012)使用相关统计来识别表现出强相关性的变量，这种方法被称为“相关性筛选”

然而，对于非平凡相关模型，样本相关矩阵谱的渐近结果非常稀少。尤其是，El Karoui（2009年）研究表明，对于谱范数有界的一类比较一般的协方差模型，样本相关矩阵的特征值与单位方差数据的样本协方差矩阵的特征值渐近重合，推广了前人的结果江（2004b）和肖和周（2010）在类似的协方差假设下，最近的工作还提出了样本相关矩阵线性谱统计的CLT(梅斯特和瓦莱特，2017年)，扩展了Gao等人（2017）。一阶行为再次与样本协方差的行为一致。然而，样本相关矩阵的渐近涨落是完全不同的。

这项研究考虑了一类特殊的相关矩阵模型，即所谓的“尖峰模型”，其中假设种群协方差（或相关）矩阵的几个大或小的特征值与其他特征值很好地分离(约翰斯通，2001). 峰值协方差模型与主要协方差信息位于相对较少的特征模式中的应用相关。这些应用包括认知无线电系统中的协作信号检测(Bianchi等人，2009年)，传感器网络中的故障检测(Couillet和Hachem，2013年)阵列处理中的自适应波束形成(Hachem等人，2013年,Vallet等人，2015年,Yang等人，2018)以及生物学中的蛋白质接触预测(Cocco等人，2011年,2013). 对尖峰协方差模型的谱特性进行了深入研究，建立了特征值和特征向量的一阶渐近性质和分布性质的精确分析结果；例如，请参见，Baik等人（2005年）,Baik和Silverstein（2006）,保罗（2007）,白和姚（2008）,Benaych-Georges和Nadakuditi（2011年）,Couillet和Hachem（2013）,Bloemendal等人（2016）。有关评论，另请参阅Couillet和Debbah（2011年，第9章）和Yao等人（2015），第11章）。

对于尖峰模型下样本相关矩阵的谱知之甚少。虽然渐近一阶行为预计与样本协方差的行为一致El Karoui（2009年）一个简单的模拟揭示了样本特征值和特征向量波动的显著差异；看见图1.

保存图片、插图等的外部文件。对象名为nihms-1602372-f0001.jpg

在单独的窗口中打开

图1：

一个简单的模拟显示了样本协方差和样本相关性之间显著的分布差异。发件人n个=200 i.i.d.高斯样本， $x_{我} \in ℝ^{100}$ ，协方差∑=blkdiag（∑_秒,我₉₀)，其中 ${(Σ_{秒})}_{我, j个 = 1}^{10} = {({第页}^{| 我 - j个 |})}_{我, j个 = 1}^{10}$ ，用于第页=0.95，我们计算样本协方差和样本相关性，并显示：（a）最大样本特征值的经验密度（归一化直方图），以及高斯分布及其估计平均值和标准偏差（实线），以及（b）投影到第二个（x轴）上的领先样本特征向量的散点图和第四（y轴）种群特征向量。在（A）和（b）的样本相关性中观察到显著的方差减少。对于（b）中不同的种群特征向量选择，观察到类似的方差减少；所选择的选择（作为第二和第四特征向量）有助于说明样本到群体特征向量投影中的附加相关性效应。

在这里，我们给出了描述这些观察到的现象的理论结果。在尖峰模型下，我们得到了样本相关矩阵的特征值和特征向量的渐近一阶和分布结果。保罗（2007）在高斯数据的特殊情况下，证明了样本协方差矩阵的定理。本质上，我们给出了样本相关矩阵的这些定理的类比，并将其扩展到非高斯数据。到一阶，特征值和特征向量与样本协方差矩阵的特征值和特点向量渐近重合；然而，它们的波动可能会有很大不同。事实上，对于两个最大样本相关特征值(定理1)以及相应特征向量的投影(定理2)，渐近方差允许分解为三项。第一项是高斯数据产生的样本协方差矩阵的渐近方差；第二种方法添加由于非高斯性引起的校正，第三种方法捕获由于样本相关矩阵施加的数据归一化引起的进一步校正。（这最后相当于使用样本方差对样本协方差矩阵的条目进行归一化）。与中所示的示例一致图1（a）在领先样本特征值的CLT中，样本相关特征值通常表现出较低的波动，但方差归一化除外，这与样本协方差特征值相比。如中所示图1（b），（归一化）特征向量投影通常是渐近相关的，即使是高斯数据，与保罗（2007），定理5）。

技术贡献

我们建立并扩展了一组随机矩阵工具，用于研究峰值协方差模型。配套手稿(Johnstone和Yang，2018年)[JY]对样本协方差矩阵进行了阐述和并行处理。这里需要进行重要的调整，以说明样本相关矩阵所施加的数据归一化。在我们工作的关键技术贡献中，以我们的主要定理为基础的是双线性形式和具有归一化项的矩阵二次形式的渐近一阶和分布性质，第4节.在“亚临界”特征值尖峰的情况下，使用一种新的基于正则化的证明策略来确定特征向量投影的不一致性，定理3.

M型

让 $x \in ℝ^{米 + 第页}$ 是有限（4）的随机向量+δ)对一些人来说是第几刻δ> 0. 考虑分区

x = [\begin{array}{l} ξ \\ η \end{array}] .

假设 $ξ \in ℝ^{米}$ 具有均值零和协方差∑，并且与 $η \in ℝ^{第页}$ ，具有i.i.d成分η_我均值为零，单位方差为。让 $Σ_{D类} = 诊断 (σ_{1}^{2}, \dots, σ_{米}^{2})$ 是包含方差的对角矩阵ξ_我，并让 $Γ = Σ_{D类}^{- 1 / 2} Σ Σ_{D类}^{- 1 / 2}$ 是的相关矩阵ξ特征分解Γ=PLP公司^T型，其中P（P）= [第页₁, …,第页_米]是特征向量矩阵，并且L（左）=诊断(ℓ₁, …,ℓ_米)包含峰值相关特征值ℓ₁≥ … ≥ℓ_米> 0.

的相关矩阵x因此为Γ_x=blkdiag（Γ，我)，具有特征值ℓ₁, …,ℓ_米、1、…、1和相应的特征向量 ${第页}_{1}, \dots, {第页}_{米}$ ,e（电子）_米+1, …,e（电子）_米+第页，其中 ${第页}_{我} = {[{第页}_{我}^{T型} 0_{第页}^{T型}]}^{T型}$ 和e（电子）_j个是j个第个规范向量（即除j个th坐标）。

考虑一系列的身份证副本x，第一个n个其中填充了(米+第页) ×n个数据矩阵X（X）= (x_ij公司). 我们假设米是固定的，而第页和n个增加

γ_{n个} = 第页 / n个 \to γ > 0 作为 第页, n个 \to \infty .

符号

让S公司=n个⁻¹XX年^T型是样本协方差矩阵，以及 ${S公司}_{D类} = 诊断 ({\hat{σ}}_{1}^{2}, \dots, {\hat{σ}}_{米 + 第页}^{2})$ 是包含样本方差的对角矩阵。让 $R（右） = {S公司}_{D类}^{- 1 / 2} S公司 {S公司}_{D类}^{- 1 / 2}$ 为样本相关矩阵，对应ν样本特征值和特征向量满足

R（右） {\hat{第页}}_{ν} = {\hat{ℓ}}_{ν} {\hat{第页}}_{ν},

其中，为了以后使用，我们对 ${\hat{第页}}_{ν} = {[{\hat{第页}}_{ν}^{T型}, {\hat{v（v）}}_{ν}^{T型}]}^{T型}$ 。在这里 ${\hat{第页}}_{ν}$ 是的子向量 ${\hat{第页}}_{ν}$ 限制在第一个米协调。

对于 $ℓ > 1 + \sqrt{γ}$ ，定义

ρ (ℓ, γ) = ℓ + γ \frac{ℓ}{ℓ - 1}, \dot{ρ} (ℓ, γ) = \frac{\partial ρ (ℓ, γ)}{\partial ℓ} = 1 - \frac{γ}{{(ℓ - 1)}^{2}} .

对于索引ν，其中 $ℓ_{ν} > 1 + \sqrt{γ}$ 是一个简单的特征值集

ρ_{ν} = ρ (ℓ_{ν}, γ), ρ_{ν n个} = ρ (ℓ_{ν}, γ_{n个}), {\dot{ρ}}_{ν} = \dot{ρ} (ℓ_{ν}, γ), {\dot{ρ}}_{v（v） n个} = \dot{ρ} (ℓ_{ν}, γ_{n个}) .

(1.1)

我们指满足的特征值 $ℓ_{ν} > 1 + \sqrt{γ}$ 作为“超临界” $ℓ_{ν} \leq 1 + \sqrt{γ}$ 作为“次临界”，数量 $1 + \sqrt{γ}$ 称为“相变”

为了描述和解释要遵循的极限分布中的方差项，我们需要一些定义。让 ${\bar{ξ}}_{我} = ξ_{我} / σ_{我}$ 和 $κ_{我 j个} = E类 {\bar{ξ}}_{我} {\bar{ξ}}_{j个}$ 表示的缩放分量ξ及其协方差；当然κ_ii（ii）= 1. 相应的缩放四阶累积量为

κ_{我 j个 我^{'} {j个}^{'}} = E类 [{\bar{ξ}}_{我} {\bar{ξ}}_{j个} {\bar{ξ}}_{我^{'}} {\bar{ξ}}_{{j个}^{'}}] - κ_{我 j个} κ_{我^{'} {j个}^{'}} - κ_{我 {j个}^{'}} κ_{j个 我^{'}} - κ_{我 我^{'}} κ_{j个 {j个}^{'}} .

(1.2)

什么时候？ξ是高斯的， $κ_{我 j个我^{'} {j个}^{'}} \equiv 0$ .

相关矩阵中方差缩放的效果使用以下附加的二次函数进行描述 $({\bar{ξ}}_{我})$ ，由定义

χ_{我 j个} = {\bar{ξ}}_{我} {\bar{ξ}}_{j个}, ψ_{我 j个} = κ_{我 j个} ({\bar{ξ}}_{我}^{2} + {\bar{ξ}}_{j个}^{2}) / 2

(1.3)

{\overset{ˇ}{κ}}_{我 j个 我^{'} {j个}^{'}} = Cov公司 (ψ_{我 j个}, ψ_{我^{'} {j个}^{'}}) - Cov公司 (ψ_{我 j个}, χ_{我^{'} {j个}^{'}}) - Cov公司 (χ_{我 j个}, ψ_{我^{'} {j个}^{'}}) .

(1.4)

张量表示法

为了方便起见，可以考虑 $κ_{我 j个我^{'} {j个}^{'}}$ 和 ${\overset{ˇ}{κ}}_{我 j个我^{'} {j个}^{'}}$ 作为四维张量阵列的项κ和 $\overset{ˇ}{κ}$ 分别定义一个附加数组 ${P（P）}^{μ μ^{'} ν ν^{'}}$ 包含个条目 ${第页}_{μ, 我} {第页}_{μ^{'}, j个} {第页}_{ν, 我^{'}} {第页}_{ν^{'}, {j个}^{'}}$ 此外，定义 ${P（P）}^{ν}$ 作为 ${P（P）}^{ν ν ν ν}$ 最后，对于第二个阵列A类尺寸相同，

[{P（P）}^{ν}, A类] = \sum_{我, j个, 我^{'}, {j个}^{'}} {P（P）}_{我 j个 我^{'} {j个}^{'}}^{ν} {A类}_{我 j个 我^{'} {j个}^{'}} .

2.主要成果

我们的第一个主要结果在第5节，给出了样本相关矩阵最大（峰值）特征值的渐近性质：

定理1

假设模型M、，还有那个 $ℓ_{ν} > 1 + \sqrt{γ}$ 是一个简单的特征值。按p/n→γ> 0,

(我) {\hat{ℓ}}_{ν} \overset{美国。}{\to} ρ_{ν}, (我 我) \sqrt{n个} ({\hat{ℓ}}_{ν} - ρ_{ν n个}) \overset{D类}{\to} N个 (0, {\tilde{σ}}_{ν}^{2}),

(2.5)

哪里

{\tilde{σ}}_{ν}^{2} = 2 {\dot{ρ}}_{ν} ℓ_{ν}^{2} + {\dot{ρ}}_{ν}^{2} [{P（P）}^{ν}, κ] + {\dot{ρ}}_{ν}^{2} [{P（P）}^{ν}, \overset{ˇ}{κ}] .

(2.6)

居中于ρ_νn而不是在ρ_ν非常重要。例如，如果，γ_n个=γ+一个^−1/2，然后

\sqrt{n个} ({\hat{ℓ}}_{ν} - ρ_{ν}) \overset{D类}{\to} N个 (一 ℓ_{ν} {(ℓ_{ν} - 1)}^{- 1}, {\tilde{σ}}_{ν}^{2}),

我们看到了一个有限的转变。此外，考虑 ${\tilde{σ}}_{ν n个}^{2}$ 而不是 ${\tilde{σ}}_{ν}^{2}$ ，通过替换获得 ${\dot{ρ}}_{ν}$ 具有 ${\dot{ρ}}_{ν n个}$ 在里面(2.6)，因此

\sqrt{n个} ({\hat{ℓ}}_{ν} - ρ_{ν n个}) / {\tilde{σ}}_{ν n个} \overset{D类}{\to} N个 (0, 1) .

中的渐近一阶极限(我)，这很容易导致El Karoui（2009年），与ν从总体协方差Γ数据计算样本协方差矩阵的第h个最大特征值(保罗，2007). 这意味着，在构建R（右）样本方差的归一化对主要特征值没有影响，至少对一阶特征值没有。

然而，当观察渐近分布时，可以看到关键差异，如(ii（ii）)，以及方差公式中的(2.6)特别地。这很容易解释。第一项对应于高斯协方差情况下的方差Paul（2007），对于协方差Γ的样本也是如此。第二种方法对非高斯数据的结果进行了修正，请参阅配套文章[JY]。第三项描述了样本相关矩阵的特定贡献，表示样本方差对数据归一化的影响。该项通常为负值，并在推论1如下所示，在补充材料,第1.1节.

推论1

对于ξ高斯定理1简化为

{\tilde{σ}}_{ν}^{2} = 2 ℓ_{ν}^{2} {\dot{ρ}}_{ν} [1 - {\dot{ρ}}_{ν} (2 ℓ_{ν} 信托收据 {P（P）}_{D类, ν}^{4} - 信托收据 {({P（P）}_{D类, ν} Γ {P（P）}_{D类, ν})}^{2})],

其中P_D类,ν=诊断(第页_ν,1, …,第页_ν,米).

因此，计算样本相关性会导致渐近方差按 $1 - {\dot{ρ}}_{ν} Δ_{ν}$ ，相对于样本协方差，其中

Δ_{ν} = 2 ℓ_{ν} 信托收据 {P（P）}_{D类, ν}^{4} - 信托收据 {({P（P）}_{D类, ν} Γ {P（P）}_{D类, ν})}^{2} = 2 ℓ_{ν} \sum_{我} {第页}_{ν, 我}^{4} - \sum_{我, j个} {({第页}_{ν, 我} κ_{我 j个} {第页}_{ν, j个})}^{2}

通常是正的，这意味着样本相关性的峰值特征值通常表现出比样本协方差的方差小的方差。事实上，如果

\sum_{我, j个} {({第页}_{ν, 我} κ_{我 j个} {第页}_{ν, j个})}^{2} < 2 ℓ_{ν} \sum_{我} {第页}_{ν, 我}^{4} = \sum_{我, j个} {第页}_{ν, 我} κ_{我 j个} {第页}_{ν, j个} ({第页}_{ν, 我}^{2} + {第页}_{ν, j个}^{2}),

(2.7)

最后一个身份来自以下事实 $ℓ_{ν} {第页}_{ν, 我} = \sum_{j个} κ_{我 j个} {第页}_{ν, j个}$ .条件(2.7)，以及方差减少，适用于以下情况：

Γ和第页_ν有非负条目，或
$2 ℓ_{ν} \sum_{我} {第页}_{ν, 我}^{4} > 1$ ，或
$2 ℓ_{ν} > ℓ_{1}^{2} .$

在情况（i）中，不等式 $0 \leq {第页}_{ν, 我} κ_{我 j个} {第页}_{ν, j个} \leq 2 {第页}_{ν, 我} {第页}_{ν, j个} \leq {第页}_{ν, 我}^{2} + {第页}_{ν, j个}^{2}$ 产量(2.7)注意，如果Γ具有非负项，则Perron–Frobenius定理建立了具有非负分量的特征向量的存在性ℓ₁; 此外，如果Γ有正项，根据相同的定理，ℓ₁是简单的并且与具有正分量的特征向量相关联。案例（ii）源自 $\sum_{我, j个} {({第页}_{ν, 我} κ_{我 j个} {第页}_{ν, j个})}^{2} \leq \sum_{我, j个} {({第页}_{ν, 我} {第页}_{ν, j个})}^{2} = 1$ ，如果ℓ_ν>米/2，因为 $\sum_{我} {第页}_{ν, 我}^{4} \geq 1 / 米$ 案例（iii）源自不等式 $2 {第页}_{ν, 我}^{2} {第页}_{ν, j个}^{2} \leq {第页}_{ν, 我}^{4} + {第页}_{ν, j个}^{4}$ 和 $\sum_{j个} κ_{我 j个}^{2} = {(Γ^{2})}_{我我} \leq ‖ Γ^{2} ‖ = ℓ_{1}^{2}$ 注意，这是相当特殊的，因为它与特征向量无关，并且它保持不变的必要条件是ℓ₁≤ 2.

条件(2.7)然而，可能会失败。例如，即使米和第页∈（0,1），考虑

Γ = (\begin{matrix} 1 & - 第页 \\ - 第页 & 1 \end{matrix}) \otimes 1_{米 / 2} 1_{米 / 2}^{T型},

其中1_米/2是(米/2） -所有一的维向量，对应于相同随机向量的两个负相关组。这有简单的超临界特征值ℓ₁= (1 +第页)米/2和ℓ₂= (1 −第页)米/2时 $米 > 2 (1 + \sqrt{γ}) / (1 - 第页)$ ，使用 ${第页}_{ν, 我}^{2} = 米^{- 1}$ 对于ν= 1, 2. 我们发现Δ₂= (1 − 2第页−第页²)/2<0 $第页 > \sqrt{2} - 1$ ，尽管Δ₁>0是因为ℓ₁>米/2，这意味着情况（ii）。

我们现在讨论特征向量。同样，修复索引ν对于其中 $ℓ_{ν} > 1 + \sqrt{γ}$ 是Γ的简单特征值，具有相应的特征向量 ${第页}_{ν} = {[{第页}_{ν}^{T型} 0_{第页}^{T型}]}^{T型}$ 回忆一下 ${\hat{第页}}_{ν} = {[{\hat{第页}}_{ν}^{T型} {\hat{v（v）}}_{ν}^{T型}]}^{T型}$ 是ν的第个样本特征向量R（右），并让 $一_{ν} = {\hat{第页}}_{ν} / ‖ {\hat{第页}}_{ν} ‖$ 是对应的归一化子向量 ${\hat{第页}}_{ν}$ ，限制为第一个米协调。下一个结果确定了特征向量投影的极限 $〈 {\hat{第页}}_{ν}, {第页}_{ν} 〉$ 和用于标准化交叉投影的CLT ${P（P）}^{T型} 一_{ν} = {[{第页}_{1}^{T型} 一_{ν}, \dots, {第页}_{米}^{T型} 一_{ν}]}^{T型}$ ; 看见第6.1节和6.2.

定理2

假设模型M、，还有那个 $ℓ_{ν} > 1 + \sqrt{γ}$ 是一个简单的特征值。然后，作为p/n→γ> 0,

(我) {〈 {\hat{第页}}_{ν}, {第页}_{ν} 〉}^{2} \overset{美国。}{\to} {\dot{ρ}}_{ν} ℓ_{ν} / ρ_{ν}, (我 我) \sqrt{n个} ({P（P）}^{T型} 一_{ν} - {e（电子）}_{ν}) \overset{D类}{\to} N个 (0, Σ_{ν}),

哪里 $Σ_{ν} = {D类}_{ν} {\tilde{Σ}}_{ν} {D类}_{ν}$ 具有

{D类}_{ν} = \sum_{k个 \neq ν}^{米} {(ℓ_{ν} - ℓ_{k个})}^{- 1} {e（电子）}_{k个} {e（电子）}_{k个}^{T型}

(2.8)

{\tilde{Σ}}_{ν, k个 我} = {\dot{ρ}}_{ν}^{- 1} ℓ_{k个} ℓ_{ν} δ_{k个, 我} + [{P（P）}^{k个 ν 我 ν}, κ] + [{P（P）}^{k个 ν 我 ν}, \overset{ˇ}{κ}],

(2.9)

其中δ_{k、我}= 1如果k=l，否则为零.

CLT导致(ii（ii）)可以根据以下条目重新表述一_ν我们很容易获得 $\sqrt{n个} (一_{ν} - {第页}_{ν}) \overset{D类}{\to} N个 (0, P（P） Σ_{ν} {P（P）}^{T型})$ ; 注意∑_ν中有零ν第行和ν第th列。

至于特征值，定理2结果表明，样本相关矩阵的峰值特征向量与样本协方差的峰值特征矢量表现出相同的一阶行为(保罗，2007). 差异再次在于由协方差矩阵∑捕获的渐近波动_ν。请注意，它被分解为 ${D类}_{ν} - 一$ 对角矩阵与矩阵 ${\tilde{Σ}}_{ν}$ ，其中包括(2.9)。这些术语的解释与之前在(2.6)也就是说，第一项捕获高斯-协方差模型的渐近波动(保罗，2007)第二项捕获协方差情况下非高斯性的影响[JY]，第三项捕获特定于相关情况的信息，表示由于样本方差归一化而产生的波动。注意，只有第一项通常是对角的，这表明特征向量投影可能是渐近相关的，如前面所示图1（b），右侧面板。这也适用于高斯数据，在推论2下方；看见补充材料,第1.2节为了证明。我们注意到协方差矩阵的特征向量投影有一个有趣的对比(保罗，2007)，仅由中的前导词描述(2.9).

推论2

对于ξGaussian定理2减少到 $Σ_{ν} = {D类}_{ν} {\tilde{Σ}}_{ν} {D类}_{ν}$ ,

{\tilde{Σ}}_{ν} = \frac{ℓ_{ν}}{{\dot{ρ}}_{ν}} L（左） + (ℓ_{ν} 我 + L（左）) (\frac{1}{2} Z轴 - ℓ_{ν} Y（Y）) (ℓ_{ν} 我 + L（左）) + ℓ_{ν} (ℓ_{ν}^{2} Y（Y） - L（左） Y（Y） L（左）),

哪里 $Z轴 = {P（P）}^{T型} {P（P）}_{D类, ν} (Γ \circ Γ) {P（P）}_{D类, ν} P（P）$ , $Y（Y） = {P（P）}^{T型} {P（P）}_{D类, ν}^{2} P（P）$ ,和∘表示哈达玛产品.

因此，对于高斯数据，渐近协方差矩阵的条目由（k个,我≠ν)

Σ_{ν, k个 我} = {(ℓ_{ν} - ℓ_{k个})}^{- 1} {(ℓ_{ν} - ℓ_{我})}^{- 1} [\frac{ℓ_{ν}}{{\dot{ρ}}_{ν}} ℓ_{k个} δ_{k个, 我} + (ℓ_{ν} + ℓ_{k个}) (ℓ_{ν} + ℓ_{我}) \frac{{Z轴}_{k个 我}}{2} - ℓ_{ν} (ℓ_{ν} (ℓ_{k个} + ℓ_{我}) + 2 ℓ_{k个} ℓ_{我}) {Y（Y）}_{k个 我}] .

现在考虑次临界情况，其中ν是这样的 $1 < ℓ_{ν} \leq 1 + \sqrt{γ}$ .让 ${第页}_{ν}$ 表示相应的种群特征向量，并让 ${\hat{ℓ}}_{ν}$ 和 ${\hat{第页}}_{ν}$ 分别表示相应的样本特征值和特征向量。证据延期至第5.1节和6.3，我们得到以下结果：

定理3

假设模型M之间，还有那个 $1 < ℓ_{ν} \leq 1 + \sqrt{γ}$ 是一个简单的特征值。然后，作为p/n→γ> 0,

(我) {\hat{ℓ}}_{ν} \overset{美国。}{\to} {(1 + \sqrt{γ})}^{2}, (我 我) {〈 {\hat{第页}}_{ν}, {第页}_{ν} 〉}^{2} \overset{美国。}{\to} 0 .

同样，样本特征值及其相关特征向量的一阶渐近极限与样本协方差的渐近极限相同(Paul，2007年).

回想一下，我们的高维结果假设了一个渐近状态，其中零件编号→γ>0，与经典体制相反，其中第页是固定的，并且n个→ ∞. 固定的情况第页对应于γ=0，并且很好地理解了样本相关矩阵的光谱特性；例如，吉希克（1939）,Konishi（1979）,Fang和Krishnaiah（1982）,斯科特（1991）,Kollo和Neudecker（1993）、和Boik（2003）.何时γ=0，函数ρ(ℓ)还原为身份。的确，对于固定第页，没有高维分量η在模型M中，因此对ρ(ℓ,γ)在以下情况下发生γ> 0. 特别是对于固定第页我们没有对手定理3.

总之，与高维相比(零件编号→γ>0）样本协方差设置，我们对样本相关矩阵的尖峰特征值和特征向量的结果证实了一阶渐近行为确实等价于样本协方差矩阵的渐近行为，与以前的结果和观察结果一致(El Karoui，2009年,梅斯特和瓦莱特，2017年). 而特征值限制在定理1和定理3作为直接的结果El Karoui（2009年），特征向量结果定理2-(我)和定理3-(ii（ii）)不要。与一阶等价物相反，特征值和特征向量的涨落都存在重要差异，如定理1-(ii（ii）)和定理2-(ii（ii）).

我们用一个具有协方差的简单示例来说明这些差异 $Γ = (1 - 第页) 我_{米} + 第页 1_{米} 1_{米}^{T型}$ ，其中第页∈ [0, 1]; 也就是说，一个具有单位方差和常数相关性的模型第页跨所有组件。此外，ξ为简单起见，假设为高斯。在这种情况下，L（左）=诊断(ℓ₁, 1 −第页, …, 1 −第页)，其中ℓ₁= 1 +第页(米−1）为超临界iff $第页 > \sqrt{γ} / (米 - 1)$ .考虑最大样本特征值 ${\hat{ℓ}}_{1}$ 在这种超临界情况下。发件人推论1，可以计算样本协方差和样本相关性的渐近方差，从而得出

σ_{1}^{2} = 2 ℓ_{1}^{2} {\dot{ρ}}_{1}, {\tilde{σ}}_{1}^{2} = σ_{1}^{2} (1 - {\dot{ρ}}_{1} Δ),

分别使用 $Δ = 2 ℓ_{1} 信托收据 {P（P）}_{D类}^{4} - 信托收据 {({P（P）}_{D类} Γ {P（P）}_{D类})}^{2}$ ，以及其中

{P（P）}_{D类} ≜ {P（P）}_{D类, 1} = 米^{- 1 / 2} 我_{米}, {\dot{ρ}}_{1} = 1 - \frac{γ}{{第页}^{2} {(米 - 1)}^{2}} .

图2（a）绘制这些渐近方差与第页用于各种(γ,米). 事实上，样本相关性的方差（波动）始终小于样本协方差的方差。差异是惊人的，随着第页↗ 1.在各种选择中观察到类似的趋势米和γ，越高越明显米，虽然受变化的影响不大γ这可以从以下事实中理解：=第页(2 −第页) + (1 −第页)²米⁻¹= 1 − (1 −第页)²(1 −米⁻¹),

\frac{{\tilde{σ}}_{1}^{2}}{σ_{1}^{2}} = 1 - {\dot{ρ}}_{1} Δ \to {\begin{array}{l} \frac{γ}{{(米 - 1)}^{2}} & 作为 & 第页 \to 1, 米 固定的 \\ {(1 - 第页)}^{2} & 作为 & 米 \to \infty, 第页 固定的。 \end{array}

现在转到前面的样本特征向量的波动，与上面的设置相同。请注意，在推论2对于这种特殊情况，可以从P（P）^T型ΓP（P）=L（左）那个

Z轴 = 米^{- 1} (1 - {第页}^{2}) 我_{米} + {第页}^{2} {e（电子）}_{1} {e（电子）}_{1}^{T型}, Y（Y） = 米^{- 1} 我_{米} .

也来自推论2，归一化样本对种群特征向量投影的渐近方差 ${第页}_{2}^{T型} 一_{1}$ ，在样本协方差和样本相关情况下，计算如下

Σ_{1, 22}^{覆盖（cov）} = \frac{ℓ_{1} ℓ_{2}}{{(第页 米)}^{2} {\dot{ρ}}_{1}}, Σ_{1, 22} = Σ_{1, 22}^{覆盖（cov）} - \frac{ζ}{{(rm（毫米）)}^{2}} \frac{ℓ_{1} ℓ_{2} (ℓ_{1} + ℓ_{2})}{米},

分别，其中 $ζ = 1 - 第页 + \frac{1}{2} (1 + 第页) {(1 + \frac{1 - 第页}{第页米})}^{- 1}$ 我们记得ℓ₁= 1 −第页+rm（毫米）和ℓ₂= 1 −第页。这些差异在以下方面进行了数值评估图2（b）对于与之前相同的参数选择，以及作为的函数第页然而，请注意，为了更好地进行视觉欣赏第页被限制在临界点以上的超临界值 $\sqrt{γ} / (米 - 1)$ ，因为方差在那一点爆炸。比较评估再次显示样本相关性的较小方差。这里的方差减少在图中不太明显，因为∑_1,22和 $Σ_{1, 22}^{覆盖（cov）}$ 消失为第页→ 1.然而，该比率的表现与方差比率非常相似 ${\tilde{σ}}_{1}^{2} / σ_{1}^{2}$ :

\frac{Σ_{1, 22}}{Σ_{1, 22}^{覆盖（cov）}} = 1 - ζ_{{\dot{ρ}}_{1}} \frac{(ℓ_{1} + ℓ_{2})}{米} \to {\begin{array}{l} \frac{γ}{{(米 - 1)}^{2}} & 作为 第页 \to 1, 米 固定的 \\ (1 - 第页) (1 - 第页 / 2) & 作为 米 \to \infty, 第页 固定的。 \end{array}

保存图片、插图等的外部文件。对象名为nihms-1602372-f0002.jpg

在单独的窗口中打开

图2：

样本特征值和特征向量波动的差异 $Γ = (1 - 第页) 我_{米} + 第页 1_{米} 1_{米}^{T型}$ 对于（a）最大样本特征值，示出了非对称方差 ${\hat{ℓ}}_{1}$ 和（b）归一化样本对种群特征向量投影 ${第页}_{2}^{T型} 一_{1}$ .

我们在结束对主要结果的讨论时，对可能的扩展进行了几点评论。我们的结果假设ℓ_ν>1是一个简单的特征值，但对具有ℓ_ν<1，对于具有多重性的峰值应是可能的。对于样本协方差矩阵，已获得特征值的类似结果ℓ_ν<1，包括大于1的多重数（例如，参见白和姚（2008）)，给出了期望相关矩阵得到相应结果的理由。简单样本相关矩阵特征值和特征向量结果的推广ℓ_ν<1应该相当简单，尽管情况如此γ< 1,γ=1，和γ>1需要单独治疗。对具有多重性的峰值的扩展也是可能的，但在这种情况下，特征向量没有很好地定义，需要考虑子空间投影，需要对我们的技术论点进行非平凡的修改。

本文的其余部分进行如下。首先，在第3节，我们介绍了推导中使用的关键量和恒等式。第4节给出了双线性形式和具有归一化项的矩阵二次形式的必要渐近性质，并将相应的证明归结为补充材料,S3剖面这些性质为描述样本相关矩阵的特征值和特征向量的渐近收敛性和分布提供了基础第5节和6分别是。

如前所述，协方差矩阵的简单情况的并行处理在补充手稿[JY]。这旨在统一阐述加标协方差矩阵的已知光谱性质，作为当前工作的基准，以及对文献的额外引用。

3.前期工作

我们从块表示和样本相关矩阵的一些相关约简开始R（右）这些在协方差矩阵设置中是众所周知的。与分区一样x在模型M中，考虑

X（X） = [\begin{array}{l} {X（X）}_{1} \\ {X（X）}_{2} \end{array}], {X（X）}_{1} \in ℝ^{米 \times n个}, {X（X）}_{2} \in ℝ^{第页 \times n个} .

写入S公司_D类=blkdiag(S公司_D类1,S公司_D类2)，带有S公司_D类1包含对应于ξ、和S公司_D类2包含对应于η定义“标准化”数据矩阵 ${\bar{X（X）}}_{1} = {S公司}_{D类 1}^{- 1 / 2} {X（X）}_{1}$ 和 ${\bar{X（X）}}_{2} = {S公司}_{D类 2}^{- 1 / 2} {X（X）}_{2}$ ，因此

R（右） = {n个}^{- 1} [\begin{matrix} {\bar{X（X）}}_{1} {\bar{X（X）}}_{1}^{T型} & {\bar{X（X）}}_{1} {\bar{X（X）}}_{2}^{T型} \\ {\bar{X（X）}}_{2} {\bar{X（X）}}_{1}^{T型} & {\bar{X（X）}}_{2} {\bar{X（X）}}_{2}^{T型} \end{matrix}] = [\begin{array}{l} {R（右）}_{11} & {R（右）}_{12} \\ {R（右）}_{21} & {R（右）}_{22} \end{array}]; {\hat{第页}}_{ν} = [\begin{array}{l} {\hat{第页}}_{ν} \\ {\hat{v（v）}}_{ν} \end{array}] .

特征向量方程的这种划分 $R（右） {\hat{第页}}_{ν} = {\hat{ℓ}}_{ν} {\hat{第页}}_{ν}$ ，以及 ${\hat{第页}}_{ν} = {[{\hat{第页}}_{ν}^{T型}, {\hat{v（v）}}_{ν}^{T型}]}^{T型}$ ，收益率

{R（右）}_{11} {\hat{第页}}_{ν} + {R（右）}_{12} {\hat{v（v）}}_{ν} = {\hat{ℓ}}_{ν} {\hat{第页}}_{v（v）}

{R（右）}_{21} {\hat{第页}}_{ν} + {R（右）}_{22} {\hat{v（v）}}_{ν} = {\hat{ℓ}}_{ν} {\hat{v（v）}}_{ν} .

根据第二个方程， ${\hat{v（v）}}_{ν} = {({\hat{ℓ}}_{ν} 我_{第页} - {R（右）}_{22})}^{- 1} {R（右）}_{21} {\hat{第页}}_{ν}$ 。将其代入第一个方程式中，得出

K（K） ({\hat{ℓ}}_{ν}) {\hat{第页}}_{ν} = {\hat{ℓ}}_{ν} {\hat{第页}}_{ν}, 具有 K（K） (t吨) = {R（右）}_{11} + {R（右）}_{12} {(t吨 我_{第页} - {R（右）}_{22})}^{- 1} {R（右）}_{21} .

因此， ${\hat{ℓ}}_{v（v）}$ 是的特征值 $K（K） ({\hat{ℓ}}_{ν})$ ，带有相关特征向量 ${\hat{第页}}_{ν}$ ; 这是我们推导的核心。请注意 $K（K） ({\hat{ℓ}}_{ν})$ 定义明确，如果 ${\hat{ℓ}}_{v（v）}$ 与R（右）₂₂;第5.1节表明这种情况发生的概率为1n个什么时候ℓ_ν是超临界的。此外，归一化条件， ${\hat{第页}}_{ν}^{T型} {\hat{第页}}_{ν} + {\hat{v（v）}}_{ν}^{T型} {\hat{v（v）}}_{ν} = 1$ 产量

{\hat{第页}}_{ν}^{T型} (我_{米} + 问_{ν}) {\hat{第页}}_{ν} = 1, 问_{ν} = {R（右）}_{12} {({\hat{ℓ}}_{ν} 我_{第页} - {R（右）}_{22})}^{- 2} {R（右）}_{21} .

用信号空间归一化特征向量表示 $一_{ν} = {\hat{第页}}_{ν} / ‖ {\hat{第页}}_{ν} ‖$ ，我们有

K（K） ({\hat{ℓ}}_{ν}) 一_{ν} = {\hat{ℓ}}_{ν} 一_{ν}, 一_{ν}^{T型} (我_{米} + 问_{ν}) 一_{ν} = {‖ {\hat{第页}}_{ν} ‖}^{- 2} .

(3.10)

还要注意的是，样本到群体的内积可以重写为

〈 {\hat{第页}}_{ν}, {第页}_{ν} 〉 = 〈 {\hat{第页}}_{ν}, {第页}_{ν} 〉 = ‖ {\hat{第页}}_{ν} ‖ 〈 一_{ν}, {第页}_{ν} 〉 .

(3.11)

在CLT结果的推导中，我们使用了一个特征向量扰动公式，其二次误差界在[JY，引理13]中给出，它本身是对保罗（2007）。这将产生密钥扩展

一_{ν} - {第页}_{ν} = - {R（右）}_{ν n个} {D类}_{ν} {第页}_{ν} + {第页}_{ν},

(3.12)

哪里

{R（右）}_{ν n个} = \frac{ℓ_{ν}}{ρ_{ν n个}} \sum_{k个 \neq ν}^{米} {(ℓ_{k个} - ℓ_{ν})}^{- 1} {第页}_{k个} {第页}_{k个}^{T型}, {D类}_{ν} = K（K） ({\hat{ℓ}}_{ν}) - (ρ_{ν n个} / ℓ_{ν}) Γ, ‖ {第页}_{ν} ‖ = O（运行） ({‖ {D类}_{ν} ‖}^{2}) .

我们的特征值和特征向量结果的推导，如第5节和6分别取(3.10),(3.11)和(3.12)作为出发点，并依赖于关键对象的渐近性质 $K（K） ({\hat{ℓ}}_{ν})$ 和问_ν特别是，K（K）(t吨)可以表示为随机矩阵二次型

K（K） (t吨) = {n个}^{- 1} {\bar{X（X）}}_{1} {B类}_{n个} (t吨) {\bar{X（X）}}_{1}^{T型},

(3.13)

使用伍德伯里的身份，

{B类}_{n个} (t吨) = 我_{n个} + {n个}^{- 1} {\bar{X（X）}}_{2}^{T型} {(t吨 我_{第页} - {R（右）}_{22})}^{- 1} {\bar{X（X）}}_{2} = t吨 {(t吨 我_{n个} - {n个}^{- 1} {\bar{X（X）}}_{2}^{T型} {\bar{X（X）}}_{2})}^{- 1} .

因此，我们的主要目标是涉及规范化数据矩阵的随机二次型 ${\bar{X（X）}}_{1}$ 和 ${\bar{X（X）}}_{2}$ 这些形式的渐近性质是我们结果的基础，下面将介绍。

4.具有规范化条目的二次型

在本节中，我们建立了该类型矩阵二次型的一阶（确定性）收敛性和CLT ${n个}^{- 1} {\bar{X（X）}}_{1} {B类}_{n个} {\bar{X（X）}}_{1}^{T型}$ ，其中B类_n个是谱范数有界的矩阵。虽然对我们的目的至关重要，但一些技术成果可能具有独立的意义；因此，我们首先给出一般结果，然后将其应用于模型M的上下文中。

4.1. 一阶收敛

为了建立一阶收敛性，我们首先需要关于单位长度相关随机向量双线性形式的一些结果。主要技术成果（见补充材料,第3.1条)如下所示：

引理1

设B是一个n×n非随机对称矩阵 $x, 年 \in ℝ^{n个}$ 是平均值为零、方差为一的身份证条目的随机向量， $E类 {| x_{我} |}^{我}$ , $E类 {| 年_{我} |}^{我} \leq ν_{我}$ 、和 $E类 [x_{我} 年_{我}] = ρ$ .让 $\bar{x} = \sqrt{n个} x / ‖ x ‖$ 和 $\bar{年} = \sqrt{n个} 年 / ‖ 年 ‖$ .然后，对于任意s≥1，

E类 {| {n个}^{- 1} {\bar{x}}^{T型} B类 \bar{年} - ρ {n个}^{- 1} 信托收据 B类 |}^{秒} \leq {C类}_{秒} [{n个}^{- 秒} (ν_{2 秒} 信托收据 {B类}^{秒} + {(ν_{4} 信托收据 {B类}^{2})}^{秒 / 2}) + ‖ B类 ‖^{秒} ({n个}^{- 秒 / 2} ν_{4}^{秒 / 2} + {n个}^{- 秒 + 1} ν_{2 秒})],

哪里 ${C类}_{秒}$ 是一个仅依赖于s的常数。

这是对Gao等人（2017年），引理5），其建立了归一化二次型的对应界。引理1导致以下一阶收敛结果：

推论3

让x,y是i的随机向量.我.d日.平均值为零的条目,方差一, $E类 {| x_{我} |}^{4 + δ}$ , $E类 {| 年_{我} |}^{4 + δ} < \infty$ 对于某些δ> 0,和 $E类 [x_{我} 年_{我}] = ρ$ .定义 $\bar{x} = \sqrt{n个} x / ‖ x ‖$ 和 $\bar{年} = \sqrt{n个} 年 / ‖ 年 ‖$ ,然后让B_n个 是n的序列×n个对称矩阵,具有‖B类_n个‖有界的.然后,

{n个}^{- 1} {\bar{x}}^{T型} {B类}_{n个} \bar{年} - {n个}^{- 1} ρ 信托收据 {B类}_{n个} \overset{美国。}{\to} 0

证明.因为（4+δ)th力矩和‖B类_n个‖有界，从引理1,

E类 {| {n个}^{- 1} {\bar{x}}^{T型} {B类}_{n个} \bar{年} - {n个}^{- 1} ρ 信托收据 {B类}_{n个} |}^{2 + δ / 2} \leq O（运行） ({n个}^{- (1 + δ / 4)}) .

然后根据马尔可夫不等式和Borel-Cantelli引理进行收敛。☐

我们现在将其应用于M型随机的，随机的矩阵 ${B类}_{n个} ({\bar{X（X）}}_{2})$ ，独立于 ${\bar{X（X）}}_{1}$ :

引理2

假设模型M，并假设 ${B类}_{n个} = {B类}_{n个} ({\bar{X（X）}}_{2})$ 是随机对称矩阵序列，其中‖B_n个‖为O_美国。(1). 然后，

{n个}^{- 1} {\bar{X（X）}}_{1} {B类}_{n个} ({\bar{X（X）}}_{2}) {\bar{X（X）}}_{1}^{T型} - {n个}^{- 1} 信托收据 {B类}_{n个} ({\bar{X（X）}}_{2}) Γ \overset{一 . 秒 .}{\to} 0

证明这遵循福比尼定理。具体来说，可以使用[JY，引理5]的证明中的参数，应用推论3，并注意到 ${\bar{X（X）}}_{1}$ 独立于 ${B类}_{n个} ({\bar{X（X）}}_{2})$ . ☐

4.2. 中心极限定理

为了建立我们的主矩阵二次型CLT结果，我们首先推导了涉及归一化随机向量的标量双线性形式的CLT。为此，我们必须引入一些进一步的符号。考虑零位随机向量 $(x, 年) \in ℝ^{M（M）} \times ℝ^{M（M）}$ ，使用

Cov公司 (\begin{array}{l} x \\ 年 \end{array}) = C类 = (\begin{array}{l} {C类}^{x x} & {C类}^{x 年} \\ {C类}^{年 x} & {C类}^{年 年} \end{array}),

哪里 ${C类}_{我我^{'}}^{x 年} = E类 [x_{我} 年_{我^{'}}]$ .假设 ${C类}_{我我}^{x x} = {C类}_{我我}^{年年} = 1$ ; 也就是说x和年向量具有单位方差和 $ρ_{我} = {C类}_{我我}^{x 年} = E类 [x_{我} 年_{我}]$ 。我们首先介绍一些二次函数的符号x_我,年_我.让 $z（z）, w个 \in ℝ^{M（M）}$ ，使用

{z（z）}_{我} = x_{我} 年_{我}, {w个}_{我} = ρ_{我} (x_{我}^{2} + 年_{我}^{2}) / 2, {C类}^{z（z） z（z）} = Cov公司 (z（z）), {C类}^{w个 z（z）} = Cov公司 (z（z）, w个), e（电子） t吨 c .

让X（X）= (x_锂)_{M（M）×n个}和Y（Y）= (年_锂)_{M（M）×n个}be数据矩阵基于n个i.i.d.观察(x,年)，并定义“标准化”数据矩阵 $\bar{X（X）} = {\hat{Σ}}_{x}^{- 1 / 2} X（X）$ 和 $\bar{Y（Y）} = {\hat{Σ}}_{年}^{- 1 / 2} Y（Y）$ ，其中 ${\hat{Σ}}_{x} = 诊断 ({\hat{σ}}_{x_{1}}^{2}, \dots, {\hat{σ}}_{x_{M（M）}}^{2})$ , ${\hat{Σ}}_{年} = 诊断 ({\hat{σ}}_{年_{1}}^{2}, \dots, {\hat{σ}}_{年_{M（M）}}^{2})$ 、和 ${\hat{σ}}_{x_{我}}^{2} = {n个}^{- 1} \sum_{我 = 1}^{n个} x_{我我}^{2}$ , ${\hat{σ}}_{年_{我}}^{2} = {n个}^{- 1} \sum_{我 = 1}^{n个} 年_{我我}^{2}$ 。然后，我们对行使用以下符号 ${\bar{x}}_{我}^{T型}$ 和 ${\bar{年}}_{我}^{T型}$ 标准化数据矩阵的

\bar{X（X）} = {({\bar{x}}_{我 我})}_{M（M） \times n个} = [\begin{matrix} {\bar{x}}_{1}^{T型} \\ ⋮ \\ {\bar{x}}_{M（M） \cdot}^{T型} \end{matrix}], \bar{Y（Y）} = {({\bar{年}}_{我 我})}_{M（M） \times n个} = [\begin{matrix} {\bar{年}}_{1}^{T型} \\ ⋮ \\ {\bar{年}}_{M（M）}^{T型} \end{matrix}] .

通过这种设置，我们得到了以下结果，在补充材料,第3.2条:

提议1

让B_n个=（b）_{n、 ij公司})是随机对称的n×n矩阵，与X、Y无关，因此对于某些有限的β，‖B_n个‖所有n≤β，以及

{n个}^{- 1} \sum_{我 = 1}^{n个} {b条}_{n个, 我 我}^{2} \overset{第页}{\to} ω, {n个}^{- 1} 信托收据 {B类}_{n个}^{2} \overset{第页}{\to} θ, {({n个}^{- 1} 信托收据 {B类}_{n个})}^{2} \overset{第页}{\to} ϕ,

都是有限的。此外，定义 ${Z轴}_{n个} \in ℝ^{M（M）}$ ，带组件

{Z轴}_{n个, 我} = {n个}^{- 1 / 2} [{\bar{x}}_{我 .}^{T型} {B类}_{n个} {\bar{年}}_{我 .} - ρ_{我} 信托收据 {B类}_{n个}] .

然后， ${Z轴}_{n个} \overset{D类}{\to} {N个}_{M（M）} (0, D类)$ ，使用

D类 = (θ - ω) J + ω {K（K）}_{1} + ϕ {K（K）}_{2} = θ J + ω K（K） + ϕ {K（K）}_{2},

(4.14)

其中K=K₁−J和J、K₁，K₂矩阵定义为

J = {C类}^{x 年} \circ {C类}^{年 x} + {C类}^{x x} \circ {C类}^{年 年} {K（K）}_{1} = {C类}^{z（z） z（z）} {K（K）}_{2} = {C类}^{w个 w个} - {C类}^{w个 z（z）} - {C类}^{z（z） w个} .

(4.15)

的条目K（K）是的四阶累积量x和年:

{K（K）}_{我 我^{'}} = E类 (x_{我} 年_{我} x_{我^{'}} 年_{我^{'}}) - E类 (x_{我} 年_{我}) E类 (x_{我^{'}} 年_{我^{'}}) - E类 (x_{我} 年_{我^{'}}) E类 (年_{我} x_{我^{'}}) - E类 (x_{我} x_{我^{'}}) E类 (年_{我} 年_{我^{'}}) .

(4.16)

因此，K（K）消失，如果x,年均为高斯分布。

在[JY定理10]中建立了具有非正规化向量的相应结果。条款θJ+ωK出现在这种情况下，以及附加条款K₂反映了 ${\bar{x}}_{我 .}$ 和 ${\bar{年}}_{我 .}$ 和[JY]一样，证明是基于鞅CLT，而不是基于白和姚（2008），对涉及未归一化随机向量的二次型给出了类似的结果。

虽然可能具有独立利益，提议1通过将其应用于M型，对我们的目的很重要。

提议2

假设模型M，考虑B_n个如中所示提议1.然后，

{W公司}_{n个} = {n个}^{- 1 / 2} [{\bar{X（X）}}_{1} {B类}_{n个} {\bar{X（X）}}_{1}^{T型} - (信托收据 {B类}_{n个}) Γ] \overset{D类}{\to} W公司,

其中W是具有项目W的对称m×m高斯矩阵_ij公司，均值为零，协方差由

Cov公司 [{W公司}_{我 j个}, {W公司}_{我^{'} {j个}^{'}}] = θ (κ_{我 {j个}^{'}} κ_{j个 我^{'}} + κ_{我 我^{'}} κ_{j个 {j个}^{'}}) + ω κ_{我 j个 我^{'} {j个}^{'}} + ϕ {\overset{ˇ}{κ}}_{我 j个 我^{'} {j个}^{'}},

(4.17)

对于i≤j和i′≤j′。

证明结果如下：提议1通过旋转矩阵二次型 ${\bar{X（X）}}_{1} {B类}_{n个} {\bar{X（X）}}_{1}^{T型}$ 变成双线性形式的向量；例如，参见[JY，Proposition 6]和白和姚（2008，建议3.1）。具体来说，使用索引我对于M（M）=米(米+ 1)/2对(我,j个)，1≤我≤j个≤米.构建随机向量(x,年)的提议1如下所示：如果我= (我,j个)，然后设置x_我=ξ_我/σ_我和年_我=ξ_j个/σ_j个在得到的协方差矩阵中C类的(x,年)，如果也是我′ = (我′,j个′),

{C类}_{我 我^{'}}^{x 年} = E类 [ξ_{我} ξ_{{j个}^{'}}] / (σ_{我} σ_{{j个}^{'}}) = κ_{我 {j个}^{'}}, {C类}_{我 我^{'}}^{年 x} = κ_{j个 我^{'}}, {C类}_{我 我^{'}}^{x x} = κ_{我 我^{'}}, {C类}_{我 我^{'}}^{年 年} = κ_{j个 {j个}^{'}}

尤其是， $ρ_{我} = {C类}_{我我}^{x 年} = κ_{我 j个}$ 和 $ρ_{我^{'}} = κ_{我^{'} {j个}^{'}}$ ，而 ${C类}_{我我}^{x x} = {C类}_{我我}^{年年} = 1$ .组件W公司_{n个,ij公司}对应于组件Z轴_我在里面提议1因此，我们得出结论： ${W公司}_{n个} \overset{D类}{\to} W公司$ ，其中W公司是均值为零的高斯矩阵 $Cov公司 ({W公司}_{我 j个}, {W公司}_{我^{'}, {j个}^{'}}) = {D类}_{我我^{'}}$ ，由提供提议1.仍需解释(4.14)就M型而言，替代 $x_{我} = {\bar{ξ}}_{我}$ 和 $年_{我} = {\bar{ξ}}_{j个}$ 进入之内(4.16)并追踪定义，我们得到 $J_{我我^{'}} = κ_{我 {j个}^{'}} κ_{j个我^{'}} + κ_{我我^{'}} κ_{j个 {j个}^{'}}$ 和 ${K（K）}_{我我^{'}} = κ_{我 j个我^{'} {j个}^{'}}$ .观察z（z）_我=x_我年_我=χ_ij公司和 ${w个}_{我} = ρ_{我} (x_{我}^{2} + 年_{我}^{2}) / 2 = ψ_{我 j个}$ ，我们同样发现 ${K（K）}_{2, 我我^{'}} = {\overset{ˇ}{κ}}_{我 j个我^{'} {j个}^{'}}$ . ☐

5.特征值结果的证明

在本节中，我们推导了主要的特征值结果，如定理1和定理3-(我).

5.1. 前期工作

特征值的收敛性R（右）₂₂

众所周知S公司₂₂弱a.s.收敛于Marchenko–Pastur（MP）定律F类_γ，并且极值非平凡特征值收敛到F类_γ。对于样本相关性情况，江（2004b）表明同样适用于R（右）₂₂即特征值的经验分布μ₁≥ … ≥μ_第页“噪声”相关矩阵的 ${R（右）}_{22} = {n个}^{- 1} {\bar{X（X）}}_{2} {\bar{X（X）}}_{2}^{T型}$ 弱a.s.收敛于MP定律F类_γ，支持于 $[一_{γ}, {b条}_{γ}] = [{(1 - \sqrt{γ})}^{2}, {(1 + \sqrt{γ})}^{2}]$ ，如果γ≤1，且在{0}к上[一_γ,b条_γ]否则。此外n个×n个伴随矩阵 ${C类}_{n个} = {n个}^{- 1} {\bar{X（X）}}_{2}^{T型} {\bar{X（X）}}_{2}$ ，用F表示_n个，弱收敛于“伴随MP定律”F_γ= (1 −γ)1_[0,∞)+γF_γ，其中1_A类表示集合A上的指示器功能。

此外，江（2004b）说明了这一点

μ_{1} \overset{一 . 秒 .}{\to} {b条}_{γ} 和 μ_{第页 \land n个} \overset{一 . 秒 .}{\to} 一_{γ} .

(5.18)

根据这些结果，如果（f）_n个→（f）一致地作为闭包上的连续函数 $我$ F的支撑的有界邻域_γ，然后：

\int {（f）}_{n个} (x) {F类}_{n个} (d日 x) \overset{一 . 秒 .}{\to} \int （f） (x) {F类}_{γ} (d日 x) .

(5.19)

如果支持（F_n个)不包含在中 $我$ ，则可能无法定义左侧积分。然而，这样的事件发生的次数最多是有限的n个概率为1。

几乎确定的极限 ${\hat{ℓ}}_{ν}$

中的语句定理1-(我)和定理3-(我)根据已知结果轻松地进行跟踪。具体来说，表示ν样本协方差的第个特征值S公司通过 ${\hat{λ}}_{ν}$ .几乎可以确定的限制

{\hat{λ}}_{ν} \overset{一 . 秒 .}{\to} {\begin{matrix} ρ_{ν}, & ℓ_{ν} > 1 + \sqrt{γ} \\ {(1 + \sqrt{γ})}^{2}, & 1 < ℓ_{ν} \leq 1 + \sqrt{γ} \end{matrix}

(5.20)

成立于Baik和Silverstein（2006）.从证明El Karoui（2009年，引理1），

\underset{我 = 1, ..., 米}{最大值} | {\hat{λ}}_{我} - {\hat{ℓ}}_{我} | \overset{一 . 秒 .}{\to} 0

因此，与(5.20)等待 ${\hat{ℓ}}_{ν}$ .

高盈利活动J_nϵ,J_nϵ1

必要时，我们可以将注意力集中在该事件上 $J_{n个 ϵ} = {{\hat{ℓ}}_{ν} > 最小值 (ρ_{ν}, ρ_{ν n个}) - ϵ, μ_{1} \leq {b条}_{γ} + ϵ}$ 或 $J_{n个 ϵ 1} = {μ_{1} \leq {b条}_{γ} + ϵ}$ ，使用ϵ>0选择为ρ_ν–b条_γ≥ 3ϵ，因为来自(2.5)（如上所述）和(5.18)，这些事件发生的概率为1n个.

的渐近展开 $K（K） ({\hat{ℓ}}_{ν})$

我们建立了二次型的渐近随机展开式 $K（K） ({\hat{ℓ}}_{ν})$ 具体来说，使用分解

K（K） ({\hat{ℓ}}_{ν}) = K（K） (ρ_{ν n个}) + [K（K） ({\hat{ℓ}}_{ν}) - K（K） (ρ_{ν n个})],

(5.21)

我们证明了这一点

K（K） (ρ_{ν n个}) \overset{一 . 秒 .}{\to} - ρ_{ν} 米 (ρ_{ν}; γ) Γ = (ρ_{ν} / ℓ_{ν}) Γ

(5.22)

和

K（K） ({\hat{ℓ}}_{ν}) - K（K） (ρ_{ν n个}) = - ({\hat{ℓ}}_{ν} - ρ_{ν n个}) [c (ρ_{ν}) Γ + {o个}_{一 . 秒 .} (1)],

(5.23)

其中，对于 $t吨 \notin 支持 ({F类}_{γ})$ ,

米 (t吨; γ) = \int {(x - t吨)}^{- 1} {F类}_{γ} (d日 x), c (t吨) = \int x {(t吨 - x)}^{- 2} {F类}_{γ} (d日 x) .

这里，m是伴随分布F的Stieltjes变换_γ.

在建立(5.22)，先取足够大的n个使得|ρ_νn–ρ_ν| ≤ϵ，使用ϵ定义如上。对于这种情况n个，上的J_nϵ1，我们有

‖ {B类}_{n个} (ρ_{ν n个}) ‖ \leq \frac{ρ_{ν} + ϵ}{ϵ} .

因为J_nϵ1持有概率为1的所有大n个, ‖B类_n个(ρ_¦Αn)‖ =O（运行）_美国。（1）因此，它是由引理2那个

K（K） (ρ_{ν n个}) - {n个}^{- 1} 信托收据 {B类}_{n个} (ρ_{ν n个}) Γ \overset{一 . 秒 .}{\to} 0

此外，(5.19)产量

{n个}^{- 1} 信托收据 {B类}_{n个} (ρ_{ν n个}) = \int ρ_{ν n个} {(ρ_{ν n个} - x)}^{- 1} {F类}_{n个} (d日 x) \overset{美国。}{\to} \int ρ_{ν} {(ρ_{ν} - x)}^{- 1} {F类}_{γ} (d日 x) = - ρ_{ν} 米 (ρ_{ν}; γ) .

显式求值给出m(ρ_ν;γ) = −1/ℓ_ν[JY，附录A]，以及(5.22)跟随。

建立(5.23)，我们首先回顾一下 ${C类}_{n个} = {n个}^{- 1} {\bar{X（X）}}_{2}^{T型} {\bar{X（X）}}_{2}$ ，并介绍预解式表示法Z轴(t吨) = (tI公司_n个−C类_n个)⁻¹，因此B类_n个(t吨) =tZ（tZ）(t吨)和 $K（K） (t吨) = {n个}^{- 1} {\bar{X（X）}}_{1} t吨 Z轴 (t吨) {\bar{X（X）}}_{1}^{T型}$ 。从预解恒等式，即，A类⁻¹−B类⁻¹=A类⁻¹(B类−A类)B类⁻¹对于正方形可逆A类和B类，并注意到tZ（tZ）(t吨) =C类_n个Z轴(t吨) +我从伍德伯里的身份来看t吨₁,t吨₂>b条_γ,

{t吨}_{1} Z轴 ({t吨}_{1}) - {t吨}_{2} Z轴 ({t吨}_{2}) = - ({t吨}_{1} - {t吨}_{2}) {C类}_{n个} Z轴 ({t吨}_{1}) Z轴 ({t吨}_{2})

因此，

K（K） ({\hat{ℓ}}_{ν}) - K（K） (ρ_{ν n个}) = - ({\hat{ℓ}}_{ν} - ρ_{ν n个}) {n个}^{- 1} {\bar{X（X）}}_{1} {C类}_{n个} Z轴 ({\hat{ℓ}}_{ν}) Z轴 (ρ_{ν n个}) {\bar{X（X）}}_{1}^{T型} .

此外，根据预解恒等式， $Z轴 ({\hat{ℓ}}_{ν}) = Z轴 (ρ_{ν n个}) - ({\hat{ℓ}}_{ν} - ρ_{ν n个}) Z轴 ({\hat{ℓ}}_{ν}) Z轴 (ρ_{ν n个})$ ，它产生

K（K） ({\hat{ℓ}}_{ν}) - K（K） (ρ_{ν n个}) = - ({\hat{ℓ}}_{ν} - ρ_{ν n个}) {n个}^{- 1} {\bar{X（X）}}_{1} {B类}_{n个 1} (ρ_{ν n个}, ρ_{ν n个}) {\bar{X（X）}}_{1}^{T型} + {({\hat{ℓ}}_{ν} - ρ_{ν n个})}^{2} {n个}^{- 1} {\bar{X（X）}}_{1} {B类}_{n个 2} ({\hat{ℓ}}_{ν}, ρ_{ν n个}) {\bar{X（X）}}_{1}^{T型},

(5.24)

具有B类_编号(t吨₁,t吨₂)定义为

{B类}_{n个 第页} ({t吨}_{1}, {t吨}_{2}) = {C类}_{n个} Z轴 ({t吨}_{1}) {Z轴}^{第页} ({t吨}_{2}) .

(5.25)

我们现在描述了中两个矩阵二次型的一阶行为(5.24)首先，我们简单地反映了(5.22)以获得

{n个}^{- 1} {\bar{X（X）}}_{1} {B类}_{n个 1} (ρ_{ν n个}, ρ_{ν n个}) {\bar{X（X）}}_{1}^{T型} \overset{美国。}{\to} c (ρ_{ν}) Γ .

对于第二种情况，我们再次应用类似的推理，对事件进行操作J_nϵ具体来说，很容易在J_nϵ、和用于n个足够大|ρ_νn–ρ_ν| ≤ϵ, $‖ {B类}_{n个 2} ({\hat{ℓ}}_{ν}, ρ_{ν n个}) ‖$ 有界。因此， $‖ {B类}_{n个 2} ({\hat{ℓ}}_{ν}, ρ_{ν n个}) ‖ = {O（运行）}_{一 . 秒 .} (1)$ ，它是从引理2和(5.19)那个

{n个}^{- 1} {\bar{X（X）}}_{1} {B类}_{n个 2} ({\hat{ℓ}}_{ν}, ρ_{ν n个}) {\bar{X（X）}}_{1}^{T型} = {O（运行）}_{一 . 秒 .} (1) .

年的扩张(5.23)通过将后两个方程与(5.24).

的CLTK（K）(ρ_νn)

我们现在专攻提议2对于矩阵二次型K（K）(ρ_νn).

提案3

假设模型M，并定义ρ_νn通过(1.1)和K（ρ_νn)由(3.13).然后，

{W公司}_{n个} (ρ_{ν n个}) = \sqrt{n个} [K（K） (ρ_{ν n个}) - {n个}^{- 1} 信托收据 {B类}_{n个} (ρ_{ν n个}) Γ] \overset{D类}{\to} {W公司}^{ν},

它是一个带有入口的对称高斯随机矩阵 ${W公司}_{我 j个}^{ν}$ ,均值为零，协方差由

Cov公司 [{W公司}_{我 j个}^{ν}, {W公司}_{我^{'} {j个}^{'}}^{ν}] = \frac{ρ_{ν}^{2}}{ℓ_{ν}^{2} {\dot{ρ}}_{ν}} (κ_{我 {j个}^{'}} κ_{j个 我^{'}} + κ_{我 我^{'}} κ_{j个 {j个}^{'}}) + \frac{ρ_{ν}^{2}}{ℓ_{ν}^{2}} (κ_{我 j个 我^{'} {j个}^{'}} + {\overset{ˇ}{κ}}_{我 j个 我^{'} {j个}^{'}}),

(5.26)

其中ρ_ν和 ${\dot{ρ}}_{ν}$ 定义于(1.1)，括号中的术语定义见(1.2)和(1.4).

证明回忆一下J_nϵ1= {μ₁≤b条_γ+ϵ}，并考虑足够大n个这样的话ρ_νn>ρ_ν–ϵ.然后，我们可以申请提议2具有 ${B类}_{n个} = {B类}_{n个} (ρ_{ν n个}) 1_{J_{n个 \in 1}}$ ，独立于 ${\bar{X（X）}}_{1}$ ，其中‖B类_n个‖有界。具体来说，结果如下：提议2到 ${W公司}_{n个} (ρ_{ν n个}) 1_{J_{n个 \in 1}}$ 以及以下事实 $1_{J_{n个 \in 1}} \overset{美国。}{\to} 1$ 和详细说明ω,θ、和ϕ在里面(4.17)。这些数量分别表示为ω_ν,θ_ν、和ϕ_ν，可按[JY，附录A]计算，得出

ω_{ν} = ϕ_{ν} = \frac{{(ℓ_{ν} - 1 + γ)}^{2}}{{(ℓ_{ν} - 1)}^{2}} = \frac{ρ_{ν}^{2}}{ℓ_{ν}^{2}}, θ_{ν} = \frac{{(ℓ_{ν} - 1 + γ)}^{2}}{{(ℓ_{ν} - 1)}^{2} - γ} = \frac{ω_{ν}}{{\dot{ρ}}_{ν}} .

密封性能

最后，我们建立了推导二阶结果所必需的一些紧性。

我们首先建立了(5.22).定义K（K）₀(ρ;γ) := −ρ米(ρ;γ)Γ，这样(5.22)被重写为 $K（K） (ρ_{ν n个}) \overset{美国。}{\to} {K（K）}_{0} (ρ_{ν}; γ)$ .设置克_ρ(x) =ρ(ρ−x)⁻¹，然后写入

信托收据 {B类}_{n个} (ρ) = \sum_{我 = 1}^{n个} ρ {(ρ - μ_{我})}^{- 1} = \sum_{我 = 1}^{n个} 克_{ρ} (μ_{我}) .

此外，引入

克_{n个} (克) : = \sum_{我 = 1}^{n个} 克 (μ_{我}) - n个 \int 克 (x) {F类}_{γ_{n个}} (d日 x),

我们有

K（K） (ρ) - {K（K）}_{0} (ρ; γ_{n个}) = K（K） (ρ) - {n个}^{- 1} 信托收据 {B类}_{n个} (ρ) Γ + ρ {n个}^{- 1} [\sum_{我 = 1}^{n个} {(ρ - μ_{我})}^{- 1} - n个 \int {(ρ - x)}^{- 1} {F类}_{γ_{n个}} (d日 x)] Γ = {n个}^{- 1 / 2} {W公司}_{n个} (ρ) + {n个}^{- 1} 克_{n个} (克_{ρ}) Γ .

(5.27)

引理3

假设模型M成立，并且 $ℓ_{ν} > 1 + \sqrt{γ}$ 很简单。对于某些b>ρ₁，让我表示间隔[b_γ+3ϵ，b]。然后，

{克_{n个} (克_{ρ}), ρ \in 我} 我 秒 u个 n个 我 （f） o个 第页 米 我 年 t吨 我 克 小时 t吨,

(5.28)

{{n个}^{1 / 2} [K（K） (ρ) - {K（K）}_{0} (ρ; γ_{n个})], ρ \in 我} 我 秒 u个 n个 我 （f） o个 第页 米 我 年 t吨 我 克 小时 t吨,

(5.29)

{\hat{ℓ}}_{ν} - ρ_{ν n个} = {O（运行）}_{第页} ({n个}^{- 1 / 2}),

(5.30)

一_{ν} - {第页}_{ν} = {O（运行）}_{第页} ({n个}^{- 1 / 2}) .

(5.31)

证明.的证明(5.28)–(5.30)出现在补充材料,S2系列.我们展示(5.31)使用扩展 $一_{ν} - {第页}_{ν} = - {R（右）}_{ν n个} {D类}_{ν} {第页}_{ν} + {第页}_{ν}$ ，中给出(3.12)，我们回忆起‖第页_ν‖ =O（运行）(‖D类_ν‖²)并注意到 $‖ {R（右）}_{ν n个} ‖ \leq C类$ 和 ${D类}_{ν} = K（K） ({\hat{ℓ}}_{ν}) - {K（K）}_{0} (ρ_{ν n个}; γ_{n个})$ 。然后我们有一_ν−第页_ν=O（运行）_第页(‖D类_ν‖ + ‖D类_ν‖²). 此外，从

‖ {D类}_{ν} ‖ \leq ‖ K（K） ({\hat{ℓ}}_{ν}) - K（K） (ρ_{ν n个}) ‖ + ‖ K（K） (ρ_{ν n个}) - {K（K）}_{0} (ρ_{ν n个}; γ_{n个}) ‖,

第一学期是O（运行）_第页(n个^−1/2)由(5.23)和(5.30)第二学期(5.29)因此，

‖ {D类}_{ν} ‖ = {O（运行）}_{第页} ({n个}^{- 1 / 2}),

(5.32)

证明已经完成。☐

5.2. 特征值推论(定理1-(ii（ii）))

证明定理1-(ii（ii）)依赖关键扩展

\sqrt{n个} ({\hat{ℓ}}_{ν} - ρ_{ν n个}) [1 + c (ρ_{ν}) ℓ_{ν} + {o个}_{第页} (1)] = {第页}_{ν}^{T型} {W公司}_{n个} (ρ_{ν n个}) {第页}_{ν} + {o个}_{第页} (1),

(5.33)

通过组合向量方程得到 $K（K） ({\hat{ℓ}}_{ν}) 一_{ν} = {\hat{ℓ}}_{ν} 一_{ν}$ 和K（K）₀(ρ_νn;γ_n个)第页_ν=ρ_νn第页_ν带有扩展(5.24)对于 $K（K） ({\hat{ℓ}}_{ν}) - K（K） (ρ_{ν n个})$ 和(5.27)对于K（K）(ρ_νn) −K（K）₀(ρ_νn;γ_n个). 具体来说，我们首先使用 $[K（K） ({\hat{ℓ}}_{ν}) - {\hat{ℓ}}_{ν} 我_{米}] 一_{ν} = 0$ 以获得

{第页}_{ν}^{T型} [K（K） ({\hat{ℓ}}_{ν}) - {\hat{ℓ}}_{ν} 我_{米}] {第页}_{ν} = {(一_{ν} - {第页}_{ν})}^{T型} [K（K） ({\hat{ℓ}}_{ν}) - {\hat{ℓ}}_{ν} 我_{米}] (一_{ν} - {第页}_{ν}) = {O（运行）}_{第页} ({n个}^{- 1}),

(5.34)

因为 $‖ K（K） ({\hat{ℓ}}_{ν}) - {\hat{ℓ}}_{ν} 我_{米} ‖ = {O（运行）}_{第页} (1)$ 从(5.21)–(5.23)和(2.5)、和一_ν−第页_ν=O（运行）_第页(n个^−1/2)来自引理3。此外，因为[K（K）₀(ρ_νn;γ_n个) −ρ_νn我_米]第页_ν=0，如下所示

{第页}_{ν}^{T型} [K（K） ({\hat{ℓ}}_{ν}) - {\hat{ℓ}}_{ν} 我_{米}] {第页}_{ν} = {第页}_{ν}^{T型} [K（K） ({\hat{ℓ}}_{ν}) - {K（K）}_{0} (ρ_{ν n个}; γ_{n个}) - ({\hat{ℓ}}_{ν} - ρ_{ν n个}) 我_{米}] {第页}_{ν} = {第页}_{ν}^{T型} [K（K） ({\hat{ℓ}}_{ν}) - K（K） (ρ_{ν n个}) - ({\hat{ℓ}}_{ν} - ρ_{ν n个}) 我_{米}] {第页}_{ν} + {第页}_{ν}^{T型} [K（K） (ρ_{ν n个}) - {K（K）}_{0} (ρ_{ν n个}; γ_{n个})] {第页}_{ν} = - ({\hat{ℓ}}_{ν} - ρ_{ν n个}) [1 + c (ρ_{ν}) ℓ_{ν} + {o个}_{第页} (1)] + {n个}^{- 1 / 2} {第页}_{ν}^{T型} {W公司}_{n个} (ρ_{ν n个}) {第页}_{ν} + {o个}_{第页} ({n个}^{- 1 / 2}),

(5.35)

其中最后一个等式来自(5.23),(5.27)、和(5.28).组合(5.34)和(5.35)产量(5.33).

的渐近正态性 $\sqrt{n个} ({\hat{ℓ}}_{ν} - ρ_{ν n个})$ 现在从提案3，具有渐近方差

{\tilde{σ}}_{ν}^{2} = {[1 + c (ρ_{ν}) ℓ_{ν}]}^{- 2} 变量 [{第页}_{ν}^{T型} {W公司}^{ν} {第页}_{ν}] = {({\dot{ρ}}_{ν} ℓ_{ν} / ρ_{ν})}^{2} \sum_{我, j个, 我^{'}, {j个}^{'}} {P（P）}_{我 j个 我^{'} {j个}^{'}}^{ν} Cov公司 [{W公司}_{我 j个}^{ν}, {W公司}_{我^{'} {j个}^{'}}^{ν}],

哪里W公司^ν是米×米中定义的对称高斯随机矩阵提案3，具有协方差 $Cov公司 [{W公司}_{我 j个}^{ν}, {W公司}_{我^{'} {j个}^{'}}^{ν}]$ 由提供(5.26)。在上述方差的开发表达式中使用此项将导致

{\tilde{σ}}_{ν}^{2} = {\dot{ρ}}_{ν} \sum_{我, j个, 我^{'}, {j个}^{'}} {P（P）}_{我 j个 我^{'} {j个}^{'}}^{ν} (κ_{我 {j个}^{'}} κ_{j个 我^{'}} + κ_{我 我^{'}} κ_{j个 {j个}^{'}}) + {\dot{ρ}}_{ν}^{2} [{P（P）}^{ν}, κ + \overset{ˇ}{κ}] .

(5.36)

通过对称性和本征方程 ${(Γ {第页}_{ν})}_{我} = \sum_{j个} κ_{我 j个} {第页}_{ν, j个} = ℓ_{ν} {第页}_{ν, 我}$ ，我们有

\sum_{我, j个, 我^{'}, {j个}^{'}} {P（P）}_{我 j个 我^{'} {j个}^{'}}^{ν} κ_{我 我^{'}} κ_{j个 {j个}^{'}} = \sum_{我, j个, 我^{'}, {j个}^{'}} {P（P）}_{我 j个 我^{'} {j个}^{'}}^{ν} κ_{我 {j个}^{'}} κ_{j个 我^{'}} = \sum_{我, j个} {第页}_{ν, 我} {第页}_{ν, j个} {(Γ {第页}_{ν})}_{我} {(Γ {第页}_{ν})}_{j个} = ℓ_{ν}^{2} \sum_{我, j个} {({第页}_{ν, 我} {第页}_{ν, j个})}^{2} = ℓ_{ν}^{2} .

因此(5.36)减少到 $2 {\dot{ρ}}_{ν} ℓ_{ν}^{2}$ ，屈服公式(2.6)属于定理1.

6.特征向量结果的证明

我们现在推导出主要特征向量结果，如定理2和定理3-(ii（ii）).

6.1. 特征向量不一致(定理2-(我))

的收敛结果定理2-(我)以下是两个事实： $一_{ν} \overset{一 . 秒 .}{\to} {第页}_{ν}$ 和 $问_{ν} \overset{一 . 秒 .}{\to} c (ρ_{ν}) Γ$ ，如下所示。一旦这些事实成立(3.10),

{‖ {\hat{第页}}_{ν} ‖}^{- 2} \overset{美国。}{\to} {第页}_{ν}^{T型} (我_{米} + c (ρ_{ν}) Γ) {第页}_{ν} = 1 + c (ρ_{ν}) ℓ_{ν} = \frac{ρ_{ν}}{ℓ_{ν} {\dot{ρ}}_{ν}},

这将导致

美国。 林 {〈 {\hat{第页}}_{ν}, {第页}_{ν} 〉}^{2} = 美国。 林 {〈 {\hat{第页}}_{ν}, {第页}_{ν} 〉}^{2} = 美国。 林 {‖ {\hat{第页}}_{ν} ‖}^{2} = \frac{ℓ_{ν} {\dot{ρ}}_{ν}}{ρ_{ν}} .

的证明 $一_{ν} \overset{美国。}{\to} {第页}_{ν}$

这是以下情况的直接后果(3.12)和

{D类}_{ν} = K（K） (ρ_{ν n个}) - (ρ_{ν n个} / ℓ_{ν}) Γ + K（K） ({\hat{ℓ}}_{ν}) - K（K） (ρ_{ν n个}) \overset{一 . 秒 .}{\to} 0,

以下为(5.22),(5.23)以及以下事实 ${\hat{ℓ}}_{ν} - ρ_{ν n个} \overset{美国。}{\to} 0$ ，中给出(2.5).

的证明 $问_{ν} \overset{一 . 秒 .}{\to} c (ρ_{ν}) Γ$

使用 $\overset{ˇ}{Z轴} (t吨) = {(t吨我_{第页} - {R（右）}_{22})}^{- 1}$ ，我们有

问_{ν} = {R（右）}_{12} {\overset{ˇ}{Z轴}}^{2} (ρ_{ν}) {R（右）}_{21} + {R（右）}_{12} [{\overset{ˇ}{Z轴}}^{2} ({\hat{ℓ}}_{ν}) - {\overset{ˇ}{Z轴}}^{2} (ρ_{ν})] {R（右）}_{21} ≜ 问_{ν 1} + 问_{ν 2} .

重写 $问_{ν 1} = {n个}^{- 1} {\bar{X（X）}}_{1} {\overset{ˇ}{B类}}_{n个 1} {\bar{X（X）}}_{1}^{T型}$ ，使用 ${\overset{ˇ}{B类}}_{n个 1} = {n个}^{- 1} {\bar{X（X）}}_{2}^{T型} {\overset{ˇ}{Z轴}}^{2} (ρ_{ν}) {\bar{X（X）}}_{2}$ .关于高概率事件J_nϵ1= {μ₁≤b条_γ+ϵ}，使用ϵ>0，这样ρ_ν–b条_γ≥ 2ϵ，很容易确定 $‖ {\overset{ˇ}{B类}}_{n个 1} ‖$ 是有界的，因此 $‖ {\overset{ˇ}{B类}}_{n个 1} ‖ = {O（运行）}_{一 . 秒 .} (1)$ 因此，引理2可以应用于问_ν1此外，来自(5.19)并注意到

{n个}^{- 1} 信托收据 {\overset{ˇ}{B类}}_{n个 1} = {n个}^{- 1} 信托收据 {B类}_{n个 1} (ρ_{ν}, ρ_{ν}),

具有B类_n个1定义于(5.25)，我们有

{n个}^{- 1} 信托收据 {\overset{ˇ}{B类}}_{n个 1} \overset{一 . 秒 .}{\to} \int x {(ρ_{ν} - x)}^{- 2} {F类}_{γ} (d日 x) = c (ρ_{ν}) .

这个和引理2暗示 $问_{ν 1} \overset{美国。}{\to} c (ρ_{ν}) Γ$ .

还有待展示 $问_{ν 2} \overset{一 . 秒 .}{\to} 0$ 。使用预解式标识的变体，即，A类⁻²−B类⁻²= −A类⁻²(A类²−B类²)B类⁻²对于正方形可逆A类和B类，我们重写

问_{ν 2} = - 2 ({\hat{ℓ}}_{ν} - ρ_{ν}) {n个}^{- 1} {\bar{X（X）}}_{1} {\overset{ˇ}{B类}}_{n个 2} {\bar{X（X）}}_{1}^{T型},

具有 ${\overset{ˇ}{B类}}_{n个 2} = {n个}^{- 1} {\bar{X（X）}}_{2}^{T型} {\overset{ˇ}{Z轴}}^{2} ({\hat{ℓ}}_{ν}) [\frac{1}{2} ({\hat{ℓ}}_{ν} + ρ_{ν}) 我 - {R（右）}_{22}] {\overset{ˇ}{Z轴}}^{2} (ρ_{ν}) {\bar{X（X）}}_{2}$ .处理高概率事件J_nϵ，可以验证 $‖ {\overset{ˇ}{B类}}_{n个 2} ‖ = {O（运行）}_{一 . 秒 .} (1)$ 因此，引理2与一起(5.19)暗示 ${n个}^{- 1} {\bar{X（X）}}_{1} {\overset{ˇ}{B类}}_{n个 2} {\bar{X（X）}}_{1}^{T型} = {O（运行）}_{一 . 秒 .} (1)$ .因为 ${\hat{ℓ}}_{ν} \overset{一 . 秒 .}{\to} ρ_{ν}$ ，我们得出结论 $问_{ν 2} \overset{美国。}{\to} 0$ .

6.2. 特征向量波动(定理2-(ii（ii）))

同样，我们使用密钥扩展(3.12).因为‖第页_ν‖ =O（运行）(‖D类_ν‖²) =O（运行）_第页(n个⁻¹)来自(5.32)，我们有

\sqrt{n个} (一_{ν} - {第页}_{ν}) = - {R（右）}_{ν n个} \sqrt{n个} {D类}_{ν} {第页}_{ν} + {o个}_{第页} (1) .

此外，使用类似的分解推导(5.35),

\sqrt{n个} {D类}_{ν} = \sqrt{n个} [K（K） ({\hat{ℓ}}_{ν}) - K（K） (ρ_{ν n个})] + \sqrt{n个} [K（K） (ρ_{ν n个}) - {K（K）}_{0} (ρ_{ν n个}, γ_{n个})] = {W公司}_{n个} (ρ_{ν n个}) - \sqrt{n个} ({\hat{ℓ}}_{ν} - ρ_{ν n个}) c (ρ_{ν}) Γ + {o个}_{第页} (1),

我们使用的位置(5.23)和(5.27)，以及(5.28)和(5.30)属于引理3因此，请注意 ${R（右）}_{ν n个} Γ {第页}_{ν} = ℓ_{ν} {R（右）}_{ν n个} {第页}_{ν} = 0$ 从定义 ${R（右）}_{ν n个}$ 在里面(3.12)，我们有

\sqrt{n个} (一_{ν} - {第页}_{ν}) = - {R（右）}_{ν n个} {W公司}_{n个} (ρ_{ν n个}) {第页}_{ν} + {o个}_{第页} (1),

或同等标准，

\sqrt{n个} ({P（P）}^{T型} 一_{ν} - {e（电子）}_{ν}) = - {\tilde{R（右）}}_{ν n个} {\tilde{W公司}}_{n个} (ρ_{ν n个}) {e（电子）}_{ν} + {o个}_{第页} (1),

哪里

{\tilde{R（右）}}_{ν n个} = \frac{ℓ_{ν}}{ρ_{ν n个}} \sum_{k个 \neq ν}^{米} {(ℓ_{k个} - ℓ_{ν})}^{- 1} {e（电子）}_{k个} {e（电子）}_{k个}^{T型}, {\tilde{W公司}}_{n个} (ρ_{ν n个}) = {P（P）}^{T型} {W公司}_{n个} (ρ_{ν n个}) P（P） .

的CLTP（P）^T型一_ν现在从提案3特别是，

\sqrt{n个} ({P（P）}^{T型} 一_{ν} - {e（电子）}_{ν}) \overset{D类}{\to} {\tilde{R（右）}}_{ν} {w个}_{ν} ~ N个 (0, Σ_{ν}),

哪里 ${\tilde{R（右）}}_{ν} = (ℓ_{ν} / ρ_{ν}) {D类}_{ν}$ ，召回(2.8)、和w个_ν=P（P）^T型 W公司^ν第页_ν，使用W公司^ν定义于提案3.协方差矩阵 $Σ_{ν} = {\tilde{R（右）}}_{ν} E类 [{w个}_{ν} {w个}_{ν}^{T型}] {\tilde{R（右）}}_{ν} = {D类}_{ν} {\tilde{Σ}}_{ν} {D类}_{ν}$ ，使用 ${\tilde{Σ}}_{ν} = {(ℓ_{ν} / ρ_{ν})}^{2} E类 [{w个}_{ν} {w个}_{ν}^{T型}]$ . Thek个的第个分量w个_ν由提供 ${w个}_{ν} (k个) = {第页}_{k个}^{T型} {W公司}^{ν} {第页}_{ν} = \sum_{我, j个} {第页}_{k个, 我} {W公司}_{我 j个}^{ν} {第页}_{ν, j个}$ 因此，

{\tilde{Σ}}_{ν, k个 我} = \sum_{我, j个, 我^{'}, {j个}^{'}} {第页}_{k个, 我} {第页}_{ν, j个} {第页}_{我, 我^{'}} {第页}_{ν, {j个}^{'}} {(ℓ_{ν} / ρ_{ν})}^{2} Cov公司 [{W公司}_{我 j个}^{ν}, {W公司}_{我^{'} {j个}^{'}}^{ν}] .

(6.37)

定理2-(ii（ii）)替换后跟随(5.26)对于 $Cov公司 [{W公司}_{我 j个}^{ν}, {W公司}_{我^{'} {j个}^{'}}^{ν}]$ 并注意到，当k个,我≠ν,

\sum_{我, j个, 我^{'}, {j个}^{'}} {第页}_{k个, 我} {第页}_{ν, j个} {第页}_{我, 我^{'}} {第页}_{ν, {j个}^{'}} (κ_{我 我^{'}} κ_{j个 {j个}^{'}} + κ_{我 {j个}^{'}} κ_{j个 我^{'}}) = {第页}_{k个}^{T型} Γ {第页}_{我} \cdot {第页}_{ν}^{T型} Γ {第页}_{ν} + {第页}_{k个}^{T型} Γ {第页}_{ν} \cdot {第页}_{ν}^{T型} Γ {第页}_{我} = δ_{k个 我} ℓ_{k个} ℓ_{ν} .

6.3. 亚临界情况下的特征向量不一致性(定理3-(ii（ii）))

发件人(3.10)和(3.11)，足以证明 $一_{ν}^{T型} 问_{ν} 一_{ν} \overset{一 . 秒 .}{\to} \infty$ 为了定理3-(ii（ii）)等待。我们通过展示 $λ_{最小值} (问_{ν}) \overset{美国。}{\to} \infty$ 。该方法使用的是问_ν,

问_{ν ϵ} (t吨) = {R（右）}_{12} {[{(t吨 我_{第页} - {R（右）}_{22})}^{2} + ϵ^{2} 我_{第页}]}^{- 1} {R（右）}_{21},

对于ϵ> 0. 请注意 $问_{ν} ≻ 问_{ν ϵ} ({\hat{ℓ}}_{ν})$ ，因此

林 inf公司 λ_{最小值} (问_{ν}) \geq 林 inf公司 λ_{最小值} (问_{ν ϵ} ({\hat{ℓ}}_{ν})) = 林 inf公司 λ_{最小值} (问_{ν ϵ} ({b条}_{γ}) + Δ_{ν ϵ}),

哪里 $Δ_{ν ϵ} : = 问_{ν ϵ} ({\hat{ℓ}}_{ν}) - 问_{ν ϵ} ({b条}_{γ})$ （回忆一下 ${\hat{ℓ}}_{ν} \overset{美国。}{\to} {b条}_{γ})$ 。我们证明了这一点 $Δ_{ν ϵ} \overset{一 . 秒 .}{\to} 0$ 、和

问_{ν ϵ} ({b条}_{γ}) \overset{一 . 秒 .}{\to} \int x {[{({b条}_{γ} - x)}^{2} + ϵ^{2}]}^{- 1} {F类}_{γ} (d日 x) \cdot Γ = c_{γ} (ϵ) Γ,

(6.38)

说。因为λ_最小值（·）是上的连续函数米×米矩阵，我们得出以下结论

林 inf公司 λ_{最小值} (问_{ν}) \geq c_{γ} (ϵ) λ_{最小值} (Γ),

(6.39)

而且因为c_γ(ϵ) ≥c(b条_γ+ϵ)和c(b条_γ+ϵ) ↗ ∞ 作为ϵ↘ 0，通过[JY，附录A]，我们获得 $λ_{最小值} (问_{ν}) \overset{美国。}{\to} \infty$ .我们写作 $问_{ν ϵ} (t吨) = {n个}^{- 1} {\bar{X（X）}}_{1} {\overset{ˇ}{B类}}_{n个 ϵ} (t吨) {\bar{X（X）}}_{1}$ ，使用

{\overset{ˇ}{B类}}_{n个 ϵ} (t吨) = {n个}^{- 1} {\bar{X（X）}}_{2}^{T型} {[{(t吨 我_{第页} - {n个}^{- 1} {\bar{X（X）}}_{2} {\bar{X（X）}}_{2}^{T型})}^{2} + ϵ^{2} 我_{第页}]}^{- 1} {\bar{X（X）}}_{2} = H（H） 诊断 {{（f）}_{ϵ} (μ_{我}, t吨)} {H（H）}^{T型},

如果我们写下奇异值分解 ${n个}^{- 1 / 2} {\bar{X（X）}}_{2} = V（V） {M（M）}^{1 / 2} {H（H）}^{T型}$ ，使用 $M（M） = 诊断 {(μ_{我})}_{我 = 1}^{第页}$ 并定义 ${（f）}_{ϵ} (μ, t吨) = μ {[{(t吨 - μ)}^{2} + ϵ^{2}]}^{- 1}$ 显然， $‖ {\overset{ˇ}{B类}}_{n个 ϵ} (t吨) ‖ \leq ϵ^{- 2} μ_{1}$ 几乎肯定是有界的。因此，引理2可以应用于问_νϵ(b条_γ)，因为

{n个}^{- 1} 信托收据 {\overset{ˇ}{B类}}_{n个 ϵ} ({b条}_{γ}) \overset{一 . 秒 .}{\to} \int {（f）}_{ϵ} (x, {b条}_{γ}) {F类}_{γ} (d日 x) = c_{γ} (ϵ)

从(5.19)，我们的索赔(6.38)跟随。

现在考虑Δ_νϵ.修复 $一 \in ℝ^{米}$ 这样‖一‖₂=1，并设置 $b条 = {n个}^{- 1 / 2} {H（H）}^{T型} {\bar{X（X）}}_{1}^{T型} 一$ .我们有

一^{T型} Δ_{ν ϵ} 一 = \sum_{我 = 1}^{第页} {b条}_{我}^{2} [{（f）}_{ϵ} (μ_{我}, {\hat{ℓ}}_{ν}) - {（f）}_{ϵ} (μ_{我}, {b条}_{γ})] .

因为 $| \partial {（f）}_{ϵ} (μ, t吨) / \partial t吨 | = | 2 μ (t吨 - μ) | / {[{(t吨 - μ)}^{2} + ϵ^{2}]}^{2} \leq μ / ϵ^{三}$ ，用于μ,ϵ>0，通过算术平均-几何平均不等式，我们得到

| 一^{T型} Δ_{ν ϵ} 一 | \leq μ_{1} ϵ^{- 三} | {\hat{ℓ}}_{ν} - {b条}_{γ} | \cdot ‖ b条 ‖_{2}^{2} = μ_{1} ϵ^{- 三} | {\hat{ℓ}}_{ν} - {b条}_{γ} | 一^{T型} {R（右）}_{11} 一 \leq μ_{1} ϵ^{- 三} | {\hat{ℓ}}_{ν} - {b条}_{γ} | {\hat{ℓ}}_{1} \overset{美国。}{\to} 0,

根据对称矩阵特征值的柯西交错不等式，定理1-(我)和定理3-(我). 因此， $Δ_{ν ϵ} \overset{一 . 秒 .}{\to} 0$ 和证明(6.39)因此定理3-(ii（ii）)已完成。

补充材料

供应_初始_最终.pdf

单击此处查看。^{（249K，pdf）}

致谢

这项工作得到了NIH R01 EB001988（IMJ，JY）、香港RGC普通研究基金16202918（MRM，DMJ）和三星奖学金（JY）的部分支持。

脚注

补充材料

在线补充材料提供以下证据：(我)我们主要结果的高斯特殊化(推论1和2); (ii（ii）)仪表气密性引理3; 和(三)中归一化双线性形式的渐近性质引理1和提议1; 看见截面S1,S2系列、和第3章分别是。

工具书类

Bai Z和Yao J-F（2008）。尖峰种群模型特征值的中心极限定理.《亨利·庞加莱研究所年鉴》，概率与统计 44(三), 447–474.[谷歌学者]
Bai ZD和Silverstein J（2009）。大维随机矩阵的谱分析（第二版）。纽约：斯普林格。[谷歌学者]
Baik J、Ben Arous G和PéchéS（2005年）。非零复样本协方差矩阵最大特征值的相变.概率年报 33(5), 1643–1697.[谷歌学者]
Baik J和Silverstein JW（2006）。尖峰种群模型大样本协方差矩阵的特征值.多元分析杂志 97(6), 1382–1408.[谷歌学者]
Bao Z、Pan G和Zhou W（2012）。样本相关矩阵极值特征值的Tracy-Widom定律.概率电子杂志 17, 1–32.[谷歌学者]
Benaych-Georges F和Nadakuditi RR（2011年）。大型随机矩阵有限低秩摄动的特征值和特征向量.数学进展 227(1), 494–521.[谷歌学者]
Bianchi P、Najim J、Maida M和Debbah M（2009年）。基于特征的协同感知假设检验的性能分析2009年IEEE/SP第15届统计信号处理研讨会，第5-8页。[谷歌学者]
Bloemendal A、Knowles A、Yau H-T和Yin J（2016）。关于样本协方差矩阵的主成分.概率论及其相关领域 164(1), 459–552.[谷歌学者]
Boik RJ（2003）。相关矩阵的主成分模型.生物特征 90(三), 679–701.[谷歌学者]
Cai TT和Jiang T（2011）。随机矩阵相干性的限制律及其在协方差结构测试和压缩传感矩阵构造中的应用.统计年刊 39(三), 1496–1525.[谷歌学者]
Cai TT和Jiang T（2012）。高维随机矩阵相干极限分布中的相变.多元分析杂志 107, 24–39.[谷歌学者]
Cocco S、Monasson R和Sessak V（2011年）。广义Hopfield模型的高维推理：主成分分析和修正.物理审查E 83(5), 051123. [公共医学][谷歌学者]
Cocco S、Monasson R和Weigt M（2013年）。从主成分到蛋白质协同进化的直接耦合分析：结构预测需要低本征值模式.计算生物学 9(8), 1–17.[PMC免费文章][公共医学][谷歌学者]
Cochran D、Gish H和Sinno D（1995年）。一种多通道信号检测的几何方法.IEEE信号处理汇刊 43(9), 2049–2057.[谷歌学者]
Couillet R和Debbah M（2011年）。无线通信中的随机矩阵方法剑桥大学出版社。[谷歌学者]
Couillet R和Hachem W（2013）。传感器网络中尖峰随机矩阵模型的波动与故障诊断.IEEE信息理论汇刊 59(1), 509–525.[谷歌学者]
Dahirel V、Shekhar K、Pereyra F、Miura T、Artyomov M、Talsania S、Allen TM、Altfeld M、Carrington MN、Irvine DJ、Walker BD和Chakraborty AK（2011年）。HIV进化的协调联系揭示了免疫脆弱性区域.美国国家科学院院刊 108(28), 11530–11535.[PMC免费文章][公共医学][谷歌学者]
El Karoui N（2009年）。随机矩阵的测度和谱的集中：在相关矩阵、椭圆分布及其他方面的应用.应用概率年鉴 19(6), 2362–2405.[谷歌学者]
Fang C和Krishnaiah P（1982）。非正态总体随机矩阵特征值函数的渐近分布.多元分析杂志 12(1), 39–63.[谷歌学者]
高J、韩X、潘G和杨Y（2017）。高维相关矩阵：中心极限定理及其应用.英国皇家统计学会杂志：B辑（统计方法） 79(三), 677–693.[谷歌学者]
Girshick MA（1939年）。行列式方程根的抽样理论.数理统计年报 10(三), 203–224.[谷歌学者]
Hachem W、Loubaton P、Mestre X、Najim J和Vallet P（2013年）。大随机矩阵定秩扰动的子空间估计.多元分析杂志 114, 427–447.[谷歌学者]
《英雄A》和《拉贾拉特南B》（2011年）。大尺度相关筛选.美国统计协会杂志 106(496), 1540–1552.[谷歌学者]
英雄A和拉贾拉特南B（2012）。部分相关图中的中心发现.IEEE信息理论汇刊 58(9), 6064–6078.[谷歌学者]
姜涛（2004a）。样本相关矩阵最大项的渐近分布.应用概率年鉴 14(2), 865–880.[谷歌学者]
江T（2004b）。样本相关矩阵特征值的极限分布.桑赫拉：印度统计杂志（2003-2007） 66(1), 35–48.[谷歌学者]
Johnstone IM（2001）。主成分分析中最大特征值的分布.统计年刊 29(2), 295–327.[谷歌学者]
Johnstone IM和Yang J（2018）。关于非高斯数据尖峰模型样本特征结构渐近性的注记.arXiv:1810.10427.[谷歌学者]
Kollo T和Neudecker H（1993年）。样本方差矩阵和相关矩阵的特征值和单位长度特征向量的渐近性.多元分析杂志 47(2), 283–300.[谷歌学者]
Konishi S（1979）。主成分分析中基于样本相关矩阵的统计分布的渐近展开式.广岛数学杂志 9(三), 647–700.[谷歌学者]
Leshem A和van der Veen A-J（2001）。基于未校准接收机的高斯信号多通道检测.IEEE信号处理信件 8(4), 120–122.[谷歌学者]
刘华、胡忠、勉A、田华和朱X（2014）。一种新的用户相似性模型用于提高协同过滤的准确性.基于知识的系统 56, 156–166.[谷歌学者]
Mestre X和Vallet P（2017年）。样本相关矩阵的相关检验和线性谱统计.IEEE信息理论汇刊 63(7), 4585–4618.[谷歌学者]
Paul D（2007）。大维尖峰协方差模型样本特征结构的渐近性.中国统计局 17, 1617–1642.[谷歌学者]
Pillai NS和Yin J（2012）。相关矩阵的边普适性.统计年刊 40(三), 1737–1763.[谷歌学者]
Plerou V、Gopikrishnan P、Rosenow B、Amaral L、Guhr T和Stanley H（2002年）。金融数据互相关的随机矩阵方法.物理审查E 65, 066126. [公共医学][谷歌学者]
Quadeer AA、Louie RHY、Shekhar K、Chakraborty AK、Hsing I-M和McKay MR（2014）。基因型1a丙型肝炎病毒非结构蛋白3患者衍生序列替代的统计连锁分析暴露了免疫原设计的靶点.病毒学杂志 88(13), 7628–7644.[PMC免费文章][公共医学][谷歌学者]
Quadeer AA、Morales-Jimenez D和McKay MR（2018年）。HIV/HCV的协同进化网络是模块化的，与结构和功能直接相关.计算生物学 14(9), 1–29.[PMC免费文章][公共医学][谷歌学者]
阮D、孟T和高K（2016）。基于降维优化的混合推荐技术2016年第八届国际建模、识别和控制会议（ICMIC），第429-433页。[谷歌学者]
Schott JR（1991）。相关矩阵特定主成分的测试.美国统计协会杂志 86(415), 747–751.[谷歌学者]
Vallet P、Mestre X和Loubaton P（2015）。一种改进MUSIC DoA估计器的性能分析.IEEE信号处理汇刊 63(23), 6407–6422.[谷歌学者]
Xiao H和Zhou W（2010）。某些样本相关矩阵最小特征值的几乎必然极限.理论概率杂志 23(1), 1–20.[谷歌学者]
Yang L、McKay MR和Couillet R（2018年）。高维MVDR波束形成：基于峰值随机矩阵模型的优化解决方案.IEEE信号处理汇刊 66(7), 1933–1947.[谷歌学者]
姚J、郑S和白Z（2015）。大样本协方差矩阵与高维数据分析。剑桥统计与概率数学系列剑桥大学出版社。[谷歌学者]

高维尖峰模型样本相关矩阵特征结构的渐近性

大卫·莫拉莱斯·希梅内兹

伊恩·约翰斯通

马修·R·麦凯

杰哈·杨

关联数据

摘要

1.简介

技术贡献

M型

符号

张量表示法

2.主要成果

定理1

推论1

定理2

推论2

定理3

3.前期工作

4.具有规范化条目的二次型

4.1. 一阶收敛

引理1

推论3

引理2

4.2. 中心极限定理

提议1

提议2

5.特征值结果的证明

5.1. 前期工作

特征值的收敛性R（右）22

几乎确定的极限ℓ^ν

高盈利活动Jnϵ,Jnϵ1

的渐近展开K（K）(ℓ^ν)

的CLTK（K）(ρνn)

提案3

密封性能

引理3

5.2. 特征值推论(定理1-(ii（ii）))

6.特征向量结果的证明

6.1. 特征向量不一致(定理2-(我))

的证明一ν→美国。第页ν

的证明问ν→一.秒.c(ρν)Γ

6.2. 特征向量波动(定理2-(ii（ii）))

6.3. 亚临界情况下的特征向量不一致性(定理3-(ii（ii）))

补充材料

供应_初始_最终.pdf

致谢

脚注

工具书类

特征值的收敛性R（右）₂₂

几乎确定的极限 ${\hat{ℓ}}_{ν}$

高盈利活动J_nϵ,J_nϵ1

的渐近展开 $K（K） ({\hat{ℓ}}_{ν})$

的CLTK（K）(ρ_νn)

的证明 $一_{ν} \overset{美国。}{\to} {第页}_{ν}$

的证明 $问_{ν} \overset{一 . 秒 .}{\to} c (ρ_{ν}) Γ$