高维异方差数据的最优加权PCA

@第{条宏2018OptimallyWP,title={高维异方差数据的最优加权PCA},author={David Hong和F.Yang以及Jeffrey A.Fessler和Laura Balzano},journal={SIAM J.数学数据科学},年份={2018年},体积={5},页数={222-250},网址={https://api.semanticscholar.org/CorpusID:88522578}}
本文通过给具有较大噪声方差的样本较小的影响,分析了主成分分析的一种加权变体,该变体考虑了异方差,推导了最优权重,表征了加权主成分分析的性能,并考虑了在预算约束下最优收集样本的问题。

本文图表

HePPCAT:具有异方差噪声的数据的概率主成分分析

一种异方差概率主成分分析技术(HePPCAT),它使用高效的交替最大化算法联合估计潜在因素和未知噪声方差,与不考虑异方差的技术相比,可以给出更好的主成分分析估计。

ALPCAH:带尾部奇异值正则化的样本异方差PCA

提出了一种PCA方法,该方法可以估计样本噪声方差,并在模型中使用该信息来改进与数据低秩结构相关的子空间基的估计。

异方差噪声下缺失数据的流式概率PCA

提出了一种用于主成分分析的流式异方差ASTic算法(SHASTA-PCA),该算法是一种随机交替期望最大化方法,它从可能存在缺失项和异方差噪声的流数据中联合学习低阶潜在因素和未知噪声方差,同时保持低内存和计算占用空间。

异方差噪声下的最优谱收缩和主成分分析

证明了对于一般信号,白化改进了主成分的估计,增加了观测值的自然信噪比,并表明对于秩1信号,估计的主成分达到了渐近最小最大速率。

分组异方差秩一矩阵估计的基本极限

本文研究了在不同噪声水平下观测到矩阵的不同块时,从高斯观测值估计秩一矩阵的问题,证明了估计矩阵和潜在因子时最小均方误差的渐近精确公式。

异方差PCA:算法、优化和应用

本文提出了一种称为HeteroPCA的算法,该算法通过迭代输入对角线项来消除异方差引起的偏差,并且在广义峰值协方差模型下计算效率高且可证明是最优的。

双白化显示计数矩阵的秩

这项工作的重点是具有独立项的泊松随机矩阵,并提出了一种简单的程序,称为双白化,用于在没有任何先验知识的情况下估计基础信号矩阵(即泊松参数矩阵)的秩,并扩展到满足均值和方差二次关系的分布族。

双异方差噪声下的矩阵去噪:基本极限和最优谱方法

我们研究了估计列相关和行相关噪声污染的秩-1$信号奇异向量的矩阵去噪问题。现有工程要么无法精确定位

收缩型HeteroPCA:克服异方差PCA中病态条件的诅咒

提出了一种新的算法,称为$\textsf{Deflated-HeteroPCA}$,该算法在$\ell_2$和$\ell_2,infty}$统计精度方面都达到了近最优和无条件数的理论保证。

随机奇异值分解的噪声敏感性

结果表明,相对于更朴素的草图PCA变体,R-SVD在信号检测和估计方面具有统计优势;当草图尺寸较小时,这种优势尤其显著。

异方差数据主成分分析的理论分析

本文提供了从噪声异方差样本中恢复一维子空间的简单渐近预测,即具有非均匀噪声方差且不再相同分布的样本。

HePPCAT:异方差噪声数据的概率PCA

一种异方差概率主成分分析技术(HePPCAT),它使用高效的交替最大化算法联合估计潜在因素和未知噪声方差,与不考虑异方差的技术相比,可以给出更好的主成分分析估计。

异方差数据的概率主成分分析

数值实验表明,在单个分析中使用所提出的PCA变量将样本与异方差噪声结合在一起的优点,以及对EM算法进行仔细初始化的优点。

异方差噪声下的最优谱收缩和主成分分析

证明了对于一般信号,白化改进了主成分的估计,增加了观测值的自然信噪比,并表明对于秩1信号,估计的主成分达到了渐近最小最大速率。

异方差主成分分析:算法、优化和应用

本文提出了一种称为HeteroPCA的算法,该算法包括迭代地输入对角条目,以消除由于异方差引起的偏差,并且在广义尖峰协方差模型下计算高效且可证明是最优的。

异方差信号的概率主成分分析:几何框架及其在聚类中的应用

利用黎曼几何理论,提出了一种统一的方法来解决与嵌入在白高斯噪声中的异方差信号统计模型相关的几个问题,并提出了聚类算法在印第安松树分割问题基准上的应用。

高维主成分分析的一致性和稀疏性

给出了一种选择样本方差最大的坐标子集的简单算法,并证明了如果对所选子集进行主成分分析,即使p(n)≫n,也可以恢复一致性。

双白化显示计数矩阵的秩

这项工作的重点是具有独立项的泊松随机矩阵,并提出了一种简单的程序,称为双白化,用于在没有任何先验知识的情况下估计基础信号矩阵(即泊松参数矩阵)的秩,并扩展到满足均值和方差二次关系的分布族。

高维基因组数据的渐近条件奇异值分解

研究表明,在固定样本量的基因组数据条件因子模型下,当特征数目发散时,未观测到的潜在因子的右奇异向量是渐近一致的,并提出了潜在条件因子模型维数的一致估计。
...