×

矩阵值异常值调节和检测的稳健因子主成分分析。 (英语) Zbl 07708465号

摘要:主成分分析(PCA)是一种常用的矢量数据降维技术。因子主成分分析(FPCA)是主成分分析对矩阵数据的概率扩展,它可以大大减少主成分分析中的参数数量,同时获得令人满意的性能。然而,FPCA基于高斯假设,因此容易受到异常值的影响。尽管多元(t)分布作为向量数据的稳健建模工具已有很长的历史,但它在矩阵数据中的应用非常有限。主要原因是向量化矩阵数据的维数通常很高,维数越高,衡量稳健性的故障点越低。为了解决FPCA所面临的鲁棒性问题,并使其适用于矩阵数据,本文提出了一种FPCA的鲁棒扩展(RFPCA),该扩展基于一种称为矩阵变量(t)分布的(t)型分布。与多元(t)分布一样,矩阵-变量(t)分配可以自适应地向下调整异常值并产生稳健估计。提出了一种快速EM型参数估计算法。在合成数据集和真实数据集上的实验表明,(i)RFPCA与几种密切相关的方法相比具有良好的性能。重要的是,RFPCA比其基于向量的近亲多元PCA(t PCA)具有更高的分解点,这使得RFPCA更适用于矩阵数据;(ii)RFPCA的预期潜在权重可以很容易地用于异常值检测,并且比(t)PCA的潜在权重更可靠。这种检测在现有的基于矩阵的方法中很少可用,特别是对于总矩阵值的离群值。

MSC公司:

62-08 统计学相关问题的计算方法
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 德莱顿,I.L。;Bai,L.等人。;Brignell,C.J。;Shen,L.,因子分解主成分分析及其在人脸识别中的应用,Stat.Comput。,19, 229-238 (2009)
[2] Dümbgen,L。;Tyler,D.E.,关于一些多元M-泛函的分解性质,Scand。《统计杂志》,32,247-264(2010)·Zbl 1089.62056号
[3] 古普塔,A.K。;Nagar,D.K.,《矩阵变量分布》(1999),Chapman和Hall-CRC·Zbl 0935.62064号
[4] 古普塔,A.K。;瓦尔加,T。;Bodnar,T.,《统计和投资组合理论中的椭圆轮廓模型》(2013),Springer:Springer New York·兹比尔1306.62028
[5] Jolliffe,I.T.,主成分分析(2002),Springer:Springer New York·Zbl 1011.62064号
[6] Kirby,M。;Sirovich,L.,《Karhunen-Loeve程序在人脸特征描述中的应用》,IEEE Trans。模式分析。机器。整数。,12, 103-108 (1990)
[7] Kwak,N.,基于L1范数最大化的主成分分析,IEEE Trans。模式分析。机器。整数。,30, 1672-1680 (2008)
[8] Lange,K.L。;Little,R.J。;Taylor,J.M.,使用t分布的稳健统计建模,美国统计协会,84,881-896(1989)
[9] Lin,T.I。;医学博士麦克尼古拉斯。;Ho,H.J.,通过简约混合模型捕获模式,Stat.Probab。莱特。,88, 80-87 (2014) ·Zbl 1369.62131号
[10] Lin,T.I。;Wu,P.H。;麦克拉克伦,G.J。;Lee,S.X.,使用限制偏态t分布的稳健因子分析模型,Test,24,510-531(2015)·Zbl 1327.62344号
[11] Liu,C.,《ECME算法:具有更快单调收敛的EM和ECM的简单扩展》,Biometrika,81633-648(1994)·兹伯利0812.62028
[12] 刘,C。;Rubin,D.B.,使用EM及其扩展对t分布的ML估计,ECM和ECME,Stat.Sin。,5, 19-39 (1995) ·Zbl 0824.62047号
[13] 刘,C。;鲁宾,D.B。;Ying,N.W.,《加速EM的参数扩展:PX-EM算法》,《生物特征识别》,85,755-770(1998)·Zbl 0921.62071号
[14] 麦克拉克伦,G.J。;比恩,R。;Jones,L.B.T.,将混合因子分析模型扩展为包含多元T分布,计算。统计数据分析。,第51页,5327-5338页(2007年)·Zbl 1445.62053号
[15] 孟晓乐。;van Dyk,D.A.,《EM算法——一首古老的民歌,随着一个快速的新曲调而唱》,J.R.Stat.Soc.,Ser。B、 统计方法。,59, 511-567 (1997) ·Zbl 1090.62518号
[16] 她,Y。;李,S。;Wu,D.,稳健正交互补主成分分析,美国统计协会,111763-771(2016)
[17] Thompson,G.,《MixMatrix:使用矩阵变量正态分布和t分布进行分类》(2019年),R包版本0.2.2
[18] 汤普森,G.Z。;迈特拉,R。;米克尔,W.Q。;Bastawros,A.F.,《矩阵变量t分布分类》,J.Compute。图表。统计,29,668-674(2020)·Zbl 07499305号
[19] 托马乔,S.D。;Gallaugher,M.P。;Punzo,A。;McNicholas,P.D.,矩阵变量污染正态分布的混合,J.Compute。图表。统计,1-22(2021)
[20] Viroli,C.,用于分类三向数据的矩阵正态分布的有限混合,统计计算。,21, 511-522 (2011) ·Zbl 1221.62083号
[21] Wang,W.L.,用于建模高维缺失值数据的通用t因子分析仪的混合物,计算。统计数据分析。,83, 223-235 (2015) ·Zbl 1507.62179号
[22] Wang,W.L。;卡斯特罗,L.M。;拉科斯,V.H。;Lin,T.I.,通过混合因子分析仪对审查数据进行基于模型的聚类,计算。统计数据分析。,140, 104-121 (2019) ·Zbl 1496.62109号
[23] Wang,W.L。;Fan,T.H.,多纵向数据多元T线性混合模型的估计,统计正弦。,1857-1880 (2011) ·Zbl 1225.62130号
[24] Wang,W.L。;Lin,T.I.,缺失值的多结果纵向数据的多元T非线性混合效应模型,《统计医学》,33,3029-3046(2014)
[25] 王,W.L。;Lin,T.I.,通过混合T因子分析仪对多重删失数据进行稳健聚类,测试,31,22-53(2022)·Zbl 1484.62066号
[26] 谢,X。;Yan,S。;郭,J。;Huang,T.,矩阵变量因子分析及其应用,IEEE Trans。神经网络。,19, 1821-1826 (2008)
[27] Ye,J.,矩阵的广义低阶近似,马赫。学习。,61, 167-191 (2005) ·Zbl 1470.65074号
[28] 张博士。;Zhou,Z.H.,((\text{2D})^2)PCA:用于高效人脸表示和识别的双向二维PCA,神经计算,69,224-231(2005)
[29] 赵,J。;姜强,t分布的概率主成分分析,神经计算,692217-2226(2006)
[30] 赵,J。;Shi,L。;Zhu,J.,二维数据的两阶段正则化线性判别分析,IEEE Trans。神经网络。学习。系统。,1669-1681年(2015年)
[31] 赵,J。;Yu,P.L.H.,通过ECM算法对因子分析仪混合物进行快速ML估计,IEEE Trans。神经网络。,19, 1956-1961 (2008)
[32] Zhao,J.H。;Yu,P.L.H。;Shi,L。;李秀莲,可分离线性判别分析,计算机。统计数据分析。,56, 4290-4300 (2012) ·Zbl 1255.62184号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。