×

最小正则协方差行列式估计。 (英语) Zbl 1436.62197号

摘要:最小协方差行列式(MCD)方法使用具有最低样本协方差行列式的给定大小的子集来估计位置和散射矩阵。其主要缺点是,当维度超过子集大小时,无法应用它。我们提出了最小正则协方差行列式(MRCD)方法,该方法不同于MCD,因为散射矩阵是目标矩阵和子集的样本协方差矩阵的凸组合。数据驱动程序设置目标矩阵的权重,以便仅在需要时使用正则化。MRCD估计器定义在任意维上,通过构造条件良好,并保持了MCD的良好鲁棒性。我们证明了可以执行所谓的集中步骤来减少MRCD目标函数,并且我们利用这一事实构造了一个快速算法。我们在模拟研究中验证了MRCD估计器的准确性和稳健性,并说明了其在化学和犯罪学中对真实高维数据集进行离群值检测和回归分析的实际应用。

MSC公司:

62甲12 多元分析中的估计
62层35 鲁棒性和自适应程序(参数推理)
62J02型 一般非线性回归
62第25页 统计学在社会科学中的应用
62兰特 大数据和数据科学的统计方面
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Agostinelli,C。;梁,A。;Yohai,V.公司。;Zamar,R.,《存在细胞和病例污染时多元位置和散布的稳健估计》,Test,24,3,441-461(2015)·Zbl 1326.62111号 ·doi:10.1007/s11749-015-0450-6
[2] 阿古洛,J。;克罗克斯,C。;Van Aelst,S.,多元最小二乘估计,J.Multivar。分析。,99, 311-338 (2008) ·Zbl 1148.62037号 ·doi:10.1016/j.jmva.2006.06.005
[3] 阿特金森,Ac;Riani,M。;Cerioli,A.,用正向搜索探索多元数据(2004),纽约:Springer,纽约·Zbl 1049.62057号
[4] Bartlett,Ms,《判别分析中出现的逆矩阵调整》,《数学年鉴》。《统计》,22,1,107-111(1951)·Zbl 0042.38203号 ·doi:10.1214/aoms/1177729698
[5] Boudt,K。;Cornelissen,J。;Croux,C.,通过分离方差和相关分量跳转稳健的每日协方差估计,计算。统计数据分析。,56, 11, 2993-3005 (2012) ·兹比尔1254.91565 ·doi:10.1016/j.csda.2011.05.003
[6] 巴特勒,R。;戴维斯,P。;Jhun,M.,最小协方差行列式估计的渐近性,Ann.Stat.,21,3,1385-1400(1993)·Zbl 0797.62044号 ·doi:10.1214/aos/1176349264
[7] Cator,E。;Lopuhaä,H.,一般多元分布下MCD估计量的中心极限定理和影响函数,Bernoulli,18,2,520-551(2012)·Zbl 1239.62068号 ·doi:10.350/11-BEJ353
[8] 克罗克斯,C。;Haesbroeck,G.,最小协方差行列式散布矩阵估计器的影响函数和效率,J.Multivar。分析。,71, 2, 161-190 (1999) ·Zbl 0946.62055号 ·doi:10.1006/jmva.1999.1839
[9] 克劳克斯,C。;Haesbroeck,G.,基于协方差或相关矩阵稳健估计的主成分分析:影响函数和效率,Biometrika,87,603-618(2000)·Zbl 0956.62047号 ·doi:10.1093/biomet/87.3.603
[10] 克罗克斯,C。;Gelper,S。;Haesbroeck,G.,正则最小协方差行列式估计(2012),纽约:Mimeo,纽约
[11] Esbensen,K。;Midtgaard,T。;Schönkopf,S.,《实践中的多元分析:培训包》(1996),奥斯陆:Camo As出版社,奥斯陆
[12] 弗里德曼,J。;哈斯蒂,T。;Tibshirani,R.,用图形套索进行稀疏逆协方差估计,生物统计学,9,2,432-441(2008)·Zbl 1143.62076号 ·doi:10.1093/biostatistics/kxm045
[13] Gnanadesikan,R。;Kettering,J.,《稳健估计、残差和多响应数据的离群值检测》,《生物计量学》,第28期,第81-124页(1972年)·doi:10.2307/2528963
[14] Grübel,R.,协方差矩阵的最小特征,Metrika,35,1,49-52(1988)·Zbl 0638.62046号 ·doi:10.1007/BF02613285
[15] 哈丁,J。;Roke,D.,使用最小协方差行列式估计器在多簇环境中检测离群值,计算。统计数据分析。,44, 625-638 (2004) ·Zbl 1430.62133号 ·doi:10.1016/S0167-9473(02)00280-3
[16] 哈丁,J。;Roke,D.,《稳健距离的分布》,J.Compute。图表。《统计》,第14、4、928-946页(2005年)·doi:10.1198/106186005X77685
[17] 休伯特,M。;Van Driessen,K.,《快速稳健判别分析》,计算机。统计数据分析。,45, 301-320 (2004) ·Zbl 1429.62247号 ·doi:10.1016/S0167-9473(02)00299-2
[18] 休伯特,M。;卢梭,P。;Vanden Branden,K.,《ROBPCA:稳健主成分分析的新方法》,《技术计量学》,47,64-79(2005)·doi:10.1198/00401700400000563
[19] 休伯特,M。;卢梭,P。;Van Aelst,S.,高分解稳健多元方法,统计科学。,1992年9月23日至119日(2008年)·Zbl 1327.62328号 ·doi:10.1214/0883423070000087
[20] 休伯特,M。;卢梭,P。;Verdonck,T.,《稳健定位和散布的确定性算法》,J.Compute。图表。统计,21,3,618-637(2012)·doi:10.1080/10618600.2012.672100
[21] Khan,J。;Van Aelst,S。;Zamar,Rh,《基于最小角度回归的稳健线性模型选择》,美国统计协会,102,480,1289-1299(2007)·Zbl 1332.62240号 ·doi:10.1198/0162145000000050
[22] O.莱多特。;Wolf,M.,《大维协方差矩阵的良好估计》,J.Multivar。分析。,88, 365-411 (2004) ·Zbl 1032.62050 ·doi:10.1016/S0047-259X(03)00096-4
[23] Lopuhaä,H。;Rousseeuw,P.,多元位置和协方差矩阵的仿射等变估计的分解点,《Ann.Stat.》,19,229-248(1991)·Zbl 0733.62058号 ·doi:10.1214/aos/1176347978
[24] Maronna,R。;Zamar,Rh,高维数据集位置和离散度的稳健估计,技术计量学,44,4,307-317(2002)·doi:10.19198/004017002188618509
[25] Oh ller,V.,Croux,C.:稳健的高维精度矩阵估计。摘自:《现代非参数、稳健和多元方法》,第325-350页。斯普林格(2015)·Zbl 1326.62113号
[26] Pison,G。;卢梭,P。;Filzmoser,P。;Croux,C.,稳健因子分析,J.Multivar。分析。,84, 145-172 (2003) ·Zbl 1038.62055号 ·doi:10.1016/S0047-259X(02)00007-6
[27] Rousseeuw,P.,平方回归的最小中值,《美国统计协会期刊》,79,388,871-880(1984)·Zbl 0547.62046号 ·doi:10.1080/01621459.1984.10477105
[28] 卢梭,P。;格罗斯曼,W。;Pflug,G。;文采,I。;Wertz,W.,《高分解点多元估计》,《数理统计与应用》,283-297(1985),多德雷赫特:雷德尔出版公司,多德雷赫特·Zbl 0609.62054号
[29] 卢梭,P。;Croux,C.,《中位数绝对偏差的替代方法》,美国统计协会,88,424,1273-1283(1993)·Zbl 0792.62025号 ·doi:10.1080/01621459.1993.10476408
[30] 卢梭,P。;Van Driessen,K.,最小协方差行列式估计的快速算法,技术计量学,41,212-223(1999)·doi:10.1080/00401706.1999.10485670
[31] 卢梭,P。;Van Zomeren,B.,《揭示多元异常值和杠杆点》,美国统计协会,85,411,633-639(1990)·网址:10.1080/01621459.1990.10474920
[32] 卢梭,P。;Van Aelst,S。;Van Driessen,K。;Agulló,J.,稳健多元回归,技术计量学,46293-305(2004)·doi:10.1198/00401700400000329
[33] Rousseeuw,P.、Croux,C.、Todorov,V.、Ruckstuhl,A.、Salibian-Barrera,M.、Verbeke,T.、Koller,M.和Maechler,M.:稳健基础:基本稳健统计。R包版本0.92-3(2012)
[34] Sengupta,A.,《可能不同维度的多元正态总体的标准化广义方差检验》,J.Multivar。分析。,23, 2, 209-219 (1987) ·Zbl 0651.62049号 ·doi:10.1016/0047-259X(87)90153-9
[35] 谢尔曼,J。;莫里森,Wj,与给定矩阵中一个元素的变化相对应的逆矩阵的调整,《数学年鉴》。Stat.,21,1,124-127(1950)·兹比尔0037.00901 ·doi:10.1214/aoms/1177729893
[36] 托多罗夫,V。;Filzmoser,P.,稳健多元分析的面向对象框架,J.Stat.Softw。,32, 3, 1-47 (2009) ·doi:10.18637/jss.v032.i03
[37] 元,钟浩;约翰·林(Johan Lim);Kim,Seung-Jean;Rajaratnam,Bala,条件数正则化协方差估计,英国皇家统计学会期刊:B系列(统计方法论),75,32427-450(2012)·Zbl 1411.62146号 ·文件编号:10.1111/j.1467-9868.2012.01049.x
[38] Woodbury,Ma,《反演修正矩阵》。备忘录。众议员,42,106(1950)
[39] Zhao,T。;刘,H。;罗德,K。;Lafferty,J。;Wasserman,L.,R,J.Mach中高维无向图估计的庞大软件包。学习。第13号决议,1059-1062(2012)·Zbl 1283.68311号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。