×

基于高维数据最小正则协方差行列式估计的马氏距离。 (英语) Zbl 07529991号

摘要:异常检测是稳健文献中广泛研究的问题。检测离群值最常用的传统方法是计算马氏距离。然而,传统的马氏距离可能无法检测出离群值,因为它们基于对离群值敏感的经典样本平均向量和协方差矩阵。为了解决这个问题,使用最小协方差行列式(MCD)估计代替经典估计。然而,MCD估计量无法在高维数据集中计算,因为变量数p大于样本量n。为了检测高维数据中的离群值,我们提出了基于最小正则协方差行列式(MRCD)估计量的马氏距离,该估计量可以在高维数据集中计算。通过仿真研究和实际数据集,我们证明了该距离对于高维数据集中的离群点检测是成功的。

MSC公司:

62至XX 统计
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Boudt,K。;Rousseeuw,P.J。;Vanduffel,S。;Verdonck,T.,最小正则协方差行列式估计,统计与计算(2019)·Zbl 1436.62197号 ·数字对象标识代码:10.1007/s11222-019-09869-x
[2] 克罗克斯,C。;Haesbroeck,G.,最小协方差行列式散布矩阵估计的影响函数和效率,多元分析杂志,71,2,161-90(1999)·Zbl 0946.62055号
[3] 郭毅。;哈斯蒂,T。;Tibshirani,R.(2018)
[4] 霍尔格森,H.E.T。;Karlsson,P.S.,高维数据中马氏距离的三个估计量,应用统计学杂志,39,127713-20(2012)·Zbl 1514.62087号
[5] 休伯特,M。;Rousseeuw,P.J。;Vanden Branden,K.,《ROBPCA:稳健主成分分析的新方法》,《技术计量学》,47,1,64-79(2005)
[6] 詹姆斯·G。;维滕,D。;哈斯蒂,T。;Tibshirani,R.(2017)
[7] Leys,C.公司。;Klein,O。;Dominicy,Y。;Ley,C.,《检测多变量异常值:使用马氏距离的稳健变体》,《实验社会心理学杂志》,74150-6(2018)
[8] 刘,H。;李,X。;李,J。;Zhang,S.,高维数据的有效异常值检测,IEEE系统、人类和控制论汇刊:系统,48,1222451-61(2018)
[9] Lopuhaä,H.P。;Rousseeuw,P.J.,多元位置和协方差矩阵的仿射等变估计的分解点,统计年鉴,19,1,229-48(1991)·Zbl 0733.62058号
[10] Papadakis,M。;Tsagris,M。;Dimitriadis,M。;Fafalios,S。;沙马尔迪诺斯一世。;法西奥罗,M。;Borboudakis,G。;Burkardt,J。;邹,C。;Lakiotaki,K.(2019年)
[11] Ro,K。;邹,C。;王,Z。;Yin,G.,高维数据的离群检测,Biometrika,102,3,589-99(2015)·Zbl 1452.62378号
[12] Rousseeuw,P.J.,高崩溃点多元估计,数理统计与应用,8283-297,37(1985)·Zbl 0609.62054号
[13] Rousseeuw,P.J。;Croux,C.,《中值绝对偏差的替代方法》,《美国统计协会杂志》,88,424,1273-83(1993)·Zbl 0792.62025号
[14] Rousseeuw,P.J。;Driessen,K.V.,最小协方差行列式估计的快速算法,技术计量学,41,3,212-23(1999)
[15] 托多罗夫,V。;Filzmoser,P.,稳健多元分析的面向对象框架,《统计软件杂志》,32,3,1-47(2009)
[16] Xu,X。;刘,H。;李,L。;Yao,M.,《高维数据离群值检测技术的比较》,《国际计算智能系统杂志》,11,1,652-62(2018)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。