×

稳健的距离度量,用于检测分类数据的异常值。 (英语) Zbl 07558787号

摘要:基于距离的异常值检测技术在单变量和多变量数据中都是一种有效的工具。然而,由于细胞频率的极化带来了挑战,同样的有效性尚未在分类数据中牢固确立。本文的目的是发展一种新的基于距离的度量方法来检测二维列联表中的异常值。通过与文献中其他合适的距离测量方法的性能比较,对基于关键元素的新距离测量方法进行了评估。通过模拟研究,并将其应用于实际数据集,检验了四种距离度量的一致性。

MSC公司:

62-XX年 统计

软件:

SAS公司
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Agresti,A.,分类数据分析(2002),纽约:威利,纽约·Zbl 1018.6202号
[2] Aitchison,J.,《成分数据的统计分析》(1986),伦敦:查普曼和霍尔出版社,伦敦·Zbl 0688.62004号
[3] 巴内特,VD;Lewis,T.,《统计数据中的异常值》(1994),纽约:威利出版社,纽约·Zbl 0801.62001
[4] Bradu,D。;霍金斯,DM,使用四分位数在双向表中定位多个离群值,技术计量学,24103-108(1982)
[5] Brown,BM,《双向列联表重要性来源的识别》,J R Stat Soc Ser C(应用统计),23,405-413(1974)
[6] 科雷亚,JC;Velez,JI,Una nota de cuidado sobre el efecto de datos parcialmente faltates en la prueba de independencia,《独立委员会》,第7期,第2期,第189-199页(2014年)
[7] 夸德拉斯,CM;库亚德拉(D.Cuadras)。;Greenacre,MJ,《分类数据表示不同方法的比较》,《公共统计模拟计算》,35,2,447-459(2006)·Zbl 1093.62061号
[8] Friendly,M.,可视化分类数据(2000),Cary:SAS研究所,Cary·Zbl 1429.62015号
[9] 富克斯,C。;Kenett,R.,《检测多项式分布和双向列联表中离群细胞的测试》,美国统计协会理论方法学杂志,75,370,395-398(1980)·Zbl 0462.62041号
[10] Gallo,M.,成分数据的判别偏最小二乘分析,统计模型,10,1,41-56(2010)·Zbl 07256814号
[11] Gallo,M.,成分数据的Tucker 3模型,Commun Stat Theory Methods,44,2144441-4453(2015)·Zbl 1333.62159号
[12] Greenacre,MJ,聚类列联表的行和列,J Classif,5,1,39-51(1988)·Zbl 0652.62053号
[13] Grubbs,FE,检测样本中异常观测值的程序,Technometrics,11,1,1-21(1969)
[14] 哈伯曼,SJ,交叉分类表中残差的分析,生物统计学,29205-220(1973)
[15] Imon,AHMR,《确定线性回归中的多个有影响力的观察结果》,《应用统计杂志》,32,9,926-946(2005)·Zbl 1121.62404号
[16] Kateri,M.,《应急表分析》(2014),柏林:施普林格出版社,柏林·Zbl 1291.62012年
[17] 科茨,TJW;Hawkins,DM,《使用(2乘2)子表识别双向列联表中的离群值》,应用统计,33,215-223(1984)
[18] Kuhnt,S.,使用最大似然和L1估计的列联表离群值识别程序,Scand J Stat,31431-442(2004)·Zbl 1063.62086号
[19] Kuhnt,S。;拉帕洛,F。;Rehage,A.,基于最小模式、统计和计算的列联表中的异常值检测,24481-491(2014)·Zbl 1325.62117号
[20] 李,AH;Yick,JS,双向列联表中异常值检测的扰动方法,Aust N Z J Stat,41,3,305-314(1999)·Zbl 1055.62528号
[21] R核心团队(2013)R:统计计算的语言和环境。奥地利维也纳R统计计算基金会
[22] Rapallo,F.,《代数统计列联表中的离群值和离群值模式》,Scand J Stat,39,4,784-797(2012)·Zbl 1253.62043号
[23] TA Sajesh;Srinivasan,MR,《使用Comedian方法对高维数据进行离群点检测》,J Stat Compute Simul,82,745-757(2012)·兹比尔1432.62164
[24] Simonoff,JS,《通过后退法检测双向列联表中的外围单元格》,《技术计量学》,30,3,339-345(1988)
[25] Sripriya,TP;Srinivasan,MR,《双向列联表中外围单元格的检测》,《统计应用》,16,2,103-113(2018)
[26] Subbiah,M。;Srinivasan,MR,《零细胞(2乘2)稀疏数据的分类》,Stat Probab Lett,78,3212-3215(2008)·Zbl 1489.62174号
[27] 厄普顿,GJG,分类数据分析示例(2017),纽约:威利,纽约
[28] Yick,JS;Lee,AH,《双向列联表中的非屏蔽异常值》,《计算统计数据分析》,29,69-79(1998)·Zbl 1042.62556号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。