×

倾斜分布的调整箱线图。 (英语) 兹比尔1452.62074

摘要:箱线图是一种非常流行的图形工具,用于可视化连续单峰数据的分布。它显示有关位置、分布、偏度以及数据尾部的信息。然而,当数据倾斜时,通常会有许多点超过胡须,并且经常被错误地声明为异常值。提出了箱线图的调整,包括在确定晶须时对偏度的稳健测量。这样可以更准确地表示数据和可能的异常值。因此,这种调整后的箱线图也可以用作快速自动的离群值检测工具,而无需对大量数据的分布进行任何参数假设。几个例子和仿真结果表明了这种新方法的优点。

MSC公司:

62-08 统计问题的计算方法
62A09号 统计学中的图形方法
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Aucremanne,L.公司。;布莱斯,G。;休伯特,M。;Rousseeuw,P.J。;Struyf,A.,《使用偏度和尾重的新稳健度量对比利时通货膨胀、相对价格和名义刚性的研究》(Hubert,M.;Pison,G.;Struyv,A.;Van Aelst,S.,《最新稳健方法的理论和应用》,系列:工业和技术统计(2004),Birkhauser:Birkhauser Basel),13-25·Zbl 1088.62135号
[2] Bowley,A.L.,《统计元素》(1920),查尔斯·斯克里布纳之子:查尔斯·斯科里布纳的儿子纽约·JFM 48.0616.06号
[3] 布莱斯,G。;休伯特,M。;Rousseeuw,P.J.,《独立成分分析的稳健化》,《化学计量学杂志》,第19期,第364-375页(2005年)
[4] 布莱斯,G。;休伯特,M。;Struyf,A.,《偏度的稳健度量》,《计算与图形统计杂志》,1996-1017年第13期(2004年)
[5] 布莱斯,G。;休伯特,M。;Struyf,A.,尾部重量的稳健度量,计算统计和数据分析,50733-759(2006)·Zbl 1431.62047号
[6] Carling,K.,抗异常值规则和非高斯情况,计算统计学和数据分析,33249-258(2000)·Zbl 1061.62502号
[7] 钱伯斯,J.M.,哈斯蒂,T.J.,1992年。《S.Wadsworth和Brooks的统计模型》,Pacific Grove,第348-351页;钱伯斯,J.M.,哈斯蒂,T.J.,1992年。《太平洋格罗夫S.Wadsworth和Brooks的统计模型》,第348-351页·Zbl 0776.62007号
[8] Goegebeur,Y。;普兰雄,V。;贝兰特,J。;Oger,R.,使用极值方法对土壤化学数据进行质量评估,应用科学杂志,51092-1102(2005)
[9] 霍格林特区。;Mosteller,F。;Tukey,J.W.,《理解稳健和探索性数据分析》(1983年),Wiley:Wiley New York,第58-77页·Zbl 0599.62007号
[10] 霍格林特区。;莫斯特勒,F。;Tukey,J.W.,《探索数据表、趋势和形状》(1985年),威利出版社:威利纽约,第463-478页·Zbl 0659.62002号
[11] 休伯特,M。;Rousseeuw,P.J。;Vanden Branden,K.,《ROBPCA:稳健主成分分析的新方法》,《技术计量学》,47,64-79(2005)
[12] Hubert,M.,Van der Veeken,S.,2007年。倾斜数据的异常检测。化学计量学杂志(印刷版);Hubert,M.,Van der Veeken,S.,2007年。倾斜数据的异常检测。化学计量学杂志(印刷版)·Zbl 1284.62378号
[13] Hubert,M.,Rousseeuw,P.J.,Verdonck,T.,2007年。倾斜数据的稳健PCA(提交供发布);Hubert,M.,Rousseeuw,P.J.,Verdonck,T.,2007年。针对倾斜数据的稳健PCA(提交以供发布)
[14] Jarret,R.G.,《煤矿灾害间隔的注释》,Biometrika,66191-193(1979)
[15] Kimber,A.C.,《偏态分布中可能删失数据的探索性数据分析》,应用统计学,39,21-30(1990)·Zbl 0707.62004号
[16] 穆尔斯,J.J.A。;工薪阶层,R.Th.A。;科宁,V.M.J。;Heuts,R.M.J。;Janssens,M.J.B.T.,用分位数测度表征分布系统,《Neerlandica统计》,第50期,第417-430页(1996年)·Zbl 0899.62011号
[17] Rousseeuw,P.J。;车辙,I。;Tukey,J.W.,《Bagplot:一个双变量箱线图》,《美国统计学家》,53382-387(1999)
[18] 鲁菲厄,C。;帕考德,F。;Marazzi,A.,《缩短住院时间的比较规则》,Casemix Quaterly,2,1(2000)
[19] 北卡罗来纳州施沃特曼。;医学硕士欧文斯。;Adnan,R.,《识别异常值的简单通用箱线图方法》,计算统计与数据分析,47165-174(2004)·Zbl 1430.62019年
[20] 北卡罗来纳州施沃特曼。;de Silva,R.,《用连续栅栏识别离群值》,计算统计与数据分析,51,3800-3810(2007)·Zbl 1161.62303号
[21] Tukey,J.W.,《探索性数据分析》(1977年),《艾迪森·韦斯利:艾迪森·韦斯利阅读》,马萨诸塞州,第39-49页·Zbl 0409.62003号
[22] 范德维尔,B。;贝兰特,J。;Christmann,A。;Hubert,M.,帕累托型分布尾部指数的鲁棒估计器,计算统计学和数据分析,516522-6268(2007)·Zbl 1445.62102号
[23] Verboven,S。;Hubert,M.,LIBRA:稳健分析、化学计量学和智能实验室系统的MATLAB库,75,127-136(2005)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。