×

多元功能数据可视化和异常值检测。 (英语) Zbl 07499002号

摘要:本文提出了一种新的图形工具,幅度-形状(MS)图,用于可视化多变量函数数据的幅度和形状前景。该工具基于最近提出的函数方向异常概念,通过同时考虑函数数据偏离中心区域的水平和方向来度量函数数据的中心性。MS-图直观地显示了水平轴或平面上的震级偏差水平和方向,并显示了垂直轴上的形状偏差。提供了一条分割曲线或曲面,用于将非离群数据与离群数据分离。模拟数据和实际示例都证实,MS-plot在可视化中心性和检测函数数据异常值方面优于现有工具。本文的补充材料可在网上获得。

MSC公司:

62至XX 统计
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Arribas-Gil,A。;Romo,J.,《功能数据的形状异常检测和可视化:异常图》,生物统计学,第15期,第603-619页(2014年)
[2] 常,W。;程,J。;Allaire,J。;谢毅。;McPherson,J.,shinny:R的Web应用程序框架(2017)
[3] 乔杜里,J。;Chaudhuri,P.,《函数数据的非参数深度和分位数回归》(2016)
[4] 克莱肯斯,G。;休伯特,M。;斯莱特氏菌。;Vakili,K.,《多元函数半空间深度》,美国统计协会杂志,109,411-423(2014)·Zbl 1367.62162号
[5] 库克,D。;Swayne,D.F.,《使用R和GGobi进行数据分析的交互式和动态图形》(2007),纽约:Springer,纽约·兹比尔1154.62006
[6] 克罗克斯,C。;Ruiz-Gazen,A.,《主成分的高分解估计:重新审视投影-脉冲法》,《多元分析杂志》,95,206-226(2005)·Zbl 1065.62040号
[7] Dai,W。;Genton,M.G.,《多元函数数据的方向异常、计算统计与数据分析》·Zbl 1471.62049号 ·doi:10.1016/j.csda.2018.03.017
[8] Donoho,D.L.,多元位置估计的分解特性(1982)
[9] 费布雷罗,M。;加利亚诺,P。;González-Manteiga,W.,《通过深度测量在功能数据中检测异常值,并应用于识别异常NOx水平》,环境计量学,19,331-345(2008)
[10] 费拉蒂,F。;Vieu,P.,《非参数函数数据分析:理论与实践》(2006),纽约:Springer出版社,纽约·Zbl 1119.62046号
[11] Filzmoser,P。;弗里茨,H。;Kalcher,K.,pcaPP:投影追踪的稳健PCA(2016)
[12] Genton,M.G。;约翰逊,C。;波特,K。;斯坦奇科夫,G。;Sun,Y.,《曲面箱线图》,统计,3,1-11(2014)
[13] Gervini,D.,检测和处理不规则采样函数数据集中的离群轨迹,应用统计学年鉴,31758-1775(2009)·兹比尔1184.62101
[14] Gneiting,T。;克莱伯,W。;Schlather,M.,多变量随机场的Matérn交叉协方差函数,美国统计协会杂志,105,1167-1177(2010)·Zbl 1390.62194号
[15] 哈丁,J。;Roke,D.M.,《稳健距离的分布》,《计算与图形统计杂志》,14928-946(2005)
[16] Horváth,L。;Kokoszka,P.,《函数数据与应用的推断》(2012),纽约:Springer,纽约·Zbl 1279.62017号
[17] 休伯特,M。;Rousseeuw,P.J。;Segaert,P.,多元函数异常值检测,统计方法与应用,24177-202(2015)·Zbl 1441.62124号
[18] Hyndman,R.J。;Shang,H.L.,《功能数据的彩虹图、Bagplots和箱线图》,《计算与图形统计杂志》,19,29-45(2010)
[19] 刘瑞英,《基于随机单纯形的数据深度概念》,《统计学年鉴》,第18期,第405-414页(1990年)·Zbl 0701.62063号
[20] 洛佩兹·平塔多,S。;Romo,J.,《关于功能数据深度的概念》,《美国统计协会杂志》,104718-734(2009)·Zbl 1388.62139号
[21] ---《功能数据的半区域深度,计算统计与数据分析》,55,1679-1695(2011)·Zbl 1328.62029号
[22] 马哈拉诺比斯,P.C.,《统计学中的广义距离》,印度国家科学院学报,249-55(1936)·Zbl 0015.03302号
[23] Matérn,B.,《空间变异》(1960),纽约:施普林格,纽约
[24] Pearson,K.,《进化数学理论的贡献》。二、。均质材料中的倾斜变化,伦敦皇家学会哲学学报A:数学、物理和工程科学,186343-414(1895)
[25] J.O.拉姆齐。;Silverman,B.W.,功能数据分析(2005),纽约:Springer,纽约·Zbl 1079.62006号
[26] R核心团队,R:统计计算语言与环境(2017),奥地利维也纳:R统计计算基金会,奥地利维也纳
[27] Robbins,N.B.,《创造更有效的图表》(2012),纽约:威利,纽约
[28] Rousseeuw,P.J.,高崩溃点多元估计,B,283-297(1985),多德雷赫特:雷德尔,多德雷赫特·Zbl 0609.62054号
[29] Rousseeuw,P.J。;Raymaekers,J。;Hubert,M.,《应用于图像数据和视频的方向异常测量》,《计算与图形统计杂志》(2017年)·Zbl 07498952号 ·doi:10.1080/10618600.2017.136912
[30] Rousseeuw,P.J。;Van Driessen,K.,最小协方差行列式估计的快速算法,技术计量学,41,212-223(1999)
[31] Segaert,P。;休伯特,M。;卢梭,P。;Raymaekers,J.,mrfDepth:多元、回归和功能设置中的深度测量(2017)
[32] 西弗特,C。;帕尔默,C。;霍金,T。;南卡罗来纳州张伯伦。;拉姆,K。;Corvellec,M。;Despouy,P.,plotly:通过“plotly.js”创建交互式Web图形(2017)
[33] Stahel,W.A.,协方差估计的分解(1981)
[34] 孙,Y。;Genton,M.G.,《函数箱线图》,《计算与图形统计杂志》,20316-334(2011)
[35] ---,《时空数据可视化和异常检测的调整功能箱线图》,环境计量,23,54-64(2012)
[36] 孙,Y。;Hering,A.S。;Browning,J.M.,《倾斜数据中稳健的双变量误差检测及其在历史无线电探空风中的应用》,环境计量学,28,e2431(2017)
[37] 北卡罗来纳州塔拉贝洛尼。;Arribas-Gil,A。;伊娃·F。;Paganoni,A.M。;Romo,J.,roahd:高维数据的稳健分析(2017)
[38] Tukey,J.W.,《数学与数据绘图》,《国际数学家大会论文集》,第2523-531页(1975年),加拿大蒙特利尔:数学大会,加拿大蒙特利·Zbl 0347.6202号
[39] Unwin,A.,《R的图形数据分析》(2015),佛罗里达州博卡拉顿:CRC出版社,佛罗里达州波卡拉顿·Zbl 1321.62005年
[40] 瓦尔迪,Y。;Zhang,C.-H.,多元L_1中值和相关数据深度,国家科学院学报,971423-1426(2000)·Zbl 1054.62067号
[41] Wickham,H.,《分层图形语法》,《计算与图形统计杂志》,19,3-28(2010)
[42] ---,ggplot2:数据分析的优雅图形(2016),纽约:Springer-Verlag,纽约
[43] 谢伟。;Kurtek,S。;Bharath,K。;Sun,Y.,《函数数据变异性可视化的几何方法》,《美国统计协会杂志》,112979-993(2017)
[44] Yu,G。;邹,C。;Wang,Z.,功能观测中的离群点检测及其在剖面监测中的应用,技术计量学,54,308-318(2012)
[45] Zuo,Y.,基于投影的深度函数和相关中值,《统计年鉴》,311460-1490(2003)·Zbl 1046.62056号
[46] Zuo,Y。;Serfling,R.,《统计深度函数的一般概念》,《统计学年鉴》,28461-482(2000)·Zbl 1106.62334号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。