×

区间成分数据的探索性数据分析。 (英语) 兹伯利1414.62211

摘要:成分数据被视为整体上各部分相对贡献的数据,由它们之间的(对数)比率表示,对于分析至关重要。在符号数据分析(SDA)中,当元素由变量表征时,我们处于区间数据的框架中,变量的值是代表内在可变性的区间。在本文中,我们讨论了区间组合分析的特殊问题,即当区间数据是通过组合的聚合获得的时候。假设区间信息由各自的中点和范围表示,并且两个信息源都被认为是合成。在此背景下,我们将区间数据表示为三向数据。在成分数据分析的对数比率方法框架中,概述了如何在探索性环境中处理区间成分。分析的目的是用坐标表示组成,这些坐标可以根据原始组成部分进行解释。这是通过将每个零件的所有相关信息(对数比)从坐标系汇总到一个坐标来实现的。基于欧盟收入和生活条件统计(EU-SILC)的一个例子,概述并研究了区间组成探索性数据分析方法的几种可能性。

MSC公司:

62H25个 因子分析和主成分;对应分析
62小时99 多元分析

软件:

莱肯SODAS公司
PDF格式BibTeX公司 XML格式引用
全文: DOI程序 链接

参考文献:

[1] Aitchison J(1986)成分数据的统计分析。查普曼和霍尔,伦敦·Zbl 0688.62004号 ·doi:10.1007/978-94-009-4109-0
[2] Aitchison J,Greenacre M(2002)《成分数据的双点图》。J R Stat Soc Ser C(应用统计)51(4):375-392·Zbl 1111.62300号 ·数字对象标识代码:10.1111/1467-9876.00275
[3] Aitchison J,Ng KW(2005)《扰动在成分数据分析中的作用》。统计模型5:173-185·Zbl 1069.62003号 ·doi:10.1191/1471082X05st091oa
[4] Alfons A,Templ M(2013)《复杂调查中社会排斥指标的估算:R包leeken》。J Stat Softw杂志54(15):1-25·doi:10.18637/jss.v054.i15
[5] Billheimer D、Guttorp P、Fagan W(2001)《物种组成的统计解释》。美国统计学会杂志96:1205-1214·Zbl 1073.62573号 ·数字对象标识代码:10.1198/016214501753381850
[6] Billard L,Diday E(2003)《从数据统计到知识统计:符号数据分析》。美国统计协会杂志98(462):470-487·doi:10.1198/016214503000242
[7] Bock H-H,Diday E(eds)(2000)符号数据分析,探索从复杂数据中提取统计信息的方法。海德堡施普林格·Zbl 1039.62501号
[8] Brito P,Duarte Silva AP(2012)用正态和斜态分布模拟区间数据。J应用统计39(1):3-20·Zbl 1514.62081号 ·doi:10.1080/02664763.2011.575125
[9] Bro R(1997)《巴拉法克》。教程和应用程序。化学计量学智能实验室系统38:149-171·doi:10.1016/S0169-7439(97)00032-4
[10] Cazes P,Chouakria A,Diday E,Schektman Y(1997)《主要成分分析扩展》。Rev Stat应用程序24:5-24
[11] Chouakria,A。;Cazes出版社。;Diday,E。;Bock,HH(编辑);Diday,E.(编辑),《符号主成分分析》,200-212(2000),海德堡·Zbl 0977.62063号
[12] Diday E,Noirhomme-Frature M(eds)(2008)符号数据分析和SODAS软件。奇切斯特威利·Zbl 1275.62029号
[13] Di Palma AM、Filzmoser P、Gallo M、Hron K(2015)成分数据的稳健CP模型(已提交)·Zbl 1516.62252号
[14] Eaton ML(1983)多元统计。向量空间方法。John Wiley&Sons,纽约·Zbl 0587.62097号
[15] Egozcue JJ、Pawlowsky-Glahn V、Mateu-Figueras G、Barceló-Vidal V(2003)《成分数据分析的等距对数比变换》。数学地理35:279-300·Zbl 1302.86024号 ·doi:10.1023/A:1023818214614
[16] Egozcue JJ,Pawlowsky-Glahn V(2005)成分数据分析中的零件组及其平衡。数学地理37:795-828·Zbl 1177.86018号 ·doi:10.1007/s11004-005-7381-9
[17] Egozcue,JJ;Pawlowsky-Glahn,V。;Buccianti,A.(编辑);Mateu-Figueras,G.(编辑);Pawlowsky-Glahn,V.(编辑),成分数据的简单几何,145-160(2006),伦敦·Zbl 1156.86307号
[18] Filzmoser P,Hron K(2008)使用稳健方法对成分数据进行异常检测。数学地质40(3):233-248·Zbl 1135.62040号 ·doi:10.1007/s11004-007-9141-5
[19] Filzmoser P、Hron K、Reimann C(2009)《离群值成分数据的主成分分析》。环境计量20(6):621-632·doi:10.1002/env.966
[20] Filzmoser P,Hron K(2009),成分数据的相关性分析。数学地质41(8):905-919·Zbl 1178.86019号 ·doi:10.1007/s11004-008-9196-y
[21] Filzmoser P,Hron K,Reimann C(2012)成分数据的多元异常值解释。计算地质科学39:77-85·doi:10.1016/j.cageo.2011.06.014
[22] Filzmoser,P。;Hron,K。;Pawlowsky-Glahn,V.(编辑);Buccianti,A.(编辑),稳健统计分析,59-72(2011),奇切斯特·数字对象标识代码:10.1002/9781119976462.4h5
[23] FišerováE,Hron K(2011)关于成分数据的正交坐标解释。数学地质学43:455-468·doi:10.1007/s11004-011-9333-x
[24] Engle MA、Gallo M、Schroeder KT、Geboy NJ、Zupanic JW(2014)水质监测数据的三元成分分析。环境经济统计21(3):565-581·doi:10.1007/s10651-013-0268-x
[25] Giordani P,Kiers HAL(2006)模糊区间数据主成分分析三种方法的比较。《计算统计数据分析》特刊“统计分析的模糊方法”51(1):379-397·Zbl 1157.62426号
[26] Kojadinovic I,Holmes M(2009)基于经验copula过程的Cramér-von Mises泛函的连续随机向量独立性测试。多变量分析杂志100:1137-1154·Zbl 1159.62033号 ·doi:10.1016/j.jmva2008.10.013
[27] Kroonenberg EM(1983)《三模式主成分分析:理论与应用》。莱顿DSWO
[28] Kroonenberg EM,De Leeuw J(1980)用交替最小二乘算法对三模数据进行主成分分析。《心理测量学》45:69-97·Zbl 0431.62035号 ·doi:10.1007/BF02293599
[29] 劳罗,C。;Palumbo,F。;Vichi,M.(编辑);等。,非精确数据的主成分分析,173-184(2005),海德堡·Zbl 1341.62163号 ·doi:10.1007/3-540-27373-5_21
[30] Mateu-Figueras G,Pawlowsky-Glahn V(2008),地球化学概率定律的关键方法。数学地质学40:489-502·Zbl 1153.86338号 ·doi:10.1007/s11004-008-9169-1
[31] Moore RE(1966)区间分析。新泽西州普伦蒂斯·霍尔·Zbl 0176.13301号
[32] Morrison DF(1990)多元统计方法,第3版。McGraw-Hill,纽约·Zbl 0183.20605号
[33] Neto EAL,De Carvalho FAT(2008),将线性回归模型拟合到符号区间数据的中心和范围方法。计算统计数据分析52(3):1500-1515·Zbl 1452.62493号 ·doi:10.1016/j.csda.2007.04.014
[34] Neto EAL,De Carvalho FAT(2010)符号区间值变量的约束线性回归模型。计算统计数据分析54(2):333-347·Zbl 1464.62055号 ·doi:10.1016/j.csda.2009.08.010
[35] Noirhomme-Frature M,Brito P(2011)《远远超越经典数据模型:符号数据分析》。统计分析数据最小值4(2):157-170·Zbl 07260275号 ·doi:10.1002/sam.10112
[36] Palarea-Albaladejo J,Martín-Fernández JA(2012)《成分数据模糊c均值聚类的距离和变换》。J分类29:144-169·Zbl 1360.62347号 ·文件编号:10.1007/s00357-012-9105-4
[37] Pavlačka O(2013)关于模糊加权平均值和模糊凸和之间缺乏相等性的注释。模糊集系统213:102-105·Zbl 1291.91052号 ·doi:10.1016/j.fss.2012.08.003
[38] Pawlowsky-Glahn V,Egozcue JJ(2001)单形统计分析的几何方法。Stoch环境研究风险评估15:384-398·Zbl 0987.62001号 ·doi:10.1007/s004770100077
[39] Pawlowsky-Glahn V,Egozcue JJ,Tolosana-Delgado R(2015a)成分数据建模与分析。奇切斯特·威利
[40] Pawlowsky-Glahn V、Egozcue JJ、Lovell D(2015年b)《总计成分数据工具》。统计模型15:175-190·Zbl 07258984号 ·doi:10.177/1471082X14535526
[41] Rousseeuw PJ,Ruts I,Tukey JW(1999)《bagplot:一个双变量箱线图》。美国统计局53(4):382-387
[42] Seber GAF(1984)多元观察。纽约威利·Zbl 0627.62052号
[43] Teles P,Brito P(2015)用时空过程建模区间时间序列。公共统计理论方法44(17):3599-3627·兹比尔1342.37076 ·doi:10.1080/03610926.2013.782200
[44] Wang H,Guan R,Wu J(2012)CIPCA:区间值数据的完全信息主成分分析。神经计算86:158-169·doi:10.1016/j.neucom.2012.01.018
[45] Zuccolotto P(2007)《样本估计的主要成分:通过符号数据分析的方法》。统计方法应用16(2):173-192·Zbl 1405.62073号 ·doi:10.1007/s10260-006-0024-6
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。