×

符号直方图变量的主轴分析。 (英语) Zbl 07260589号

摘要:我们提出了一种对符号直方图变量进行主轴分析的新方法。在符号数据分析框架中,提出了几种直方图主成分分析(Histogram PCA)。一些方法关注直方图的某些特定特征之间的关系,例如平均值或分位数。其他人使用基于平方Wasserstein距离的分布变量关联。在本文中,我们提出了两种新的方法。第一种方法使用了基于Fisher z分数的新的相关度量,这些度量是在直方图变量的相应箱子之间进行的。我们还建议使用Olkin和Pratt提出的估计器。在第一种方法中,直方图变量必须具有相同数量的容器。相比之下,第二种方法通过考虑相应的分位数扩展了先前提出的相关性。当直方图不具有相同数量的仓时,可以使用第二种方法。

理学硕士:

62至XX 统计
68倍 计算机科学
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] E.Diday、F.Afonso和R.Haddad,符号数据分析范式、判别离散化和财务应用。Revue des Nouvelles Technologies de l’高维和符号数据分析理论和应用的信息进步,RNTI-E25,(2013),1-14。
[2] H.-H.Bock和E.Diday,《符号数据分析,从复杂数据中提取统计信息的探索方法》,柏林,施普林格,2000年·Zbl 1039.62501号
[3] L.Billard和E.Diday,《符号数据分析:概念统计学和数据挖掘》,柏林,计算统计学威利系列,2006年·Zbl 1117.62002号
[4] E.Diday和M.Noirhomme-《符号数据分析和SODAS软件》,英国奇切斯特,威利跨科学出版社,2008年·Zbl 1275.62029号
[5] O.Rodriguez、E.Diday和S.Winberg,主成分分析对直方图数据的推广。2000年,在法国里昂举行的第四届欧洲数据库知识发现原则与实践会议上。
[6] P.Nagabhushan和R.P.Kumar,直方图PCA。ISNN,第2卷,1012-10212007年。
[7] M.Ichino,符号主成分分析的分位数方法,统计分析数据最小值4(2)(2011),225-233。
[8] E.Diday,条形图和metabins表的主成分分析,《统计分析数据最小值》6(5)(2013),403-430·Zbl 07260376号
[9] S.Makosso-Kallyth和E.Diday,区间主成分分析对符号直方图变量的适应性,高级数据分析分类6(2012),147-159·Zbl 1255.62173号
[10] M.Chen、H.Wang和Z.Qin,概率符号数据的主成分分析:一种更通用、更精确的算法。高级数据分析分类9(2014),59-79·Zbl 1414.62012年
[11] R.Verde、A.Irpino和A.Balzanella,分布式符号数据的降维技术,IEEE Trans Cybern 99(2015),1·Zbl 1436.62453号
[12] M.Noirhomme-Frature和P.Brito,《远远超越经典数据模型:符号数据分析》,《统计分析数据最小值》4(2)(2011),157-170·Zbl 07260275号
[13] A.Irpino、R.Verde和F.A.T.de Carvalho,基于自适应平方Wasserstein距离的直方图数据动态聚类,Expert Syst Appl 41(7)(2014),3351-3366。
[14] P.Cazes,《概率分析因子》,《应用统计评论》,50(3)(2002),5-24。
[15] P.Bertrand和F.Goupil,符号数据的描述性统计,《符号数据分析:从复杂数据中提取统计信息的探索方法》,H.-H.Bock和E.Diday编辑,柏林,施普林格,2000年,103-124·Zbl 0978.62005号
[16] L.Billard,《区间数据的一些分析》,J Comp Inform Technol 16(4)(2008),225-233。
[17] A.Irpino和R.Verde,分布符号变量的基本统计:一种新的基于度量的方法。高级数据分析分类9(2014),143-175·Zbl 1414.62017年
[18] A.L.Gibbs和F.E.Su,《关于选择和限定概率指标》,《国际统计评论》第70卷第3期(2002年),第419-435页·Zbl 1217.62014年
[19] R.A.Fisher,关于从小样本推导出的相关系数的可能误差,Metron 1(1921),3-32。
[20] K.S.Law,Fisher’S z在Schmidt-Hunter型荟萃分析中的应用。J.Educe Behav Stat 20(3)(1995),287-306。
[21] N.C.Silver和W.P.Dunlap,平均相关系数:是否应使用Fisher z变换?《应用心理学杂志》72(1987)146-148。
[22] I.Olkin和J.W.Pratt,某些相关系数的无偏估计。《数学年鉴》29(1)(1958),201-211·Zbl 0094.14403号
[23] M.Viana,等相关系数的组合估计。《通信统计理论方法》11(11)(1982),1483-1504·Zbl 0533.62049号
[24] A.Irpino、C.Lauro和R.Verde,《通过闭合形状可视化符号数据》,《数据科学与应用数据分析之间》,柏林和海德堡,施普林格,2003年,244-251·Zbl 05280179号
[25] S.Lˆe,J.Josse和F.Husson,Factominer:多元分析的r包,J Stat Softw 25(1)(2008),1-18。
[26] P.Cazes、A.Chouakria、E.Diday和Y.Schektman《主要成分分析的扩展》,《应用统计评论》,45(3)(1997),5-24。
[27] J.Murillo和O.Rodriguez,Rsda:符号数据分析的r包。2011年比利时纳穆尔符号数据分析研讨会。
[28] E.Diday、L.Billard和A.Douzal-Chuakria,区间值观测的主成分分析,《统计分析数据》Min 4(2011),229-246·Zbl 07260280号
[29] J.Brahim Brahim和S.Makosso-Kallyth,Gpciv和graphpca:复杂数据主成分分析的两个r包。2014年,马萨诸塞州波士顿,JSM。
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。