×

兹马思-数学第一资源

一种新的降维方法:因子判别法。(英语) Zbl 1226.62062
摘要:约化K均值(RKM)和因子K均值(FKM)是将主成分分析和K均值结合到一个统一的方法论中,以获得变量的简化成分集和对象的最优划分的两种数据简化技术。RKM通过最大化簇间偏差,在不影响簇内偏差的情况下,在一个缩减的空间内找到簇,从而使簇被孤立但可能是异构的。另一方面,FKM通过最小化簇内偏差而不对簇间偏差施加任何条件来识别缩减空间中的簇。因此,集群是同质的,但它们可能不是孤立的。由于两种方法在约化空间中的总偏差不是常数,所以这两种方法得到的结果不同;因此,簇之间的偏差最大化并不等同于簇之间的偏差最小化。
本文对这两种技术进行了改进,以避免上述缺点。结果表明,两种修正方法得到的结果是相同的,从而将RKM和FKM合并为一种新的方法。它被称为因子判别均值(FDKM),因为它结合了线性判别分析和K均值。本文研究了FDKM的若干理论性质及其性能,并进行了仿真研究。给出了一个在实际数据上的应用,以展示FDKM的特点。

理学硕士:
62小时30分 分类和区分;聚类分析(统计方面)
62小时25分 因子分析和主成分分析;对应分析
65立方英尺 统计计算问题(MSC2010)
软件:
小鹿
PDF格式 BibTeX公司 XML 引用
全文: 内政部
参考文献:
[1] Bock,H.H.(1987),“关于聚类分析、主成分和多维标度之间的接口”,载:多元统计建模与数据分析,多元建模与数据分析高级研讨会论文集,田纳西州诺克斯维尔,1986年5月15-16日,H.Bozdogan和A.J.Gupta编辑,多德雷赫特:里德尔出版公司,第17-34页。
[2] Calinèski,T.和Harabasz,J.(1974),“聚类分析的枝晶方法”,《统计学通讯》,第3期,第1-27页·中银0273.62010
[3] Cormack,R.M.(1971),“分类综述”,皇家统计学会杂志。系列A,134(3),321–367。
[4] De Soete,G.和Carroll,J.D.,(1994年)低维欧几里德空间中的K-均值聚类”,在分类和数据分析的新方法中,E.Diday等人,海德堡:斯普林格,第212-219页。
[5] Diday,E.等人(1979年),“自动分类优化”,INRIA(第1卷),法国罗克库特·Zbl 0471.62056
[6] Forina,M.,Lear,R.,Armanino,C.,and Lauter,S.(1988),PARVUS–用于数据探索、分类和相关性的可扩展软件包,意大利热那亚制药和食品分析与技术研究所。
[7] Hubert,L.和Arabie,P.(1985),比较分区。《分类杂志》,2193-218·Zbl 0587.62128
[8] Timmerman,M.,Ceulemans,E.,Kiers,H.A.L.,and Vichi,M.(2010年),《析因和简化K-均值重新考虑》,计算统计和数据分析,541858-1871·Zbl 1284.62396
[9] Van Buuren,S.和Heiser,W.J.(1989年),“在变量的最佳标度下将n个对象聚类成k组”,Psycometrika,54699–706·Zbl 04567856
[10] Vichi,M.和Kiers,H.A.L.(2001),“双向数据的因子K-均值分析”,计算统计学和数据分析,37,49–64·Zbl 1051.62056
[11] Vichi,M.,Rocci,R.和Kiers,H.A.L.(2007),“三向数据的同时成分和聚类模型:方法内和方法间”,《分类杂志》,24(1),71-98·Zbl 1144.62045
此参考列表基于出版商或数字数学图书馆提供的信息。它的项被试探性地匹配到zbMATH标识符,并且可能包含数据转换错误。它试图尽可能准确地反映原始论文中列出的参考文献,而不要求匹配的完整性或精确性。