×

合并高斯混合分量的方法。 (英语) Zbl 1306.62141

摘要:讨论了高斯混合分量在拟合高斯混合分量,但混合分量之间的分离程度不足以解释为“团簇”的情况下的合并问题。高斯混合体的合并问题在统计上是不可识别的,因此合并算法必须基于主观的聚类概念。区分了基于单峰概率和误分类概率(“模式”)的聚类概念。基于高斯混合模态的脊线分析、dip检验、Bhattacharyya相异性、误分类的直接估计和成对聚类成员的预测强度,针对不同的聚类概念提出了几种不同的层次合并方法。通过对两个实际数据集的仿真研究和应用,对这些方法进行了比较。介绍了一种新的分离高斯混合分量的可视化方法:有序后验图。

理学硕士:

62小时30分 分类和区分;聚类分析(统计方面)
PDF格式 BibTeX公司 XML 引用
全文: 内政部

参考文献:

[1] Banfield JD,Raftery-AE(1993)基于模型的高斯和非高斯聚类。生物特征49:803–821·Zbl 0794.62034
[2] Baudry JP,Raftery AE,Celeux G,Lo K,Gottardo R(2008)结合混合成分进行聚类。技术报告540,华盛顿大学,西雅图
[3] Biernacki C,Celeux G,Govaert G(2000),用综合完全似然评估聚类的混合模型。IEEE T模式分析22:719–725
[4] Campbell NA,Mahon RJ(1974)两种细尾蟹属岩蟹变异的多元研究。奥斯特J Zool 22:417–425
[5] Davies PL(1995)数据特征。Stat Neerl 49号:185–245·Zbl 0831.62001
[6] Fraley C,Raftery-AE(2002)基于模型的聚类、判别分析和密度估计。美国统计学杂志97:611–631·Zbl 1073.62545
[7] Fraley C,Raftery AE(2003)基于模型的聚类、密度估计和判别分析的增强软件。J分类20:263–286·Zbl 1055.62071
[8] Fukunaga K(1990)《统计模式识别导论》,第2版。纽约学术出版社·Zbl 0711.62052
[9] Hartigan JA,Hartigan PM(1985)单峰浸渍试验。安统计13:70-84·Zbl 0575.62045
[10] Hastie T,Tibshirani R(1996)高斯混合判别分析。J Roy Stat Soc B会议58:155–176·Zbl 0850.62476
[11] Hennig C(2005)分类的非对称线性降维。计算机图形统计杂志13:930–945
[12] Hennig C(2010)脊线图和聚类稳定性作为合并高斯混合成分的工具。In:Locarek Junge H,Weihs C(eds)分类作为研究工具。斯普林格,柏林,接受出版
[13] Hennig C,Coretto P(2008)《基于模型的聚类分析中的噪声分量》。在:Preisach C,Burkhard H,Schmidt Thieme L,Decker R(eds)数据分析,机器学习和应用。斯普林格,柏林,第127-138页
[14] Keribin C(2000)混合模型阶数的一致估计。Sankhya Ser A第62页:49–66页·Zbl 1081.62516
[15] 李杰(2004)基于多层混合模型的聚类。计算机图形统计杂志14:547–568
[16] Matusita K(1971)亲和性的一些性质及其应用。安一统计数学23:137-155·中银0276.62063
[17] McLachlan GJ,Peel D(2000)有限混合模型。威利,纽约·Zbl 0963.62061
[18] 邱伟,Joe H(2006)具有特定分离度的随机簇的生成。J分类23:315–334·Zbl 1336.62189
[19] Ray S,Lindsay BG(2005)多元正态混合物的地形图。美国国家统计局33:2042–2065·Zbl 1086.62066
[20] Redner RA,Walker HF(1984)混合密度、最大似然和EM算法。暹罗版本26:195–239·Zbl 0536.62021
[21] Schwarz G(1978)估计模型的维数。安统计6:461–464·Zbl 0379.62005
[22] Street WN,Wolberg WH,Mangasarian OL(1993)乳腺肿瘤诊断的核特征提取。是&T/SPIE 1993电子成像国际研讨会:科学与技术,第1905卷,加利福尼亚州圣何塞,第861-870页
[23] Tantrum J,Murua A,Stuetzle W(2003)基于层次模型聚类的评估与剪枝。在:第九届ACM SIGGDD知识发现和数据挖掘国际会议论文集,华盛顿特区,197-205页
[24] Tibshirani R,Walther G(2005)预测强度的聚类验证。计算机图形统计杂志14:511–528
[25] Tibshirani R,Walther G,Hastie T(2001)通过间隙统计估计数据集中的簇数。J Roy Stat Soc B会议63:411–423·Zbl 0979.62046
[26] Ueda N,Nakano R,Ghahramani Z,Hinton GE(2000)混合模型的SMEM算法。神经计算机12:2109–2128
此参考列表基于出版商或数字数学图书馆提供的信息。它的项被试探性地匹配到zbMATH标识符,并且可能包含数据转换错误。它试图尽可能准确地反映原始论文中列出的参考文献,而不要求匹配的完整性或精确性。