×

兹马思-数学第一资源

利用外部分类变量增强基于模型的聚类选择。(英语) Zbl 1414.62226
摘要:在聚类分析中,根据与数据聚类没有直接关系的外部范畴变量来解释从数据构建的分区是很有用的。提出了一种在基于模型的聚类上下文中选择一组既能很好地拟合数据又能充分利用外部变量潜在的解释能力的聚类方法。该方法利用了数据和分区的综合联合似然,即基于模型的分区和与外部变量相关的分区。值得注意的是,每一个混合模型都是用极大似然法对数据进行拟合,不包括仅用于选择相关混合模型的外部变量。数值实验证明了该判据的良好性能。
理学硕士:
62小时30分 分类和区分;聚类分析(统计方面)
PDF格式 BibTeX公司 XML 引用
全文: 内政部
参考文献:
[1] Bache K,Lichman M(2013)UCI机器学习知识库http://archive.ics.uci.edu/ml。加州欧文:加州大学信息与计算机科学学院
[2] Baudry J-P(2009)聚类模型选择。选择班级的数量。巴黎大学博士论文。http://tel.archives-ouvertes.fr/tel-00461550/fr/
[3] Baudry J-P(2012)基于条件分类似然的模型聚类估计与模型选择。数学统计理论。arXIV:1205.4123(预印本)
[4] 比尔纳基,C。;塞勒克斯,G。;Govaert,G.,《用综合完全似然评估聚类的混合模型》,IEEE Trans-PAMI,22719-725,(2000)
[5] 比尔纳基,C。;塞勒克斯,G。;政府,G。;Langrognet,F.,基于模型的聚类和判别分析与mixmod软件,计算机统计数据分析,51587-600,(2006)·Zbl 1157.62431
[6] 北卡罗来纳州坎贝尔市。;Mahon,R.,《两种岩蟹的变异的多变量研究》,Aust J Zool,22,417-425,(1974)
[7] 塞勒克斯,G。;Govaert,G.,高斯简约聚类模型,模式识别,28781-793,(1995)
[8] 邓普斯特,A。;莱尔德,N。;Rubin,D.,《通过EM算法从不完全数据中获得最大可能性》,J R Stat Soc Ser B,39,1-38,(1977)·Zbl 0364.62022
[9] Fisher,R.,《分类学问题中多重测量的使用》,Ann Eugen,7179-188,(1936)
[10] Gordon A(1999)分类,第2版。查普曼和霍尔/CRC·Zbl 0929.62068
[11] 亨尼格,C。;廖,TF,如何寻找混合型变量的适当聚类及其在社会经济分层中的应用,J R Stat Soc Ser C(应用统计学),62309-369,(2013)
[12] Keribin,C.,混合模型阶数的一致估计,Sankhya A,62,49-66,(2000)·Zbl 1081.62516
[13] Lebret R,Iovleff S,Langrognet F,Biernacki C,Celeux G,Govaert G(2012)Rmixmod:基于模型的无监督、监督和半监督分类mixmod库的R包。http://cran.r-project.org/web/packages/Rmixmod/index.html
[14] McLachlan G,Krishnan T(2008)《EM算法与扩展》,第2版。威利,纽约·Zbl 1165.62019
[15] McLachlan G,Peel D(2000)有限混合模型。威利,纽约·Zbl 0963.62061
[16] 罗德,K。;Wasserman,L.,使用正态混合的实际贝叶斯密度估计,J Am Stat Assoc,92894-902,(1997)·Zbl 0889.62021
[17] Schwarz,G.,估计模型的维数,Ann Stat,6461-464,(1978)·Zbl 0379.62005
此参考列表基于出版商或数字数学图书馆提供的信息。它的项被试探性地匹配到zbMATH标识符,并且可能包含数据转换错误。它试图尽可能准确地反映原始论文中列出的参考文献,而不要求匹配的完整性或精确性。