×

基于同时高斯模型的多来源样本聚类。 (英语) Zbl 1305.65054号

摘要:基于高斯混合模型的聚类现在是一种标准工具,用于估计单个数据集的一些假设基础分区。在本文中,我们的目标是在一个背景下同时对几个不同的数据集进行聚类,在此背景下,即使不同的潜在群体也不是完全无关的:所有个体都由相同的特征描述,并且期望具有相同意义的分区。从一些自然参数证明了与每个数据集相关联的混合组分之间存在随机线性联系,我们为所谓的同时聚类方法提出了一些简约且有意义的模型。受线性链接约束的最大似然混合参数可以通过我们描述的广义期望最大化算法轻松估计。在生物背景下,在划分三个不同的鸟类亚种时,同时聚类优于独立聚类,从而获得了一些有希望的结果。对鸟类数据的进一步研究表明,该策略对松弛其主要假设之一的精确描述符一致性具有鲁棒性。

MSC公司:

62-08 统计问题的计算方法

软件:

Mixmod公司
PDF格式BibTeX公司 XML格式引用
全文: DOI程序 哈尔

参考文献:

[1] Banfield JD,Raftery AE(1993),基于模型的高斯和非高斯聚类。生物统计学49:803–821·Zbl 0794.62034号 ·doi:10.2307/2532201
[2] Biernacki C,Beninel F,Bretagnolle V(2002)当训练人群和测试人群的描述性参数不同时,广义判别规则。生物统计学58(2):387–397·Zbl 1210.62077号 ·doi:10.1111/j.0006-341X.2002.00387.x
[3] Biernacki C,Celeux G,Govaert G,Langrognet F(2006)使用mixmod软件进行基于模型的聚类和判别分析。计算统计数据分析51:587–600·Zbl 1157.62431号 ·doi:10.1016/j.csda.2005.12.015
[4] Celeux G,Govaert G(1995)高斯简约聚类模型。图案识别28(5):781–793·doi:10.1016/0031-3203(94)00125-6
[5] D'Amico F、Lalanne Y、O'Halloran J、Smiddy P(2009)《个人沟通》
[6] Dempster AP、Laird NM、Rubin DB(1977)通过EM算法从不完整数据中获得最大似然(带讨论)。皇家统计学会杂志B 39:1–38·Zbl 0364.62022号
[7] Du Jardin P,Séverin E(2010)《企业破产过程的动态分析:破产轨迹研究》。In:葡萄牙金融网络,Ponte Delgada
[8] Flury BN(1983)k群中的常见主成分。美国统计协会J Am Stat Assoc 79:892–898
[9] Fraley C,Raftery AE(1998),多少簇?哪种聚类方法?通过基于模型的聚类分析回答。计算J 41:578–588·Zbl 0920.68038号 ·doi:10.1093/comjnl/41.8.578
[10] Govaert G,Nadif M(2008)《混合模型的块聚类:不同方法的比较》。计算统计数据分析52:323-3245·Zbl 1452.62444号 ·doi:10.1016/j.csda.2007.09.007
[11] Gower JC(1975)广义procutes分析。《心理测量学》40:33–51·Zbl 0305.62038号 ·doi:10.1007/BF02291478
[12] Lebarbier E,Mary-Huard T(2006)《美食、风味和干预》。法国社会杂志统计1:39–57
[13] Lourme A(2011)《同时技术起源倍数的分类模型和分类贡献》。里尔科技大学Paul Painlevé实验室博士论文
[14] Lourme A,Biernacki C(2010)多重来源样本的基于同步高斯模型的聚类。出版物。Irma,里尔1大学,里尔·Zbl 1305.65054号
[15] McLachlan GJ,Peel D(2000)有限混合模型。纽约威利·Zbl 0963.62061号
[16] Roeder K,Wasserman L(1997)使用混合法的实用贝叶斯密度估计。美国统计协会J Am Stat Assoc 92:894–902·兹比尔0889.62021 ·doi:10.1080/01621459.1997.10474044
[17] Scherrer B(2007)《生物统计》,第1卷,加丹·莫林
[18] Schork N,Thiel B(1996)人类遗传学中的混合分布。统计方法医学研究39:155–178·doi:10.1177/096228029600500204
[19] Schwarz G(1978)估算有限混合模型中的成分数量。安统计6:461–464·Zbl 0379.62005年 ·doi:10.1214/aos/1176344136
[20] Thibault J、Bretagnolle V、Rabouam C(1997),《科里的剪刀水枪》(Cory’s shearwater calonectris diomedea)。Birds West Palarct更新1:75–98
[21] Vermmunt J,Magidson J(2005)嵌套数据结构的层次混合模型。收录:Weihs C,Gaul W(编辑)分类:无处不在的挑战,Wiley。海德堡施普林格
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。