How Many Clusters? Which Clustering Method? Answers Via Model-Based Cluster Analysis

Fraley, C.; Raftery, A. E.

doi:10.1093/comjnl/41.8.578

摘要

我们考虑确定集群数据结构的问题，而不需要事先知道集群的数量或关于其组成的任何其他信息。数据由混合模型表示，其中每个组件对应于不同的簇。通过具有不同参数化和跨簇约束的高斯分量，得到了具有不同几何性质的模型。噪声和异常值可以通过添加泊松过程组件来建模。分区由最大似然期望最大化（EM）算法确定，初始值来自凝聚层次聚类。模型使用基于贝叶斯信息准则（BIC）的贝叶斯因子近似值进行比较；与显著性测试不同，这允许同时比较两个以上的模型，并消除了被比较模型嵌套的限制。通过选择最佳模型，同时解决了聚类数的确定和聚类方法的问题。此外，EM结果提供了有关每个数据点相关分类的不确定性度量。给出的例子表明，这种方法可以提供比标准程序好得多的性能，标准程序通常无法识别重叠或大小和形状不同的组。

此内容仅以PDF格式提供。

您当前没有访问此文章的权限。

下载所有幻灯片

月份：	总浏览次数：
2017年1月	三
2017年2月	74
2017年3月	124
2017年4月	117
2017年5月	134
2017年6月	138
2017年7月	121
2017年8月	117
2017年9月	99
2017年10月	159
2017年11月	211
2017年12月	130
2018年1月	116
2018年2月	57
2018年3月	63
2018年4月	88
2018年5月	28
2018年6月	29
2018年7月	38
2018年8月	48
2018年9月	31
2018年10月	38
2018年11月	48
2018年12月	52
2019年1月	41
2019年2月	46
2019年3月	74
2019年4月	79
2019年5月	81
2019年6月	47
2019年7月	48
2019年8月	60
2019年9月	59
2019年10月	45
2019年11月	55
2019年12月	38
2020年1月	45
2020年2月	32
2020年3月	33
2020年4月	27
2020年5月	20
2020年6月	39
2020年7月	23
2020年8月	23
2020年9月	24
2020年10月	35
2020年11月	33
2020年12月	24
2021年1月	31
2021年2月	25
2021年3月	32
2021年4月	26
2021年5月	36
2021年6月	22
2021年7月	14
2021年8月	14
2021年9月	19
2021年10月	22
2021年11月	38
2021年12月	26
2022年1月	28
2022年2月	22
2022年3月	24
2022年4月	30
2022年5月	22
2022年6月	26
2022年7月	26
2022年8月	20
2022年9月	19
2022年10月	24
2022年11月	24
2022年12月	27
2023年1月	37
2023年2月	26
2023年3月	30
2023年4月	31
2023年5月	13
2023年6月	16
2023年7月	25
2023年8月	32
2023年9月	12
2023年10月	22
2023年11月	28
2023年12月	23
2024年1月	27
2024年2月	17
2024年3月	35
2024年4月	36
2024年5月	35
2024年6月	6

有多少个集群？哪种聚类方法？基于模型的聚类分析的答案

摘要

引文

意见

海拔高度

电子邮件警报

通过引用文章

最新的

阅读次数最多

被引用次数最多

有多少个集群？哪种聚类方法？基于模型的聚类分析的答案

摘要

登录

个人账户

机构准入

机构账户管理

获取访问帮助

机构准入

基于IP的访问

通过您的机构登录

使用图书卡登录

协会成员

通过社交网站登录

使用个人帐户登录

个人账户

查看您的登录帐户

已登录但无法访问内容