摘要
本文讨论了基于贝叶斯聚类模型后验分布的聚类$c^{(1)}、c^{2)}和c^{M}的MCMC样本,获得单个聚类估计$hat{c}$的问题。回顾并讨论了当分组数$K$在不同的聚类中变化时,导出$\hat{c}$的方法。这些包括最大后验概率(MAP)估计和基于后验相似矩阵的方法,后验相似性矩阵包含观察值$i$和$j$位于同一簇中的后验概率。后验相似矩阵与Binder(1978)常用的损失函数有关。损失最小化等价于最大化估计聚类和真实聚类之间的Rand指数。我们提出了基于后验期望调整Rand指数的聚类估计新标准。模拟研究和基因表达数据应用表明,该标准具有收缩特性,且优于粘结剂的损失。与其他聚类过程相比,它们的性能也很好。
引用
下载引文
阿诺·弗里奇。
卡贾·伊克斯塔特。
“基于后验相似性矩阵的改进聚类标准。”
贝叶斯分析。
4
(2)
367-391中,
2009年6月。
https://doi.org/10.1214/09-BA414
问询处
发布日期:2009年6月
首次在欧几里德项目中提供:2012年6月22日
数字对象标识符:10.1214/09-BA414
关键词:调整后的兰德指数,聚类分析,Dirichlet过程混合模型,马尔科夫蒙特卡洛
版权所有©2009国际贝叶斯分析学会