共色

基于copula的相关观测模式发现算法。本文的主要目的是利用copula函数对依赖于聚类的数据进行研究。copula是一种流行的多变量工具,其在聚类方法中的重要性尚未得到详细的研究。我们提出了一种新的算法(简称CoClust),它可以根据生成过程的多变量结构对相关数据进行聚类,而不需要对边界进行任何假设。此外,该方法不需要选择初始分类,也不需要预先设置聚类数目;实际上,CoClust通过使用基于copula拟合的对数可能性的标准来选择它们。我们在不同依赖场景的模拟数据上测试了我们的方案,并将其与基于模型的聚类技术进行了比较。最后,我们展示了CoClust在乳腺癌患者真实微阵列数据中的应用。