×

曲线形状的贝叶斯聚类。 (英语) Zbl 1394.62088号

摘要:根据曲线形状对其进行无监督聚类是一个具有广泛科学应用的重要问题。现有的基于模型的聚类技术要么依赖于通常对形状分析无效的简单概率模型(例如高斯),要么假设聚类数。我们开发了一种有效的贝叶斯方法,使用基于曲线形状的联合配准和比较的弹性形状度量对曲线数据进行聚类。从数据中获得的弹性内积矩阵使用Wishart分布建模,该分布的参数是经过仔细选择的先验分布,以允许对簇数进行自动推断。通过基于中餐厅过程的高效马尔可夫链蒙特卡罗程序对后验数据进行采样,以推断(1)聚类数量的后验分布,以及(2)形状的聚类配置。该方法在蛋白质结构分析、显微图像中的细胞形状分析以及MPEG7数据库中形状聚类的各种合成数据和实际数据示例上进行了演示。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
2015年1月62日 贝叶斯推断
PDF格式BibTeX公司 XML格式引用

参考文献:

[2] 奥德,B。;Fischer,A.,基于投影的曲线聚类,J.Stat.Compute。模拟。,82, 1145-1168 (2012) ·Zbl 1431.62679号
[3] Banfield,J.D。;Raftery,A.E.,基于模型的高斯和非高斯聚类,生物统计学,803-821(1993)·Zbl 0794.62034号
[4] Belongie,S。;Malik,J。;Puzicha,J.,使用形状上下文的形状匹配和对象识别,IEEE Trans。模式分析。机器。智力。,24509-522(2002年)
[5] 比西戈,M。;Murino,V.,《研究隐藏马尔可夫模型在二维形状分类中的能力》,IEEE Trans。模式分析。机器。智力。,26, 281-286 (2004)
[6] 比西戈,M。;Murino,V.,基于隐马尔可夫模型的二维形状分类加权似然判别法,IEEE Trans。模式分析。机器。智力。,16, 2707-2719 (2007)
[7] 比西戈,M。;穆里诺,V。;Figueiredo,M.A.,使用隐马尔可夫模型对序列进行基于相似性的分类,模式识别。,37, 2281-2291 (2004)
[8] 布林曼,K。;Panagiotou,K.,《离散分布的高效采样方法》(《计算机科学讲义》,第7391卷(2012年),施普林格-柏林-海德堡出版社)
[9] Ferguson,T.S.,《一些非参数问题的贝叶斯分析》,Ann.Statist。,209-230 (1973) ·Zbl 0255.62037号
[10] Ferguson,T.S.,概率测度空间上的先验分布,Ann.Statist。,615-629 (1974) ·Zbl 0286.62008号
[11] 弗雷利,C。;Raftery,A.E.,多少簇?哪种聚类方法?答案通过基于模型的聚类分析,计算。J.,41,578-588(1998)·Zbl 0920.68038号
[12] 弗雷利,C。;Raftery,A.E.,基于模型的聚类、判别分析和密度估计,J.Amer。统计师。协会,97,611-631(2002)·Zbl 1073.62545号
[14] 加夫尼,S。;Smyth,P.,联合概率曲线聚类和对齐,(神经信息处理系统,NIPS(2005),麻省理工学院出版社),473-480
[15] 哈格伍德,C。;伯纳尔,J。;哈尔特,M。;Elliott,J.,《使用cdf曲线评估细胞群分割算法》,IEEE Trans。医学成像,31380-390(2012)
[16] 哈格伍德,C。;伯纳尔,J。;哈尔特,M。;Elliott,J。;Brennan,T.,《基于形状和测地线距离的细胞群均匀性测试》,IEEE Trans。医学成像,322230-2237(2013)
[18] 黄,W。;加里凡,K。;Srivastava,A。;Absil,P.A.,《弹性形状分析的黎曼优化》,数学。理论网。系统(2014)
[19] Jain,A.K。;Dubes,R.C.,《聚类数据算法》(1988),普伦蒂斯·霍尔公司:普伦蒂塞·霍尔公司,美国新泽西州上鞍河·兹比尔0665.62061
[21] Kurtek,S。;Srivastava,A。;克拉森,E。;丁,Z。,使用形状和相关特征的曲线统计建模,J.Amer。统计师。协会,107,1152-1165(2012)·Zbl 1443.62389号
[22] 刘伟。;Srivastava,A。;Zhang,J.,《蛋白质结构比较的数学框架》,《公共科学图书馆·计算》。生物学,7(2011)
[23] 刘,M。;维穆里,B.C。;阿玛里,S.I。;Nielsen,F.,《使用分层全Bregman软聚类进行形状检索》,IEEE Trans。模式分析。机器。智力。,34, 2407-2419 (2012)
[24] McCullagh,P.,距离矩阵的边际似然,统计量。Sinica,19631-649(2009)·Zbl 1168.62345号
[25] MacCullagh,P。;Yang,J.,多少簇?,贝叶斯分析。,3, 1-19 (2008)
[28] Murzin,A.G。;Brenner,S.E。;哈伯德,T。;Chothia,C.,SCOP:用于序列和结构研究的蛋白质结构分类数据库,《分子生物学杂志》。,247, 536-540 (1995)
[29] Ng,A.Y。;M.I.乔丹。;Weiss,Y.,《关于光谱聚类:分析和算法》,高级神经信息处理。系统。,2, 849-856 (2002)
[30] 小泽,K.,一个分层重叠簇方案,模式识别。,18, 279-286 (1985) ·兹比尔0575.62059
[31] Pitman,J.,组合随机过程。第1875卷(2006年),斯普林格·弗拉格
[32] Rohde,G.K。;里贝罗,A.J.S。;Dahl,K.N。;Murphy,R.F.,《基于变形的核形态计量学:捕获hela细胞中的核形态变化》,《细胞计量学A部分》,73A,341-350(2008)
[33] Srivastava,A。;Joshi,S。;Mio,W。;Liu,X.,《统计形状分析:聚类、学习和测试》,IEEE Trans。模式分析。机器。智力。,27, 590-602 (2005)
[34] Srivastava,A。;克拉森,E。;乔希,S.H。;Jermyn,I.H.,欧几里德空间中弹性曲线的形状分析,IEEE Trans。模式分析。机器。智力。,33, 1415-1428 (2011)
[35] 托马斯·C·H。;科利尔,J.H。;Sfeir,C.S。;Healy,K.E.,《通过调节核形状来工程基因表达和蛋白质合成》,Proc。国家。阿卡德。科学。,99, 1972-1977 (2002)
[36] 托塞洛,A。;罗伯斯·凯利,A。;Hancock,E.,《使用树编辑距离和成对聚类发现形状类》,《国际计算杂志》。视觉。,72, 259-285 (2007)
[37] 塔克,J.D。;Wu,W。;Srivastava,A.,使用相位和振幅分离的功能数据生成模型,计算。统计数据分析。,61, 50-66 (2013) ·Zbl 1349.62253号
[39] Ward,J.H.,优化目标函数的分层分组,J.Amer。统计师。协会,58,236-244(1963)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。