×

具有复杂集群结构的受限集群。 (英语) Zbl 1414.62273号

摘要:在这篇文章中,我们提出了一种新的约束聚类方法,即具有复杂簇结构的约束聚类(C4s),它将等价约束(正负约束)作为背景信息。C4s能够发现任意结构的组,例如具有多模态分布的组,因为在初始阶段,由正约束生成的元素的等价类被分割成更小的部分。这提供了对正等价关系的元素的详细描述。为了能够自动检测组的数量,对每个分区过程应用交叉熵聚类。实验表明,该方法比以前的约束聚类方法取得了明显更好的结果。当我们专注于寻找具有复杂集群结构的分区时,我们的算法的优势会增加。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] Arbelaez P,Maire M,Fowlkes C,Malik J(2011)轮廓检测和分层图像分割。IEEE Trans-Pattern Ana Mach Intell 33(5):898-916。doi:10.1109/TPAMI.2010.161·doi:10.1109/TPAMI.2010.161
[2] Bar-Hillel A,Hertz T,Shental N,Weinshall D(2003)使用等价关系学习距离函数。收录:机器学习,第二十届国际会议论文集(ICML 2003),2003年8月21日至24日。DC,美国,AAAI出版社,华盛顿,第11-18页·Zbl 1222.68140号
[3] Basu S,Banerjee A,Mooney RJ(2002)《播种半监督聚类》。摘自:机器学习,《第十九届国际会议论文集》(ICML 2002),2002年7月8日至12日。澳大利亚,摩根·考夫曼,悉尼,第27-34页
[4] Baudry JP、Cardoso M、Celeux G、Amorim M、Ferreira A(2015)《利用外部类别变量加强基于模型的聚类选择》。高级数据分析分类9(2):177-196。文件编号:10.1007/s11634-014-0177-3·Zbl 1414.62226号 ·doi:10.1007/s11634-014-0177-3
[5] Bellas A、Bouveyron C、Cottrell M、Lacaille J(2013)基于模型的高维数据流聚类与概率主成分分析的在线混合。高级数据分析类7:281-300·Zbl 1273.62137号 ·doi:10.1007/s11634-013-0133-7
[6] Bennett KP,Demiriz A(1998)半监督支持向量机。摘自:《神经信息处理系统的进展》,麻省理工学院出版社,剑桥,第368-374页
[7] Bilenko M,Basu S,Mooney RJ(2004)《在半监督聚类中集成约束和度量学习》。摘自:《机器学习》,《第二十届国际会议论文集》(ICML 2004),2004年7月4日至8日,加拿大阿尔伯塔省班夫,美国纽约州纽约市ACM,第11页。doi:10.1145/1015330.1015360
[8] Cayton L(2005)流形学习算法。加州大学圣地亚哥分校技术代表,第1-17页
[9] Collingwood EF,Lowater AJ(2004)《簇集理论》。剑桥大学出版社·Zbl 0212.42301号
[10] 丁俊杰,王玉华,胡磊,赵武林,肖玉伟(2011)图像分割肌肉损伤判定。摘自:视觉通信和图像处理(VCIP),2011 IEEE,第1-4页。doi:10.1109/VCIP.2011.6115925
[11] Hartigan JA,Wong MA(1979)算法AS 136:一种k-means聚类算法。J R Stat Soc Ser C(应用统计)28(1):100-108·Zbl 0447.62062号
[12] Hennig C(2010)合并高斯混合成分的方法。高级数据分析分类4(1):3-34。doi:10.1007/s11634-010-0058-3·Zbl 1306.62141号 ·doi:10.1007/s11634-010-0058-3
[13] Hruschka ER、Campello RJBB、Freitas AA、De Carvalho ACPLF(2009)《集群进化算法调查》。IEEE Trans-Syst Man Cybern C Cybern39(2):133-155
[14] Hubert L,Arabie P(1985)比较分区。J类2:193-218·Zbl 0587.62128号 ·doi:10.1007/BF01908075
[15] Jain AK(2010)数据聚类:超越k-means 50年。图案识别信31(8):651-666。doi:10.1016/j.patrec.2009.09.011·doi:10.1016/j.patrec.2009.09.011
[16] Jain AK、Murty NM、Flynn PJ(1999)《数据聚类:综述》。ACM计算概况31:264-323·数字对象标识代码:10.1145/331499.331504
[17] Klein D,Kamvar SD,Manning CD(2002)《从实例级约束到空间级约束:充分利用数据聚类中的先验知识》,载于:机器学习,第十九届国际会议论文集(ICML 2002),2002年7月8日至12日。澳大利亚,Morgan Kaufmann,Sydney,第307-314页
[18] Klekota J,Roth FP(2008),生物活性富集的化学亚结构。生物信息学24(21):2518-2525·doi:10.1093/bioinformatics/btn479
[19] Lee S,McLachlan G(2013)关于斜正态分布和斜t分布的混合。高级数据分析分类7(3):241-266。doi:10.1007/s11634-013-0132-8·Zbl 1273.62115号 ·doi:10.1007/s11634-013-0132-8
[20] Li Z,Liu J,Tang X(2009)基于谱正则化的约束聚类。收录于:《计算机视觉与模式识别》,2009年。CVPR 2009。IEEE会议,第421-428页。doi:10.1109/CVPR.2009.5206852
[21] Lichman M(2013)UCI机器学习库。http://archive.ics.uci.edu/ml
[22] Lu Z,Leen TK(2004)带惩罚概率聚类的半监督学习。In:NIPS
[23] McLachlan G,Krishnan T(2008)《EM算法和扩展》,《概率统计中的威利级数》,第2版。霍博肯·威利·Zbl 1165.62019号
[24] McNicholas PD,Murphy TB(2010)通过潜在高斯混合模型对微阵列表达数据进行基于模型的聚类。生物信息学26(21):2705-2712·doi:10.1093/bioinformatics/btq498
[25] Melnykov V,Melnygov I,Michael S(2015),基于半监督模型的正负约束聚类。高级数据分析分类1-23。doi:10.1007/s11634-015-0200-3·Zbl 1414.62255号
[26] Morlini I(2012)在高斯混合模型中聚类混合二进制和连续变量的潜在变量方法。高级数据分析分类6(1):5-28·Zbl 1284.62384号 ·doi:10.1007/s11634-011-0101-z
[27] Morris K,McNicholas P,Scrucca L(2013),通过多元t分布的混合物对基于模型的聚类进行降维。高级数据分析分类7(3):321-338。doi:10.1007/s11634-013-0137-3·Zbl 1273.62141号 ·doi:10.1007/s11634-013-0137-3
[28] Narayanan H,Mitter S(2010)测试流形假设的样本复杂性。摘自:神经信息处理系统进展,第1786-1794页
[29] Nguyen HD,McLachlan GJ(2015)无矩阵运算的高斯混合模型的最大似然估计。高级数据分析分类9(4):371-394·Zbl 1416.65046号 ·doi:10.1007/s11634-015-0209-7
[30] Olivier B、Soudijn W、van Wijngaarden I(1999)《5-ht》\[_{1A}1\]受体及其配体:结构和功能。摘自:Jucker E(ed)药物研究进展,药物研究进展第52卷,第103-165页
[31] Pavel B(2002)聚类数据挖掘技术综述。技术报告,Accrue软件
[32] Rubinstein RY,Kroese DP(2004)《交叉熵方法:组合优化的统一方法》,蒙特卡罗模拟(信息科学与统计)。Springer Verlag纽约公司,美国新泽西州塞考库斯·Zbl 1140.90005号
[33] Samuelsson J(2004)使用高斯混合模型的语音波形量化。收录于:声学、语音和信号处理,2004年。诉讼程序。(ICASSP’04)。IEEE国际会议第1卷,第I-165-8页,第1卷。doi:10.1109/ICASSP.2004.1325948
[34] Scrucca L,Raftery AE(2015)使用高斯层次划分改进了基于模型的聚类初始化。高级数据分析分类9(4):447-460·Zbl 1414.62272号 ·doi:10.1007/s11634-015-0220-z
[35] Shental N,Bar-Hillel A,Hertz T,Weinshall D(2004)使用等价约束计算含EM的高斯混合模型。高级神经信息处理系统16(8):465-472·Zbl 1161.68775号
[36] Śmieja M,Tabor J(2013),使用交叉熵聚类进行图像分割。摘自:2013年第八届计算机识别系统国际会议论文集。Springer,智能系统和计算进展,第403-409页
[37] Śmieja M,Tabor J(2015a)有损信源编码问题中的熵近似。熵17(5):3400-3418·Zbl 1338.94053号 ·doi:10.3390/e17053400
[38] Śmieja M,Tabor J(2015b)《球面Wards聚类和广义Voronoi图》。摘自:数据科学与高级分析(DSAA),2015年。36678 2015. IEEE国际会议,IEEE,第1-10页
[39] Śmieja M,Warszycki D(2016)平均信息含量最大化——指纹杂交和还原的新方法。公共科学图书馆·综合11(1):e0146666
[40] Sommer C、Strähle C、Köthe U、Hamprecht FA(2011)ilastik:交互式学习和细分工具包。年:第八届IEEE生物医学成像国际研讨会(ISBI)。会议记录,第230-233页。doi:10.1109/ISBI.011.5872394
[41] Spurek P,Tabor J,Zajńc E(2013)电子显微镜图像中盘状颗粒的检测。摘自:2013年第八届计算机识别系统核心国际会议记录,施普林格,第411-417页
[42] Subedi S,McNicholas P(2014)通过混合正态逆高斯分布进行聚类的变分贝叶斯近似。高级数据分析分类8(2):167-193。doi:10.1007/s11634-014-0165-7·Zbl 1459.62122号 ·doi:10.1007/s11634-014-0165-7
[43] Tabor J,Misztal K(2013)通过交叉熵聚类检测椭圆形状。In:模式识别和图像分析,柏林施普林格7887:656-663
[44] Tabor J,Spurek P(2014)交叉熵聚类。模式识别47(9):3046-3059。doi:10.1016/j.patcog.2014.03.006·Zbl 1342.68279号 ·doi:10.1016/j.patcog.2014.03.006
[45] Telgarsky M,Vattani A(2010)Hartigan的方法:无Voronoi的k均值聚类。收件人:Teh YW,Titterington DM(eds)AISTATS,JMLR.org,JMLR Proceedings,第9卷,第820-827页
[46] Vyas R,Gao J,Cheng L,Du P(2014)基于图像的胃肠道cajal网络间质细胞模型。收录:Goh J(ed)第15届国际生物医学工程会议,IFMBE会议记录,第43卷,施普林格国际出版公司,第5-8页
[47] Wagstaff K,Cardie C,Rogers S,Schrödl S(2001)带背景知识的约束K-means聚类。摘自:机器学习,《第十八届国际会议论文集》(ICML 2001),2001年6月28日至7月1日。威廉姆斯学院,威廉姆斯镇,马萨诸塞州,美国,摩根考夫曼,第577-584页
[48] Wang X,Davidson I(2010)柔性约束谱聚类。摘自:第16届ACM SIGKDD国际知识发现和数据挖掘会议论文集,美国纽约州纽约市ACM,KDD’10,第563-572页。数字对象标识代码:10.1145/1835804.1835877
[49] Warszycki D、Mordalski S、Kristiansen K、Kafel R、Sylte I、Chilmonczyk Z、Bojarski AJ(2013)药效团假设的线性组合作为寻找新活性化合物的新工具——5-羟色胺的应用\[_{1A}1\]受体配体。公共科学图书馆·综合8(12):e84510。doi:10.1371/journal.pone.0084510
[50] Willett P(2005)二维和三维化学结构数据库的搜索技术。医学化学杂志48(13):4183-4199。doi:10.1021/jm0582165·doi:10.1021/jm0582165
[51] Wolfe J(1963)《社会领域的对象聚类分析》。加利福尼亚大学
[52] Wu Q,Merchant FA,Castleman KR(2008)显微图像处理。爱思唯尔/学术出版社,阿姆斯特丹
[53] Xiong Z,Chen Y,Wang R,Huang T(2002)改进了基于信息最大化的实时视频人脸和面部特征检测,并将其应用于多模式身份识别系统。In:《多式联运接口》,2002年。诉讼程序。第四届IEEE国际会议,第511-516页。doi:10.1109/ICMI.2002.1167048
[54] Xu R,Wunsch D(2009)聚类。Wiley IEEE出版社,霍博肯
[55] Xu R,Wunsch I(2005)聚类算法综述。IEEE Trans神经网络16:645-678·doi:10.1109/TNN.2005.845141
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。