×

光谱聚类方法相似矩阵的构建:数值实验。 (英语) Zbl 1432.68383号

摘要:谱聚类是一种通过相似矩阵的特征向量发现数据集结构的强大方法。当单个簇的结构高度非凸时,它通常优于传统的聚类算法,如“k”-means。其准确性取决于如何定义数据点对之间的相似性。构建相似矩阵有两个重要因素:底层加权图的稀疏性(主要取决于数据点之间的距离)和相似函数。当使用高斯相似函数时,比例参数的选择可能很关键。在本文中,我们直接基于与数据集关联的图或图的最小生成树(MST)来检查两个项目,即稀疏性和合适的(sigma)的选择。在人工数据集和真实数据集上进行了广泛的数值实验,以比较这些方法的性能。

MSC公司:

68T05型 人工智能中的学习和自适应系统
62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Aggarwal,C.C.,《数据挖掘:教科书》(2014),Springer:Springer New York·Zbl 1311.68001号
[2] Vattany,A.,K-means即使在平面离散计算中也需要多次指数迭代。地理。,45, 596-616 (2011) ·Zbl 1218.68088号
[3] 纳西门托,M.C.V。;de Carvalho,A.C.P.L.F.,《图聚类的谱方法——一项调查》,欧洲期刊Oper。决议,211,221-231(2011)·Zbl 1250.68228号
[4] Ng,A.Y。;M.I.乔丹。;Weiss,Y.,(《关于光谱聚类:分析和算法》,《关于光谱簇:分析与算法》,Adv.Neur.In.,vol.14(2001),NIPS)
[5] Inkaya,T.,光谱聚类的无参数相似图,专家系统。申请。,42, 9489-9498 (2015)
[6] Chang,H.X。;Yeung,D.,基于稳健路径的光谱聚类,模式识别。,41, 101-203 (2008) ·Zbl 1122.68525号
[7] 叶,X。;Sakurai,T.,基于共享邻居的光谱聚类鲁棒相似性度量,ETRI J.,38,540-550(2016)
[8] von Luxburg,U.,光谱聚类教程,Stat.Comput。,17, 395-416 (2007)
[9] S.X.Yu,J.Shi,多类光谱聚类,收录于:第九届IEEE国际计算机视觉会议论文集(ICCV)03),2003年。
[10] B.减粘物,聚类指数,https://cran.r-project.org/web/packages/clusterCrit/vignettes/clusterCrit.pdf。
[11] 斯特雷尔,A。;Ghosh,J.,Cluster ensambles-用于组合多个分区的知识重用框架,J.Mach。学习。决议,3583-617(2003)·Zbl 1084.68759号
[12] 曼宁,C.D。;Raghavan,P。;Schütze,H.,《信息检索导论》(2008),剑桥大学出版社·Zbl 1160.68008号
[13] Rand,W.M.,《聚类方法评估的客观标准》,J.Amer。统计师。美国律师协会。统计师。协会,66,846-850(1971)
[14] F.Bach,M.Jordan,《学习谱聚类》,摘自:Proc。NIPS’03,第305-312页。
[15] 科曼,T.H。;Leiserson,C.E。;Rivest,R.L。;Stein,C.,《算法导论》(2009),麻省理工学院出版社·Zbl 1187.68679号
[16] O.Grygorash,Y.Zhou,Z.Jorgensen,基于最小生成树的聚类算法,in:Proc。IEEE国际人工智能协调工具,2006年,第73-81页。
[17] 钟,C。;Miao,D。;Franti,P.,《基于最小生成树的拆分与合并:一种分层聚类方法》,Inform。科学。,181, 3397-3410 (2011) ·Zbl 1336.70037号
[18] 斯拉格,J.R。;Chang,C.L。;Lee,R.T.C.,一些聚类分析算法的实验,模式识别。,181-187年6月(1974年)
[19] Zelnik-Manor,L。;Perona,P.,《自校正光谱聚类》,《高级神经信息》,第17期,第1601-1608页(2004年)
[20] 费舍尔,I。;波兰,J.,《光谱聚类技术的新方法》。代表IDSIA-12-04(2004),USI-SUPSI
[21] Davis,D.L。;Bouldin,D.W.,《集群分离措施》,IEEE Trans。模式分析。,1, 224-227 (1979)
[22] 刘,Q。;张,R。;胡,R。;王,G。;王,Z。;Zhao,一种改进的基于路径的聚类算法,Knowl-基于系统。,16369-81(2019)
[23] Frederickson,G.N.,《一种最小规模的最优选择算法》,Inform。和计算。,197-214年(1993年)·Zbl 0818.68065号
[24] O.Sourina,Olga Sourina主页上的当前项目,http://www.ntu.edu.sg/home/eosourina/projects.html。
[25] M.Lichman,加州大学信息与计算机科学学院UCI机器学习知识库,加利福尼亚州欧文。http://archive.ics.uci.edu/ml。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。