×

候选组搜索K-调和均值数据聚类。 (英语) Zbl 1428.62277号

摘要:聚类是一种非常流行的数据分析和数据挖掘技术。K-means是最流行的聚类方法之一。虽然K-means.易于实现,在大多数情况下工作迅速,但它存在两个主要缺点,即对初始化的敏感性和收敛到局部最优。为了克服第一个缺点,即对初始化的敏感性,提出了K-调和均值聚类。本文提出了一种新的算法,候选组搜索(CGS),并结合K-调和平均来解决聚类问题。计算结果表明,CGS在聚类中确实以较少的计算时间获得了更好的性能,特别是对于大数据集或中心数较多的情况。

MSC公司:

62小时30分 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Anderberg,M.R.,应用聚类分析,(1973),纽约学术出版社·Zbl 0299.62029号
[2] L.Kaufmann,P.Rousseeuw,《概率统计中的数据wiley系列中的发现群体》,纽约,2005年。
[3] Mirkin,B.,数据挖掘的聚类:一种数据恢复方法,(2005),Taylor和Francis小组和FL·Zbl 1083.68099号
[4] 阿洛伊斯,D。;汉森,P。;Sheir,D.R.,《聚类》,《离散和组合数学手册》(2009),CRC出版社
[5] 汉森,P。;Jaumard,B.,聚类分析和数学编程,数学。程序。,79, 191-215, (1997) ·Zbl 0887.90182号
[6] 汉森,P。;Mladenovic,N.,J-means:一种新的局部搜索启发式算法,用于最小平方和聚类,Pattern Recogn。,34, 405-413, (2001) ·Zbl 1012.68873号
[7] B.Zhang,M.Hsu,U.Dayal,K-harmonic means-a data clustering algorithm,技术报告HPL-1999-124,Hewlett-Packard Laboratories,1999·Zbl 0987.68917号
[8] B.Zhang,广义k谐波平均值-无监督学习中的增强,技术报告HPL-2000-137,Hewlett-Packard实验室,2000年。
[9] 佐治亚州贡戈。;Unler,A.,K-调和意味着使用禁忌搜索法进行数据聚类,Appl。数学。型号。,32, 1115-1125, (2008) ·Zbl 1145.68395号
[10] 佐治亚州贡戈。;Unler,A.,K-调和意味着使用模拟退火启发式进行数据聚类,Appl。数学。计算。,184, 199-209, (2007) ·Zbl 1114.65009号
[11] 姜浩。;Yi,S。;李,J。;杨,F。;Hu,X.,带k调和均值聚类的蚂蚁聚类算法,专家系统。申请。,37, 8679-8684, (2010)
[12] Mladenovic,N。;Hansen,P.,可变邻域搜索,计算。操作。第24号决议,1097-1110,(1997年)·Zbl 0889.90119号
[13] 汉森,P。;Mladenovic,N.,《可变邻域搜索:原理和应用》,欧洲期刊Oper。决议,130,449-467,(2001)·Zbl 0981.90063号
[14] 汉森,P。;Mladenovic,N。;Moreno Perez,J.A.,《可变邻域搜索:方法和应用》,4OR:A Q.J.Oper。第6319-360号决议(2008年)·Zbl 1179.90332号
[15] Brimberg,J。;汉森,P。;Mladenovic,N.,可变邻域搜索中的吸引概率,4OR,8181-194,(2010)·Zbl 1193.90216号
[16] Alguwaizani,A。;Mladenovic,N。;汉森,P。;Ngai,E.,调和平均聚类的可变邻域搜索,应用。数学。型号。,35, 6, 2688-2694, (2011) ·兹比尔1219.68129
[17] Reinelt,G.,Tsp-lib——旅行推销员库,ORSA J.Compute。,3, 3, 376-384, (1991) ·兹伯利0775.90293
[18] 布莱克,C.L。;Merz,C.J.,UCI机器学习数据库库,(1998),加利福尼亚大学
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。