×

新的启发式调和意味着聚类。 (英语) Zbl 1334.90137号

摘要:众所周知,针对(K)-聚类问题的一些局部搜索启发式方法,例如,(K)-意味着最小平方和聚类的启发式方法有时会停留在聚类数小于所需数量(K)的解决方案上。这种解称为退化解。在本文中,我们揭示了\(K)-调和均值(KHM)方法也存在退化性,该方法是\(K)-均值启发式的一种替代方法,但对初始解不太敏感。此外,我们还发现了两类退化解,并为这两类解提供了示例。基于这些发现,我们给出了一种简单的方法来消除KHM启发式执行过程中的简并性;它可以用作KHM聚类问题的任何其他启发式算法的一部分。我们在基于可变邻域搜索(VNS)的启发式的最近变体中使用KHM启发式。对文献中常用的测试实例进行了广泛的计算分析,结果表明,如果在KHM和VNS中使用我们的简单简并校正方法,则可以获得显著的改进。此外,本文提出的基于VNS的启发式算法可以被认为是解决KHM聚类问题的最新启发式算法。

MSC公司:

90C27型 组合优化
90 C59 数学规划中的近似方法和启发式
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Alguwaizani,A.,Hansen,P.,Mladenovic,N.,Ngai,E.:谐波的可变邻域搜索意味着聚类。应用。数学。模型。35, 2688-2694 (2011) ·Zbl 1219.68129号 ·doi:10.1016/j.apm.2010.11.032
[2] Aloise,D.,Deshpande,A.,Hansen,P.,Popat,P.:欧几里德平方和聚类的Np-硬度。马赫。学习。75, 245-248 (2009) ·Zbl 1378.68047号 ·doi:10.1007/s10994-009-5103-0
[3] Aloise,D.,Hansen,P.:聚类。收录:Sheir D.r.(编辑)《离散与组合数学手册》。CRC出版社(2009)·Zbl 1213.90205号
[4] Bai,L.,Liang,J.,Dang,C.,Cao,F.:聚类分类数据的聚类中心初始化方法。专家系统。申请。39, 8022-8029 (2012) ·doi:10.1016/j.eswa.2012.01.131
[5] Blake,C.L.,Merz,C.J.:机器学习数据库的UCI存储库。http://archive.ics.uci.edu/ml/datasets.html (1998)
[6] Brimberg,J.,Mladenović,N.:多源Weber问题中的退化。数学。程序。85(1), 213-220 (1999) ·Zbl 0956.90016号 ·doi:10.1007/s101070050054
[7] Brimberg,J.,Hansen,P.,Mladenovic,N.:可变邻域搜索中的吸引概率。4OR 8181-194(2010)·兹比尔1193.90216 ·doi:10.1007/s10288-009-0108-x
[8] Cao,F.,Liang,J.,Jiang,G.:使用邻域模型的\[KK\]-Means算法的初始化方法。计算。数学。申请。58474-483(2009年)·Zbl 1189.68095号 ·doi:10.1016/j.camwa.2009.04.017
[9] Carrizosa,E.,Mladenovic,N.,Todosijevic,R.:网络上的平方和聚类。南斯拉夫。《运营杂志》。第21号决议,第157-161号决议(2011年)·Zbl 1289.90242号 ·doi:10.2298/YJOR1102157C
[10] Chua,Y.-M.,Xiab,W.-F.:幂平均值和对数平均值之间的两个最优双重不等式。计算。数学。申请。60, 83-89 (2010) ·Zbl 1205.26041号 ·doi:10.1016/j.camwa.2010.04.032
[11] 契梅希亚,A.:广义希罗尼亚、调和和幂平均的一个新的尖锐双重不等式。计算。数学。申请。64, 664671 (2012) ·Zbl 1252.26030号
[12] Erisoglu,M.,Calis,N.,Sakallioglu,S.:k-means算法中初始聚类中心的新算法。模式识别。莱特。32, 1701-1705 (2011) ·doi:10.1016/j.patrec.2011.07.011
[13] Hamerly,G.,Elkan,C.:寻找更好聚类的k-means算法的替代方法。见:《第十一届信息和知识管理国际会议记录》,第600-607页。ACM(2002)·Zbl 1252.26030号
[14] Hansen,P.,Jaumard,B.,Mladenovic,N.:低维空间中聚类的最小平方和。J.分类。15, 37-56 (1998) ·Zbl 0902.62073号 ·数字标识代码:10.1007/s003579900019
[15] Hansen,P.,Mladenovic,N.:J-means:一种新的局部搜索启发式算法,用于最小平方和聚类。模式识别。34, 405-413 (2001) ·Zbl 1012.68873号 ·doi:10.1016/S0031-3203(99)00216-2
[16] Hansen,P.,Mladenovic,N.,Pérez,J.A.M.:可变邻域搜索:方法和应用。4-OR 6,319-360(2008)·Zbl 1179.90332号
[17] 华,J.,易,S.,李,J.等:基于K-调和均值聚类的蚂蚁聚类算法。专家系统。申请。37, 8679-8684 (2010). doi:10.1016/j.eswa.2010.06.061·doi:10.1016/j.eswa.2010.06.061
[18] Li,Q.,Mitianoudis,N.,Stathaki,T.:用于多光谱图像分割的空间核K-调和均值聚类。图像处理。IET 1(2),156-167(2007)·doi:10.1049/iet-ipr:20050320
[19] Mladenović,N.,Brimberg,J.:连续位置分配问题中的简并性。GERAD理事会,G-96-37(1996)·Zbl 1012.68873号
[20] Mladenović,N.,Hansen,P.:可变邻域搜索。计算。操作。第24号决议,1097-1100(1997)·Zbl 0889.90119号 ·doi:10.1016/S0305-0548(97)00031-2
[21] Mladenovic,N.,Todosijevic,R.,Urosevic,D.:一种有效的通用变量邻域搜索,用于具有时间窗口的大型TSP问题。南斯拉夫。《运营杂志》。第23、19-31号决议(2013年)·Zbl 1299.90417号 ·doi:10.2298/YJOR120530015M
[22] Pakhira,M.K.:一种改进的K-means算法,用于避免空簇。Int.J.Recent Trends Eng.1,220-226(2009年)
[23] Ruspini,E.H.:模糊聚类的数值方法。信息科学。2, 319-350 (1970) ·Zbl 0205.21301号 ·doi:10.1016/S0020-0255(70)80056-1
[24] Steinley,D.,Brusco,M.J.:初始化k-means批聚类:几种技术的关键评估。J.分类。24, 99-121 (2007) ·Zbl 1144.62331号 ·doi:10.1007/s00357-007-0003-0
[25] Xu,R.,Wunsch,D.:集群。IEEE出版社,纽约(2009)
[26] Yang,Fengqin,Sun,Tieli,Zhang,Changhai:一种基于K-调和均值和粒子群优化的高效混合数据聚类方法原创研究文章。专家系统。申请。36, 9847-9852 (2009) ·doi:10.1016/j.eswa.2009.02.003
[27] Yin,M.,Hu,Y.,Yang,F.等人:用于聚类的新型混合K-调和平均值和引力搜索算法。专家系统。申请。38, 9319-9324 (2011). doi:10.1016/j.eswa.2011.01.018·doi:10.1016/j.eswa.2011.01.018
[28] 张斌:广义k调和意味着在无监督学习中提高学习效率。技术报告,HPL-2000-137,Hewlett-Packard Laboratories(2000)·Zbl 1219.68129号
[29] Zhang,B.,Hsu,M.,Dayal,U.:K-调和意味着一种数据聚类算法。技术报告,HPL-1999-124,Hewlett-Packard实验室(1999)·Zbl 0987.68917号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。