×

一种改进的最小平方和聚类列生成算法。 (英语) Zbl 1236.90095号

摘要:给定一组与欧几里德空间中的点相关的实体,最小平方和聚类(MSSC)包括将该集合划分为簇,从而使每个点到其簇形心的平方距离之和最小化。MSSC的列生成算法如下所示O.du Merle公司等[SIAM J.Sci.Compute.21,No.4,1485-1505(1999;Zbl 1049.90129号)]. 该算法的瓶颈是解决了寻找成本为负的列的辅助问题。我们提出了一种基于几何参数的解决此辅助问题的新方法。这大大提高了整个算法的效率,并导致对2300多个实体的实例进行精确求解,即是以前的10倍多。

MSC公司:

90C27型 组合优化
65千5 数值数学规划方法
91立方厘米20 社会和行为科学中的集群
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Aloise D.,Deshpande A.,Hansen P.,Popat P.:欧几里德平方和聚类的NP-hardeness。马赫。学习。75, 245–249 (2009) ·Zbl 1378.68047号 ·doi:10.1007/s10994-009-5103-0
[2] Aloise D.,Hansen P.:基于分支和切割SDP的最小平方和聚类算法。Pesquisa Operacional 29,503–516(2009)·doi:10.1590/S0101-74382009000300002
[3] Aloise,D.,Hansen,P.:评估基于分支约束RLT的最小平方和聚类算法。发表在J.Glob上。最佳方案。(2010) ·Zbl 1213.90205号
[4] An L.T.,Belghiti M.T.,Tao P.D.:基于DC编程和DCA的新高效聚类算法。J.Glob。最佳方案。37, 593–608 (2007) ·Zbl 1198.90327号 ·doi:10.1007/s10898-006-9066-4
[5] Asuncion,A.,Newman,D.J.:UCI机器学习库。网址:http://www.ics.uci.edu/\(\sim\)mlearn/MLRepository.html。(2007)
[6] Bagirov A.M.:最小平方和聚类问题的改进的全局k-means算法。模式识别。41, 3192–3199 (2008) ·兹比尔1147.68669 ·doi:10.1016/j.patcog.2008.04.004
[7] Bagirov A.M.,Yearwoord J.:优化目标函数的分层分组。欧洲药典。第170、578–596号决议(2006年)·Zbl 1085.90045号 ·doi:10.1016/j.ejor.2004.06.014
[8] Bonami,P.,Lee,J.:BONMIN用户手册。技术报告,IBM Corporation,2007年6月
[9] Brusco M.J.:一种重复的分枝定界方法,用于求簇内平方和划分的最小值。《心理测量学》71,347–363(2006)·Zbl 1306.62387号 ·doi:10.1007/s11336-004-1218-1
[10] Brusco M.J.,Steinley D.:最小聚类平方和划分启发式程序的比较。《心理测量学》72,583–600(2007)·Zbl 1291.62196号 ·文件编号:10.1007/s11336-007-9013-4
[11] Christou,I.T.:基于方法的集群群精确协调。出现在IEEE Trans。模式分析。机器。智力。(2010)
[12] Diehr G.:聚类分枝定界算法的评估。SIAM J.科学。统计计算。6, 268–284 (1985) ·Zbl 0561.65097号 ·doi:10.1137/0906020
[13] Dinkelbach W.:关于非线性分式规划。《管理科学》13,492–498(1967)·Zbl 0152.18402号 ·doi:10.1287/mnsc.13.7.492
[14] Drezner Z.、Mehrez A.、Wesolowsky G.O.:距离有限的设施位置问题。运输。科学。25, 183–187 (1991) ·Zbl 0744.90046号 ·doi:10.1287/trsc.25.3.183
[15] du Merle O.,Hansen P.,Jaumard B.,MladenovićN.:最小平方和聚类的内点算法。SIAM J.科学。计算。21, 1485–1505 (2000) ·Zbl 1049.90129号
[16] du Merle O.,Villeneuve D.,Desrosiers J.,Hansen P.:稳定柱生成。离散数学。194, 229–237 (1999) ·Zbl 0949.90063号 ·doi:10.1016/S0012-365X(98)00213-1
[17] Edwards A.W.,Cavalli-Sforza L.L.:一种聚类分析方法。生物统计学21,362–375(1965)·doi:10.2307/2528096
[18] Elhedhli S.,Goffin J.-L.:分支和价格算法中内点切割平面方法的集成。数学。程序。100267–294(2004年)·Zbl 1069.90109号 ·doi:10.1007/s10107-003-0469-4号文件
[19] Fisher R.A.:在分类问题中使用多重测量。安·尤根。七、 179-188(1936年)·文件编号:10.1111/j.1469-1809.1936.tb02137.x
[20] Forgy E.W.:多元数据的聚类分析:分类的效率与可解释性。生物统计学21,768(1965)
[21] Goffin J.-L.,Haurie A.,Vial J.-P.:用投影算法进行分解和不可微优化。管理。科学。38, 284–302 (1992) ·兹比尔0762.90050 ·doi:10.1287/mnsc.38.2.284
[22] Grötschel,M.,Holland,O.:大规模对称旅行推销员问题的解。数学。程序。51, 141–202 (1991). 数据集位于http://www.iwr.uni-heidelberg.de/groups/comopt/software/TSPLIB95/tsp ·Zbl 0733.90047号
[23] Hansen P.,Jaumard B.:聚类分析和数学规划。数学。程序。79, 191–215 (1997) ·Zbl 0887.90182号
[24] Hansen,P.,Jaumard,B.,Meyer,C.:无约束0-1二次规划的简单枚举算法。GERAD会议G-2000-59,GERAD,2000年11月
[25] Hansen P.,MladenovićN.:J-means:最小平方和聚类的一种新的局部搜索启发式算法。模式识别。34, 405–413 (2001) ·Zbl 1012.68873号 ·doi:10.1016/S0031-3203(99)00216-2
[26] Hansen P.,MladenovićN.:可变邻域搜索:原理和应用。欧洲药典。第130、449–467号决议(2001年)·Zbl 0981.90063号 ·doi:10.1016/S0377-2217(00)00100-4
[27] Hansen P.,MladenovićN.,Pérez J.A.M.:可变邻域搜索:方法和应用。4或6319–360(2008年)·Zbl 1179.90332号 ·doi:10.1007/s10288-008-0089-1
[28] Hansen P.,Negai E.,Cheung B.K.,MladenovićN.:全球K均值分析,最小平方和聚类的增量启发式。J.Classif。22, 287–310 (2005) ·Zbl 1336.62182号 ·doi:10.1007/s00357-005-0018-3
[29] Hartigan J.A.:聚类算法。威利,纽约(1975)·Zbl 0372.62040号
[30] Heinz,G.、Peterson,L.J.、Johnson,R.W.、Kerk,C.J.:探索身体维度的关系。J.Stat.Education 11,(2003)数据集可在http://www.amstat.org/publications/jse/v11n2/datasets.heinz.html
[31] Inaba,M.,Katoh,N.,Imai,H.:加权Voronoi图和随机化在基于方差的k聚类中的应用。摘自:第十届ACM计算几何研讨会论文集,第332-339页(1994)
[32] Jain A.K.、Murty M.N.、Flynn P.J.:数据聚类:综述。ACM计算。Surv公司。31, 264–323 (1999) ·数字对象标识代码:10.1145/331499.331504
[33] Jensen R.E.:一种用于聚类分析的动态规划算法。操作。第17号决议,1034–1057(1969)·兹比尔0183.49103 ·doi:10.1287/opre.17.6.1034
[34] Kelley J.E.:求解凸规划的割平面方法。J.SIAM 8,703–712(1960)·Zbl 0098.12104号
[35] Kogan J.:大型高维数据聚类介绍。剑桥大学出版社,纽约(2006)
[36] Koontz W.L.G.、Narendra P.M.、Fukunaga K.:分支定界聚类算法。IEEE传输。计算。C-24908–915(1975年)·Zbl 0308.68039号 ·doi:10.1109/T-C.1975.224336
[37] Laszlo M.,Mukherjee S.:使用超四叉树进行低维k均值聚类的遗传算法。IEEE Trans。模式分析。机器。智力。28, 533–543 (2006) ·doi:10.1109/TPAMI.2006.66
[38] Laszlo M.,Mukherjee S.:一种用相邻中心交换k均值聚类的遗传算法。模式识别。莱特。36, 451–461 (2007)
[39] Leyffer,S.:MINLP_BB用户手册。技术报告,英国邓迪大学,1999年3月
[40] 自由L.:数学规划中的改革:定义和系统。RAIRO-RO 43(1),55–86(2009)·Zbl 1158.90390号 ·doi:10.1051/ro/2009005
[41] Likas A.、Vlassis N.、Verbeek J.J.:全局k-means聚类算法。模式识别。36, 451–461 (2003) ·doi:10.1016/S0031-3203(02)00060-2
[42] MacQueen,J.B.:多元观测分类和分析的一些方法。摘自:《第五届伯克利数理统计与概率研讨会论文集》,第2卷,第281-297页。加州伯克利(1967)·兹比尔0214.46201
[43] Mahajan M.,Nimbhorkar P.,Varadarajan K.:平面K均值问题是NP难问题。莱克特。注释计算。科学。5431, 274–285 (2009) ·Zbl 1211.68212号 ·doi:10.1007/978-3642-00202-1_24
[44] Merz P.:最小平方和聚类的迭代局部搜索。Lect。注释计算。科学。2810, 286–296 (2003) ·doi:10.1007/978-3-540-45231-7_27
[45] Mirkin B.:《数学分类和聚类》,Kluwer,Dordrecht,荷兰(1996)·Zbl 0874.90198号
[46] Mirkin B.:数据挖掘的聚类:一种数据恢复方法。查普曼和霍尔/CRC,博卡拉顿(2005)
[47] MladenovićN.,Hansen P.:可变邻域搜索。计算。操作。第24号决议,1097–1100(1997)·Zbl 0889.90119号 ·doi:10.1016/S0305-0548(97)00031-2
[48] Pacheco J.A.:最小平方和聚类问题的分散搜索方法。计算。操作。第32、1325–1335号决议(2005年)·Zbl 1075.90037号 ·doi:10.1016/j.cor.2003.11.006
[49] Pacheco J.A.,Valencia O.:最小平方和聚类问题的杂交设计。计算。统计数据分析。43, 235–248 (2003) ·Zbl 1429.65124号 ·doi:10.1016/S0167-9473(02)00224-4
[50] Padberg,M.,Rinaldi,G.:解决大规模对称旅行商问题的分支算法。SIAM第33版,60–100(1991)。数据集可用位置http://www.iwr.uni-heidelberg.de/groups/comopt/software/TSPLIB95/tsp ·Zbl 0734.90060号
[51] Pal,S.K.,Majumder,D.D.:元音和说话人识别中的模糊集和决策方法。IEEE传输。系统。人。赛博。7, 625–629 (1977). 数据集可用位置http://www.isical.ac.in/sushmita/patterns/m元音.dat ·Zbl 0358.68136号
[52] 彭杰,夏勇:k-means型聚类的新理论框架。研究模糊软计算。180, 79–96 (2005) ·兹比尔1085.68132 ·doi:10.1007/11362197_4
[53] Reinelt,G.:TSPLIB——旅行推销员图书馆。ORSA J.计算。3, 319–350 (1991). http://www.iwr.uni-heidelberg.de/groups/comopt/software/TSPLIB95 ·Zbl 0775.90293号
[54] Ruspini E.H.:模糊聚类的数值方法。信息科学。2, 319–350 (1970) ·Zbl 0205.21301号 ·doi:10.1016/S0020-0255(70)80056-1
[55] Ryan D.M.,Foster B.A.:调度的整数规划方法。摘自:Wren,A.(编辑)《公共交通城市客运车辆的计算机调度和乘务员调度》,第269-280页。北荷兰,阿姆斯特丹(1981年)
[56] Sherali H.D.,Adams W.P.:离散优化问题的重整线性化技术。摘自:Du,D.Z.,Pardalos,P.M.(编辑)《组合优化手册》1,第479-532页。多德雷赫特·克鲁沃(1999)·Zbl 0934.90056号
[57] Sherali H.D.,Desai J.:一种基于RLT的全局优化方法,用于解决硬聚类问题。J.全球。最佳方案。32, 281–306 (2005) ·Zbl 1123.62045号 ·doi:10.1007/s10898-004-2706-7
[58] Späth H.:用于数据简化和对象分类的聚类分析算法。威利,纽约(1980)·Zbl 0435.62059号
[59] Steinhaus H.:党军物资师。《波兰科学通报》第三类第四期,801-804页(1956年)·Zbl 0079.16403号
[60] 斯坦利·D·:K意味着集群:半个世纪的综合。英国数学杂志。《统计心理学》。59, 1–34 (2006) ·doi:10.1348/000711005X48266
[61] Taillard等人。D.:用于大型质心聚类问题的启发式方法。《启发式杂志》9,51–73(2003)·Zbl 1035.90038号 ·doi:10.1023/A:1021841728075
[62] Teboulle M.:基于中心的聚类方法的统一连续优化框架。J.马赫。学习。第8号决议,65–102(2007年)·Zbl 1222.68318号
[63] 星期二H:线性约束下的凹面编程。苏联数学。1437-1440年(1964年)·Zbl 0132.40103号
[64] van Os B.J.、Meulman J.J.:改进分区的动态编程策略。J.分类。21, 207–230 (2004) ·Zbl 1331.90093号 ·doi:10.1007/s00357-004-0017-9
[65] Vavasis S.A.:非线性优化:复杂性问题。牛津大学出版社,牛津(1991)·Zbl 0785.90091号
[66] Xavier,A.E.,Negreiros,M.J.,Maculan,N.,Michelon,P.:使用双曲线平滑聚类法规划卫生制剂在防治登革热中的任务。在:IFORS会议记录2005(2005)
[67] Xia,Y.,Peng,J.:最小平方和误差聚类的切割算法。摘自:SIAM国际数据挖掘会议论文集(2005)
[68] Yeh,I.-C.:使用人工神经网络对高性能混凝土的强度进行建模。《水泥与混凝土研究》第28号,1797-1808(1998年)。数据集可用位置http://archive.ics.uci.edu/ml/datasets/Concrete网站+抗压+强度
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。