×

通过模拟退火实现基于示例的聚类。 (英语) Zbl 1272.62112号

摘要:几位作者吹捧(p)-中值模型是一种似是而非的替代聚类内平方和(即(K)-均值)划分的方法。中位数模型的优点包括提供作为聚类中心的“样本”、对异常值的稳健性以及适应不同范围的相似性数据。我们为p中值问题开发了一种新的模拟退火启发式算法,并对其计算性能进行了彻底的研究。我们实验的显著发现是,我们的新方法大大优于以前的模拟退火实现,并且与最有效的中位数问题元启发式算法相竞争。

MSC公司:

第62页,共15页 统计学在心理学中的应用
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Aarts,E.和Korst,J.(1989)。模拟退火和Boltzmann机器:组合优化和神经计算的随机方法。纽约:Wiley·Zbl 0674.90059号
[2] Alba,E.和Dominguez,E.(2006年)。p-median问题的现代优化工具的比较分析。统计与计算,16251–260·doi:10.1007/s11222-006-8079-7
[3] Alp,O.、Erkut,E.和Drezner,Z.(2003)。求解p-中值问题的高效遗传算法。运筹学年鉴,122,21–42·兹比尔1038.90046 ·doi:10.1023/A:1026130003508
[4] Avella,P.、Sassano,A.和Vasil'ev,I.(2007)。大规模p-中值问题的计算研究。数学规划A,109,89–114·Zbl 1275.90112号 ·doi:10.1007/s10107-005-0700-6
[5] Beasley,J.E.(1990)。OR-Library:通过电子邮件分发测试问题。运筹学学会杂志,411069–1072。
[6] Beltran,C.、Tadonki,C.和Vial,J.(2006)。用半拉格朗日松弛法求解p-中值问题。计算优化与应用,2006年6月5日,doi:10.1007/s10589-006-6513-6·Zbl 1151.90521号
[7] Brusco,M.J.、Cradit,J.D.和Tashchian,A.(2003年)。联合细分设置的多准则聚类回归:客户价值应用。《营销研究杂志》,40225-234·doi:10.1509/jmkr.40.2.225.19227
[8] Brusco,M.J.和Köhn,H.-F.(2008a)。评论“通过在数据点之间传递消息进行聚类”。《科学》,319726·doi:10.1126/科学.1150938
[9] Brusco,M.J.和Köhn,H.-F.(2008b)。基于p-median模型的数据集最优分割。《心理测量学》,73、89–105·Zbl 1143.62035号 ·doi:10.1007/s11336-007-9021-4
[10] Brusco,M.J.、Köhn,H.-F.和Stahl,S.(2008)。组合数据分析中矩阵置换问题的动态规划的启发式实现。《心理测量学》,73503–522·Zbl 1301.62118号 ·doi:10.1007/s11336-007-9049-5
[11] Brusco,M.J.和Steinley,D.(2007年)。对最小簇内平方和划分的启发式程序进行比较。《心理测量学》,72,583–600·Zbl 1291.62196号 ·文件编号:10.1007/s11336-007-9013-4
[12] Ceulemans,E.和Van Mechelen,I.(2008)。CLASSI:研究顺序过程及其个体差异的分类模型。Psycholometrika,第73107–124页·Zbl 1143.62092号 ·doi:10.1007/s11336-007-9024-1
[13] Ceulemans,E.、Van Mechelen,I.和Leenen,I.(2007年)。分层类分析中的局部极小问题:模拟退火算法和各种多段程序的评估。Psycholometrika,72377–391岁·Zbl 1286.62102号 ·doi:10.1007/s11336-007-9000-9
[14] Chiyoshi,F.和Galváo,R.D.(2000年)。应用于p-中值问题的模拟退火的统计分析。《运筹学年鉴》,96,61–74·Zbl 0997.90042号 ·doi:10.1023/A:1018982914742
[15] Christofides,N.和Beasley,J.E.(1982年)。p-median问题的树搜索算法。《欧洲运筹学杂志》,第10期,196-204页·Zbl 0481.90020号 ·doi:10.1016/0377-2217(82)90160-6
[16] Cornuejols,G.、Fisher,M.L.和Nemhauser,G.L.(1977年)。优化浮动的银行账户位置:精确和近似算法的分析研究。管理科学,23789–810·Zbl 0361.90034号 ·doi:10.1287/mnsc.23.8989
[17] Du Merle,O.,&Vial,J.-P.(2002)。Proximal-ACCPM,一种用于柱生成和拉格朗日松弛的切面方法:应用于p中值问题(技术报告2002.23)。日内瓦大学HEC Genève。
[18] 福吉·E.W.(1965)。多元数据的聚类分析:分类的效率与可解释性。生物统计学,21768。
[19] Frey,B.和Dueck,D.(2007年)。通过在数据点之间传递消息进行聚类。科学,315972-976·Zbl 1226.94027号 ·doi:10.1126/science.1136800
[20] Frey,B.和Dueck,D.(2008年)。回应关于“通过在数据点之间传递消息进行聚类”的评论。《科学》,319726·doi:10.1126/科学.1151268
[21] Galvão,R.D.(1980年)。p-中值问题的对偶算法。运营研究,281112-1121·Zbl 0451.90040号 ·doi:10.1287/opre.28.5.112
[22] Hanjoul,P.和Peeters,D.(1985年)。比较两种基于对偶的方法来解决p-中值问题。欧洲运筹学杂志,20387–396·Zbl 0565.90011号 ·doi:10.1016/0377-2217(85)90012-8
[23] Hansen,P.和Mladenović,N.(1997年)。p-median的可变邻域搜索。位置科学,5207–226·Zbl 0928.90043号 ·doi:10.1016/S0966-8349(98)00030-8
[24] Hansen,P.和Mladenović,N.(2008年)。对p-median问题的启发式比较分析的补充。统计与计算,18,41–46·doi:10.1007/s11222-007-9036-9
[25] Hansen,P.、Mladenović,N.和Perez-Brito,D.(2001年)。可变邻域分解搜索。启发式杂志,7335–350·Zbl 1041.68623号 ·doi:10.1023/A:1011336210885
[26] Hartigan,J.A.和Wong,M.A.(1979年)。算法AS136:k-means聚类程序。应用统计学,28100-128·Zbl 0447.62062号 ·doi:10.2307/2346830
[27] R.N.霍华德(1966)。将一个群体划分为同类群体。J.R.Lawrence(编辑),《运筹学与社会科学》(第585-594页)。伦敦:塔维斯托克。
[28] Hubert,L.和Arabie,P.(1985)。比较分区。分类杂志,2193-218·Zbl 0587.62128号 ·doi:10.1007/BF01908075
[29] Kaufman,L.和Rousseeuw,P.J.(1990年)。在数据中寻找群体:聚类分析简介。纽约:Wiley·Zbl 1345.62009号
[30] Kirkpatrick,S.、Gelatt,C.D.和Vecchi,M.P.(1983年)。通过模拟退火进行优化。科学,220671–680·Zbl 1225.90162号 ·doi:10.1126/science.220.4598.671
[31] Klastorin,T.(1985)。聚类分析的p-中值问题:使用混合模型方法的比较测试。管理科学,31,84–95·Zbl 0612.62086号 ·doi:10.1287个/mnsc.31.1.84
[32] Kuehn,A.A.和Hamburger,M.J.(1963年)。定位仓库的启发式程序。管理科学,9643–666·doi:10.1287/mnsc.94.643
[33] Levanova,T.和Loresh,M.A.(2004年)。p-median问题的蚂蚁系统和模拟退火算法。自动化和远程控制,65、431–438·Zbl 1075.90052号 ·doi:10.1023/B:AURC.0000019375.23201.c1
[34] Lin,S.和Kernighan,B.W.(1973年)。一种求解旅行商问题的有效启发式算法。运营研究,21498–516·Zbl 0256.90038号 ·doi:10.1287/opre.21.2498
[35] MacQueen,J.B.(1967年)。多元观测值分类和分析的一些方法。L.M.Le Cam和J.Neyman(编辑),第五届伯克利数理统计与概率研讨会论文集(第1卷,第281-297页)。伯克利:加利福尼亚大学出版社·Zbl 0214.46201号
[36] Maranzana,F.E.(1964年)。关于供应点的位置,以最小化运输成本。运筹学季刊,15261-270·doi:10.1057/jors.1964.47
[37] Mladenović,N.、Brimberg,J.、Hansen,P.和Moreno-Pérez,J.A.(2007年)。p-median问题:元启发式方法综述。《欧洲运筹学杂志》,179927-939·Zbl 1163.90610号 ·doi:10.1016/j.ejor.2005.05.034
[38] Moreno-Pérez,J.A.、GarcíA-Roda,J.L.和Moreno-Vega,J.M.(1994)。离散p-中值问题的并行遗传算法。位置分析研究,7131-141·Zbl 0891.90097号
[39] Mulvey,J.M.和Crowder,H.P.(1979年)。聚类分析:拉格朗日松弛的一种应用。管理科学,25329-340·Zbl 0415.90085号 ·doi:10.1287/mnsc.25.4.329
[40] Murillo,A.、Vera,J.-F.和Heiser,W.J.(2005)。一种用于L1和L2一维缩放的置换平移模拟退火算法。分类杂志,22,119–138·Zbl 1084.62055号 ·doi:10.1007/s00357-005-0008-5
[41] Murray,A.T.和Church,R.L.(1996年)。将模拟退火应用于位置规划模型。启发式杂志,2,31–53·doi:10.1007/BF00226292
[42] Narula,S.C.、Ogbu,U.I.和Samuelsson,H.M.(1977年)。p-中值问题的一种算法。运营研究,25709–713·Zbl 0372.90096号 ·doi:10.1287/opre.25.4.709
[43] Rao,M.R.(1971)。聚类分析和数学规划。美国统计协会杂志,66622-626·Zbl 0238.90042号 ·doi:10.2307/2283542
[44] Reinelt,G.(2001)。TSPLIB公司。http://www.iwr.uni-heidelberg.de/groups/comopt/software/TSPLIB95 .
[45] Resende,M.G.C.和Werneck,R.F.(2003年)。关于p-median问题基于swap的局部搜索程序的实现。R.E.Ladner(Ed.),《第五届算法工程与实验研讨会论文集》(第119-127页)。费城:SIAM。
[46] Resende,M.G.C.和Werneck,R.F.(2004)。p-median问题的混合启发式算法。启发式杂志,10,59-88·Zbl 1069.68600号 ·doi:10.1023/B:HEUR.0000019986.96257.50
[47] ReVelle,C.S.和Swain,R.(1970年)。中央设施位置。地理分析,2,30–42·文件编号:10.1111/j.1538-4632.1970.tb00142.x
[48] Rolland,E.、Schilling,D.A.和Current,J.R.(1996年)。p-median问题的高效禁忌搜索过程。《欧洲运筹学杂志》,96,329–342·Zbl 0924.90102号 ·doi:10.1016/S0377-2217(96)00141-5
[49] Rosing,K.E.(1997年)。顶点替换启发式有效性的实证研究。环境与规划B,24,59–67·doi:10.1068/b240059
[50] Rosing,K.E.和ReVelle,C.S.(1997)。启发式集中:两阶段解决方案构建。欧洲运筹学杂志,97,75–86·Zbl 0923.90107号 ·doi:10.1016/S0377-2217(96)00100-2
[51] Rosing,K.E.、ReVelle,C.S.、Rolland,E.、Schilling,D.A.和Current,J.R.(1998年)。启发式集中和禁忌搜索:一个面对面的比较。欧洲运筹学杂志,104,93–99·Zbl 0955.90056号 ·doi:10.1016/S0377-2217(97)00310-X
[52] Steinhaus,H.(1956年)。党军物资供应司。《科学通报》,第三类数学、天文学、物理学、奇米、遗传学和地理,IV(12),801-804。
[53] Steinley,D.(2004)。Hubert-Arabie调整的兰德指数的性质。心理学方法,9386–396·doi:10.1037/1082-989X.9.3.386
[54] Steinley,D.(2006)。K-表示聚类:半个世纪的综合。英国数学与统计心理学杂志,59,1-34·doi:10.1348/000711005X48266
[55] Taillard,E.D.(2003年)。大型质心聚类问题的启发式方法。启发式杂志,9,51-74·Zbl 1035.90038号 ·doi:10.1023/A:1021841728075
[56] Teitz,M.B.和Bart,P.(1968年)。估计加权图广义顶点中值的启发式方法。运筹学,16955–961·兹伯利0165.22804 ·doi:10.1287/opre.16.5.955
[57] 桑代克·R.L.(1953)。谁属于这个家庭?《心理测量学》,第18、267–276页·doi:10.1007/BF0228963文件
[58] van Laarhoven,P.J.M.和Aarts,E.H.L.(1987)。模拟退火:理论与应用。多德雷赫特:克鲁沃·兹伯利0643.65028
[59] Vera,J.-F.、Heiser,W.J.和Murillo,A.(2007年)。任何Minkowski度量的全局优化:多维缩放的置换转换模拟退火算法。分类杂志,24,277–301·Zbl 1159.91469号 ·doi:10.1007/s00357-007-0020-1
[60] Vinod,H.(1969年)。整数规划和分组理论。美国统计协会杂志,64,506–517·Zbl 0272.90050号 ·doi:10.2307/2283635
[61] Whitaker,R.(1983年)。大规模聚类和中间位置问题贪婪交换的快速算法。INFOR,21,95–108·Zbl 0527.90017号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。