×

亲和力传播和无容量设施位置问题。 (英语) Zbl 1331.90036号

总结:在聚类研究中必须做出的最重要的区别之一是模型(或问题)和解决这些问题的方法之间的差异。这一点在评估流行的亲和力传播算法时最为明显(apcluster。)这是一种神经聚类方法的MATLAB实现,在生物科学和其他学科中受到了极大的关注。几位作者对apcluster。使用为属于无容量设施位置问题(UFLP)类的模型设计的方法。这些比较模型包括(p)中心(或(K)中心)模型,更重要的是,(p)中位数(或(K)中位数)模型。尽管相似,但优化模型背后的事实使研究结果相互矛盾并蒙上了阴影apcluster。与(p)-中值模型略有不同,与(p-)-中心模型有明显不同。在本文中,我们澄清了apcluster。实际上,它是UFLP类中另一个模型的“最大化版本”的启发式算法,称为简单工厂选址问题(SPLP)。描述了SPLP的精确方法apcluster。将该程序与快速启发式程序进行比较(萨斯普普。)在模拟实验和文献中的大量数据集中。尽管当计算可行时,精确方法是首选方法,但两者apcluster。萨斯普普。是高效且有效的启发式方法,在大多数情况下,后者略优于前者。

MSC公司:

90B80型 离散位置和分配
62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] AGMON,S.(1954),“线性不等式的松弛方法”,加拿大数学杂志,6382-392·Zbl 0055.35001号
[2] ALBA,E.和DOMINGUEZ,E.(2006),“p-median问题现代优化工具的比较分析”,统计与计算,16,251-260·doi:10.1007/s11222-006-8079-7
[3] ALP,O.、ERKUT,E.和DREZNER,Z(2003),“p-Median问题的高效遗传算法”,运筹学年鉴,122,21-42·Zbl 1038.90046号 ·doi:10.1023/A:1026130003508
[4] 安德森·E.(1935年),“加塞半岛的虹膜”,《美国虹膜学会公报》,第59、2-5页·Zbl 1336.62191号
[5] APELTSIN,L.、MORRIS,J.H.、BABBITT,P.C.和FERRIN,T.E.(2011),“使用网络边缘权重分布改进蛋白质相似性网络聚类算法的质量”,生物信息学,27,326-333·doi:10.1093/bioinformatics/btq655
[6] AVELLA,P.、SASSANO,A.和VASIL’EV,I.(2007),“大尺度P-中值问题的计算研究”,数学规划A,109,89-114·Zbl 1275.90112号
[7] BALINSKI,M.L.(1965),“整数规划:方法、用途、计算”,《管理科学》,第12期,第253-313页·Zbl 0129.12004号 ·doi:10.1287/mnsc.123.253
[8] BELTRAN,C.、TADONKI,C.和VIAL,J.(2006),“用半图形松弛法求解p-Median问题”,计算优化与应用,35(2),239-260·Zbl 1151.90521号 ·doi:10.1007/s10589-006-6513-6
[9] BERROU,C.、GLAVIEUX,A.和THITIMAJSHIMA,P.(1993),“近香农极限纠错编码和解码:Turbo码(1)”,《IEEE国际通信会议论文集》,ICC 93,第2卷,第1064-1070页·Zbl 1143.62327号
[10] BILDE,O.和KRARUP,J.(1977),“简单植物定位问题的尖锐下限和有效算法”,《离散数学年鉴》,179-88·兹比尔0364.90068 ·doi:10.1016/S0167-5060(08)70728-3
[11] BLANCHARD,S.J.、ALOISE,D.和DESARBO,W.S.(2012),“基于分类的聚类的异构pmedian问题”,《心理测量学》,77,741-762·Zbl 1284.62686号 ·doi:10.1007/s11336-012-9283-3
[12] BRUSCO,M.J.和CRADIT,J.D.(2001),“K-means聚类的变量选择启发式”,《心理测量学》,66,249-270·Zbl 1293.62237号 ·doi:10.1007/BF02294838
[13] BRUSCO,M.J.,和KğHN,H.F.(2008a),“评论‘通过在数据点之间传递消息进行聚类’”,《科学》,319726c。
[14] BRUSCO,M.J.,和KğHN,H.-F.(2008b),“基于p-median模型的数据集最优分割”,《心理测量学》,73,89-105·Zbl 1143.62035号 ·doi:10.1007/s11336-007-9021-4
[15] BRUSCO,M.J.,和KğHN,H.-F.(2009),“通过模拟退火实现基于范例的聚类”,《心理测量学》,第74期,第457-475页·Zbl 1272.62112号 ·doi:10.1007/s11336-009-9115-2
[16] BRUSCO,M.J.和STEINEY,D.(2007),“最小平方和划分的启发式程序比较”,《心理测量学》,72,583-600·Zbl 1291.62196号 ·文件编号:10.1007/s11336-007-9013-4
[17] CHANG,J.T.(2012),“从基因表达数据库推导转录程序和功能过程”,生物信息学,28,1122-1129·doi:10.1093/bioinformatics/bts112
[18] CHEN,L.,CHAN,T.-H.,CHOYKE,P.L.,HILLMAN,E.M.C.,CHI,C.-Y.,BHUJWALLA,Z.M.,WANG,G.,WANG-S.S.,SZABO,Z.,and WANG,Y.(2011),“CAM-CM:复杂组织活体动态对比增强成像的信号反褶积工具”,生物信息学,27,2607-2609。
[19] CHIYOSHI,F.和GALVÃO,R.D.(2000),“模拟退火应用于p中值问题的统计分析”,运筹学年鉴,96,61-74·Zbl 0997.90042号 ·doi:10.1023/A:1018982914742
[20] CHRISTOFIDES,N.和BEASLEY,J.(1982),“pmedian问题的树搜索算法”,《欧洲运筹学杂志》,第10期,196-204页·Zbl 0481.90020号 ·doi:10.1016/0377-2217(82)90160-6
[21] CORNUEJOLS,G.、FISHER,M.L.和NEMHAUSER,G.L.(1977),“优化浮动的银行账户位置:精确和近似算法的分析研究”,《管理科学》,23,789-810·Zbl 0361.90034号 ·doi:10.1287/mnsc.23.8989
[22] DUECK,D.(2009),“亲和力传播:通过传递消息聚类数据”,多伦多大学电气与计算机工程研究生部未发表的博士论文·Zbl 0415.90085号
[23] EFROYMSON,M.A.和RAY,T.L.(1966),“工厂选址的分枝定界算法”,运筹学,第14期,第361-375页·doi:10.1287/opre.14.361
[24] EL-SHAIEB,A.M.(1973),“一种在目的地之间定位源的新算法”,《管理科学》,第20期,第221-231页·Zbl 0304.90121号
[25] ERLENKOTTER,D.(1978),“无容量设施选址的双重程序”,运筹学,26992-1009·Zbl 0422.90053号
[26] FISHER,R.A.(1936),“多重测量在分类学问题中的应用”,《优生学年鉴》,7199-188·文件编号:10.1111/j.1469-1809.1936.tb02137.x
[27] FREY,B.和DUECK,D.(2007),“通过在数据点之间传递消息进行聚类”,《科学》,315972-976·Zbl 1226.94027号 ·doi:10.1212/科学1136800
[28] FREY,B.和DUECK,D.(2008),“对‘通过在数据点之间传递消息进行聚类’的评论的回应”,《科学》,319726d·Zbl 1226.94027号
[29] GALVÃO,R.D.(1980),“p-median问题的双边界算法”,运筹学,281112-1121·Zbl 0451.90040号 ·doi:10.1287/opre.28.5.112
[30] GALVÃO,R.D.(2004),“无容量设施位置问题:贡献”,Pesquisa Operacional,24,7-38·doi:10.1590/S0101-7438204000100003
[31] GALVÃO,R.D.和RAGGI,L.A.(1989),“求解最优无容量位置问题的方法”,《运筹学年鉴》,第18卷,第225-244页·Zbl 0707.90060号 ·doi:10.1007/BF02097805
[32] GRØTSCHEL,M.和HOLLAND,O.(1991),“大型对称旅行推销员问题的求解”,《数学规划》,第51期,第141-202页·Zbl 0733.90047号 ·doi:10.1007/BF01586932
[33] HAIR,J.F.、ANDERSON,R.E.、TATHAM,R.L.和BLACK,W.C.(1998),多元数据分析(第5版),新泽西州上鞍河:普伦蒂斯·霍尔·Zbl 0165.22804号
[34] HAKIMI,S.L.(1964),“交换中心的最佳位置以及图的绝对中心和中位数”,运筹学,第12450-459页·Zbl 0123.00305号 ·doi:10.1287/opre.123.450
[35] HAKIMI,S.L.(1965),“通信网络中交换中心的最优分布及相关图论问题”,运筹学,123,462-475·Zbl 0135.20501号 ·doi:10.1287/opre.13.3462
[36] HANJOUL,P.和PEETERS,D.(1985),“两种基于对偶的程序解决P-Median问题的比较”,《欧洲运筹学杂志》,第20期,第387-396页·Zbl 0565.90011号 ·doi:10.1016/0377-2217(85)90012-8
[37] HANSEN,P.和JAUMARD,B.(1997),“聚类分析和数学规划”,《数学规划》,第79期,第191-215页·Zbl 0887.90182号
[38] HANSEN,P.和MLADENOVI ch,N.(1997),“P-Median变量邻域搜索”,《位置科学》,5207-226·兹比尔0928.90043 ·doi:10.1016/S0966-8349(98)00030-8
[39] HANSEN,P.和MLADENOVI-cch,N.(2008),“对P-Median问题启发式比较分析的补充”,《统计与计算》,第18期,第41-46页·doi:10.1007/s11222-007-9036-9
[40] HANSEN,P.、MLADENOVI ch,N.和PEREZ-BRITO,D.(2001),“可变邻域分解搜索”,启发式杂志,7335-350·Zbl 1041.68623号 ·doi:10.1023/A:1011336210885
[41] HELD,M.和KARP,R.M.(1970),“旅行推销员问题和最小生成树”,《运筹学》,第18期,第1138-1162页·Zbl 0226.90047号 ·数字对象标识代码:10.1287/opre.18.6.1138
[42] HELD,M.、WOLFE,P.和CROWDER,H.P.(1974),“次梯度优化的验证”,数学规划,第6期,第62-88页·Zbl 0284.90057号 ·doi:10.1007/BF01580223
[43] HEINZ,G.、PETERSON,L.J.、JOHNSON,R.W.和KERK,C.J.(2003),“探索身体维度中的关系”,《统计教育杂志》,11,www.amstat.org/publications/jse/v11n2/datasets.HEINZ.html·Zbl 0135.20501号
[44] HUBERT,L.和ARABIE,P.(1985年),“比较分区”,分类杂志,2193-218·doi:10.1007/BF01908075
[45] JARVINEN,P.、RAJALA,J.和SINERVO,H.(1972),“寻求P-中值的分枝定界算法”,运筹学,2073-178·兹比尔0232.90035 ·doi:10.1287/opre.20.1173
[46] KARALETSOS,T.、STEGLE,O.、DREYER,D.、WINN,J.和BORGWARDT,K.M.(2012),“ShapePheno:从生物图像收集中无监督提取形状表型”,生物信息学,281001-1008·doi:10.1093/bioinformatics/bts081
[47] KAUFMAN,L.和ROUSSEEUW,P.J.(2005),《在数据中发现群体:聚类分析导论》(第二版),纽约:Wiley·Zbl 1345.62009号
[48] KIDDLE,S.J.、WINDRAM,O.P.F.、MCHATTIE,S.、MEAD,A.、BEYNON,J.、BUCHANAN-WOLLASTON,V.、DENBY,K.J.和MUKHERJEE,S.(2010),“亲和繁殖的时间聚类揭示了拟南芥Thaliana中的转录模块”,生物信息学,26,355-362·doi:10.1093/bioinformatics/btp673
[49] KLASTORIN,T.(1985),“聚类分析的p-median问题:使用混合模型方法的比较检验”,《管理科学》,31,84-95·Zbl 0612.62086号
[50] KHN,H.-F.,STEINEY,D.和BRUSCO,M.J.(2010),“作为心理数据聚类工具的p-median模型”,《心理学方法》,第15期,第87-95页·doi:10.1037/a0018535
[51] KUEHN,A.A.和HAMBURGER,M.J.(1963),“仓库选址启发式程序”,《管理科学》,第9期,第643-666页·doi:10.1287/mnsc.94.643
[52] LEVANOVA,T.和LORESH,M.A.(2004年),“p-median问题的蚂蚁系统算法和模拟退火”,自动化和远程控制,65,431-438·Zbl 1075.90052号 ·doi:10.1023/B:AURC.0000019375.23201.c1
[53] LIN,S.和KERNIGHAN,B.W.(1973),“旅行推销员问题的有效启发式算法”,运筹学,21498-516·Zbl 0256.90038号 ·doi:10.1287/opre.21.2498
[54] MARANZANA,F.E.(1964),“关于供应点位置以最小化运输成本”,《运筹学》,第12期,第138-139页。
[55] MATHWORKS,INC.(2006),《使用MATLAB(第7版)》,Natick MA:The MATHWORKS,INC·Zbl 0887.90182号
[56] MéZARD,M.、PARISI,G.和ZECCHINA,R.(2002),“随机可满足性问题的分析和算法解”,《科学》,297812-815·doi:10.1126/science.1073287
[57] MILLIGAN,G.W.(1980),“六种错误扰动对十五种聚类算法的影响的检验”,《心理测量学》,45,325-342·doi:10.1007/BF02293907
[58] MILLIGAN,G.W.(1996),“聚类验证:应用分析的结果和影响”,摘自《聚类与分类》,P.Arabie,L.J.Hubert和G.De Soete主编,新泽西州河边:世界科学出版社,第321-375页·Zbl 0895.62069号
[59] MILLIGAN,G.W.和COOPER,M.C.(1985),“确定数据集中簇数的程序检查”,《心理学》,第50期,第159-179页·doi:10.1007/BF02294245
[60] MILLIGAN,G.W.和COOPER,M.C.(1988),“聚类分析中变量标准化的研究”,分类杂志,5181-204·doi:10.1007/BF01897163
[61] MLADENOVIĈ,N.、BRIMBERG,J.、HANSEN,P.和MORENO-PéREZ,J.A.(2007),“P-Median问题:元启发式方法的调查”,《欧洲运筹学杂志》,179927-939·Zbl 1163.90610号 ·doi:10.1016/j.ejor.2005.05.034
[62] MOTZKIN,T.和SCHOENBERG,I.J.(1954),“线性不等式的松弛方法”,加拿大数学杂志,6393-404·兹比尔0055.35002 ·doi:10.4153/CJM-1954-038-x
[63] MUKHERJEE,S.和HILL,S.M.(2011),“网络聚类:通过稀疏图形模型探测生物异质性”,生物信息学,27994-1000·doi:10.1093/生物信息系统/btr070
[64] MULVEY,J.M.和CROWDER,H.P.(1979),“聚类分析:拉格朗日松弛的应用”,《管理科学》,25229-340·Zbl 0415.90085号 ·doi:10.1287/mnsc.25.4.329
[65] NARULA,S.C.、OGBU,U.I.和SAMUELSON,H.M.(1977),“pmedian问题的算法”,运筹学,25,709-713·Zbl 0372.90096号 ·doi:10.1287/opre.25.4.709
[66] RAO,M.R.(1971),“聚类分析和数学规划”,《美国统计协会杂志》,第66期,第622-626页·Zbl 0238.90042号
[67] REINELT,G.(2001),TSPLIB,http://www.iwr.uni-heidelberg.de/groups/comopt/software/TSPLIB95。 ·Zbl 0775.90293号
[68] RESENDE,M.G.C.和WERNECK,R.F.(2004),“针对p-median问题的混合启发式”,启发式杂志,10,59-88·兹比尔1069.68600 ·doi:10.1023/B:HEUR.0000019986.96257.50
[69] REVELLE,C.S.和SWAIN,R.(1970年),“中央设施位置”,地理分析,2,30-42·文件编号:10.1111/j.1538-4632.1970.tb00142.x
[70] ROLLAND,E.、SCHILLING,D.A.和CURRENT,J.R.(1996),“p-中值问题的有效禁忌搜索程序”,《欧洲运筹学杂志》,96,329-342·Zbl 0924.90102号 ·doi:10.1016/S0377-2217(96)00141-5
[71] SPáTH,H.(1980),《数据简化和对象分类的聚类分析算法》,纽约:威利出版社·Zbl 0435.62059号
[72] SPELLMAN,P.T.、SHERLOK,G.、ZHANG,M.Q.、IYER,V.R.、ANDERS,K.、EISEN,M.B.、BROWN,P.O.、BOTSTEIN,D.和FUTCHER,B.(1998年),“通过微阵列杂交综合鉴定酿酒酵母的细胞周期调控基因”,《细胞分子生物学》,9,3273-3297·doi:10.1091/mbc.9.12.3273
[73] STEINEY,D.(2003),“K-means Clustering:What You Don't Know May Hurt You”,《心理学方法》,第8294-304页·Zbl 1291.62196号
[74] STEINEY,D.(2004),“Hubert-Arabie调整兰德指数的性质”,《心理学方法》,9386-396。
[75] STEINEY,D.(2006),“K-means聚类:发展诊断技术中的局部优化分析”,《心理学方法》,第11期,第178-192页·Zbl 1038.90046号
[76] STEINEY,D.和BRUSCO,M.J.(2007),“初始化K-means批量聚类:几种技术的关键分析”,《分类杂志》,24,99-121·Zbl 1144.62331号 ·doi:10.1007/s00357-007-0003-0
[77] STEINEY,D.和BRUSCO,M.J.(2008a),“K-means聚类分析的新变量加权和选择程序”,多变量行为研究,43,77-108·doi:10.1080/00273170701836695
[78] STEINEY,D.和BRUSCO,M.J.(2008b),“聚类分析中变量的选择:八种程序的实证比较”,《心理测量学》,73,125-144·Zbl 1143.62327号 ·doi:10.1007/s11336-007-9019-y
[79] STEINEY,D.和BRUSCO,M.J.(2011a),“在Kmeans聚类中选择聚类数”,《心理学方法》,第16期,第285-297页·doi:10.1037/a0023346
[80] STEINEY,D.和BRUSCO,M.J.(2011年b),“聚类的混合模型评估:建议和注意事项”,《心理学方法》,第16、63-79页·doi:10.1037/a0022673
[81] STEINEY,D.和HENSON,R.(2005),“生成已知重叠簇的分析方法”,《分类杂志》,22,221-250·兹比尔1336.62191 ·doi:10.1007/s00357-005-0015-6
[82] TANG,D.、ZHU,Q.和YANG,F.(2010),“SAGE数据的基于泊松的自适应亲和传播聚类”,计算生物学和化学,34,63-70·兹比尔1403.92084 ·doi:10.1016/j.com.pbiolchem.2009.11.001
[83] TEITZ,M.B.和BART,P.(1968),“估算加权图广义顶点中值的启发式方法”,运筹学,16955-961·Zbl 0165.22804号 ·doi:10.1287/opre.16.5.955
[84] THIZY,J.-M.、VAN WASSENHOVE,L.和KHUMAWALA,B.(1985),“解决无容量工厂选址问题的精确和近似方法的比较”,《运营管理杂志》,第6期,第23-34页·doi:10.1016/0272-6963(85)90032-4
[85] VINOD,H.(1969),“整数规划和分组理论”,《美国统计协会杂志》,64,506-517·Zbl 0272.90050号
[86] VLASBLOM,J.和WODAK,S.J.(2009),“蛋白质相互作用图分区的马尔可夫聚类与亲和力传播”,BMC生物信息学,10,99。
[87] WHITAKER,R.(1983),“大规模聚类和中值位置问题贪婪交换的快速算法”,INFOR,21,95-108·Zbl 0527.90017号
[88] WOŹNIAK,M.、TIURYN,J.和DUTKOWSKI,J.(2010),“MODEVO:探索蛋白质相互作用网络的模块性和进化”,生物信息学,261790-1791·doi:10.1093/bioinformatics/btq274
[89] ZHANG,J.,LI,D.,CHEN,H.和FANG,F.(2011),“利用亲和力传播聚类分析fMRI数据中的活性”,生物力学和生物医学工程中的计算机方法,14,271-281·Zbl 0364.90068号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。