×

一种基于采样的精确算法,用于解决最小最大直径聚类问题。 (英语) Zbl 1402.90207号

摘要:我们考虑对一组点进行聚类的问题,以最小化最大簇内相异性,即强NP-hard。这个问题的精确算法可以处理包含数千个观测值的数据集,这在很大程度上不足以满足当今的需要。这个问题最流行的启发式算法是完全链接层次算法,它提供的可行解决方案通常远不是最优的。我们介绍了一种基于采样的精确算法,用于求解大型数据集。该算法在小样本点上的精确过程的解和启发式过程的解之间交替进行,以证明当前解的最优性。我们的计算经验表明,我们的算法能够在适当的时间限制内解决包含500000多个观测值的优化问题,这比以前的精确方法的限制大两个数量级。

MSC公司:

90立方厘米 数学规划中的极小极大问题
90C06型 数学规划中的大尺度问题
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Alcock,R.,Manolopoulos,Y.:采用基于特征的方法的时间序列相似性查询。摘自:第七届希腊信息学会议,希腊约阿尼纳,第27-29页(1999年)·Zbl 1414.91086号
[2] CJ阿尔伯特;Kahng,AB,将排序拆分为分区以最小化直径,J.Classif。,14, 51-74, (1997) ·Zbl 0897.92042号 ·数字对象标识代码:10.1007/s003579900003
[3] Anderberg,M.R.:应用的聚类分析/Michael R.Anderberg.学术出版社,纽约(1973)·Zbl 0299.62029号
[4] Blackard,J.A.:神经网络和判别分析在预测森林覆盖类型中的比较。科罗拉多州立大学博士论文(1998年)
[5] Bradley,P.S.,Fayyad,U.M.,Reina,C.:将集群算法扩展到大型数据库。收录于:KDD’98第四届知识发现和数据挖掘国际会议记录,第9-15页(1998)
[6] Brusco,M.J.,Stahl,S.:组合数据分析中的分枝定界应用。施普林格,纽约(2006)·Zbl 1093.62006年
[7] 道,TBH;Duong,KC;Vrain,C,通过约束编程的约束聚类,人工制品。智力。,244, 70-94, (2017) ·Zbl 1404.68141号 ·doi:10.1016/j.artint.2015.05.006
[8] Defays,D,一个完整链接方法的有效算法,Compute。J.,20,364-366,(1977)·兹伯利0364.68038 ·doi:10.1093/comjnl/20.4.364
[9] 特拉特,M;Hansen,P,双标准聚类分析,IEEE Trans。模式分析。马赫。智力。,4, 277-291, (1980) ·Zbl 0458.62049号 ·doi:10.1109/TPAMI.1980.4767027
[10] 杜阿尔特,M;胡玉华,分布式传感器网络中的车辆分类,并行分布计算。,64, 826-838, (2004) ·doi:10.1016/j.jpdc.2004.03.020
[11] 菲奥鲁奇,JAA;托莱多,FM;Nascimento,MACV,最小化最大簇内距离的启发式,Pesquisa Operacional,32,497-522,(2012)·doi:10.1590/S0101-7438202005000023
[12] 弗雷利,C;Raftery,A;Wehrens,R,《大数据集与小集群的基于模型的增量集群》,J.Compute。图表。《统计》,第14卷,第529-546页,(2005年)·doi:10.1198/106186005X59603
[13] Garey,M.R.,Johnson,D.S.:《计算机与难治性:NP-完备性指南》。WH Freeman,纽约(1979)·Zbl 0411.68039号
[14] Gonzalez,TF,聚类以最小化最大簇间距离,Theor。计算。科学。,38, 293-306, (1985) ·Zbl 0567.62048号 ·doi:10.1016/0304-3975(85)90224-5
[15] 汉森,P;Delatter,M,通过图着色进行完全链接聚类分析,美国统计协会,73,397-403,(1978)·Zbl 0432.05004号 ·doi:10.1080/01621459.1978.10481589
[16] Johnson,SC,层次聚类方案,《心理测量学》,32,241-254,(1967)·Zbl 1367.62191号 ·doi:10.1007/BF02289588
[17] Kahraman,HT;Sagiroglu,S;Colak,I,《开发直观的知识分类器并在web中对用户的领域相关数据进行建模》,Knowl。基于系统。,37, 283-295, (2013) ·doi:10.1016/j.knosys.2012.08.009
[18] Kaufman,L.,Rousseeuw,P.J.:《在数据中发现群体:聚类分析导论》。《概率和数理统计中的威利级数》,威利,纽约(1990)·Zbl 1345.62009号 ·doi:10.1002/9780470316801
[19] Lichman,M.:UCI机器学习知识库(2013)。http://archive.ics.uci.edu/ml。2018年2月27日访问
[20] 洛扎诺,L;Smith,JC,《防御拦截问题的反向抽样框架》,INFORMS J.Compute。,29, 123-139, (2017) ·Zbl 1414.91086号 ·doi:10.1287/ijoc.2016.0721
[21] 厄斯特格德,PR,最大团问题的快速算法,离散应用。数学。,120, 197-207, (2002) ·兹比尔1019.05054 ·doi:10.1016/S0166-218X(01)00290-6
[22] Prokhorov,D.:IJCNN 2001年神经网络竞赛。IJCNN中的幻灯片演示,1, 97 (2001) ·Zbl 0458.62049号
[23] Sibson,R,SLINK:单链簇方法的一种优化高效算法,计算。J.,16,30-34,(1973)·doi:10.1093/comjnl/16.130
[24] Siebert,J.P.:使用基于规则的方法进行车辆识别。研究备忘录TIRM-87-018,图灵研究所(1987)
[25] Sörensen,T,基于物种相似性在植物社会学中建立等幅群的方法及其在丹麦公地植被分析中的应用,Biol Skr,5,1-34,(1948)
[26] Torgo,L.:回归数据集(2009年)。http://www.dcc.fc.up.pt/ltorgo/Regression/DataSets.html。2018年2月27日访问
[27] Ugulino,W.、Cardador,D.、Vega,K.、Velloso,E.、Milidiu,R.、Fuks,H.:可穿戴计算:加速计对身体姿势和运动的数据分类。摘自:《第21届巴西人工智能研讨会论文集》,柏林/海德堡斯普林格,计算机科学讲稿,第52-61页(2012)
[28] 乌兹洛夫,AV;吉咪·基根(JM Keegan);Mathews,DH,根据预测的二级结构形成自由能变化检测非编码rna,BMC Bioninform。,7, 173, (2006) ·doi:10.1186/1471-2105-7-173
[29] 张,T;罗摩克里希南,R;Livny,M,Birch:一种新的数据聚类算法及其应用,data Min Knowl。离散,1141-182,(1997)·doi:10.1023/A:1009783824328
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。