×

增强数据聚类的点对称距离。 (英语) Zbl 1398.62170号

摘要:本文首先提出了一种新的基于点对称的相似性度量方法,该方法满足任意距离函数的闭包和对称性。详细解释了新距离的不同理想特性。然后,基于遗传算法的搜索能力,开发了一种新的聚类算法,其中新开发的基于点对称距离的聚类分配用于聚类分配。以满足闭包属性的方式将点分配给不同的簇。所提出的带有新开发的基于点对称距离(GAnPS)聚类算法的遗传算法能够确定具有任何大小或凸度的不同对称形状的簇。针对21个具有不同特征的数据集,证明了所提出的GAnPS聚类技术在识别正确分区方面的有效性。将GAnPS的性能与现有的基于对称性的遗传聚类技术、GAPS、三种流行和著名的聚类技术、\(K)-均值、期望最大化和平均连锁算法进行了比较。在本文的一部分中,展示了所提出的聚类技术在遥感卫星图像分割中的实用性。本文的最后一部分介绍了使用新提出的基于对称距离的自动聚类技术的发展。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)

软件:

威卡;嘲弄
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Alander JT(1992)关于遗传算法的最优种群规模。摘自:《计算机系统和软件工程学报》,1992年CompEuro,荷兰海牙,第65-70页
[2] 阿拉斯加州Alok;萨哈,S;Ekbal,A,使用多目标优化的新型半监督聚类技术,应用智能,43,633-661,(2015)·doi:10.1007/s10489-015-0656-z
[3] Anderberg MR(2000)《计算几何:算法和应用》。海德堡施普林格·Zbl 0939.68134号
[4] Bandyopadhyay,S;Maulik,U,非参数遗传聚类:有效性指数的比较,IEEE Trans-Syst Man-Cybern,31120-125,(2001)·数字标识代码:10.1109/5326.923275
[5] Bandyopadhyay,S;Maulik,U,聚类自动进化的遗传聚类及其在图像分类中的应用,模式识别,351197-1208,(2002)·Zbl 1001.68926号 ·doi:10.1016/S0031-3203(01)00108-X
[6] Bandyopadhyay,S;Saha,S,GAPS:一种使用新的基于点对称的距离度量的聚类方法,模式识别,40,3430-3451,(2007)·Zbl 1122.68486号 ·doi:10.1016/j.patcog.2007.03.026
[7] Bandyopadhyay,S;Saha,S,用于集群自动演化的基于点对称的聚类技术,IEEE Trans Knowl Data Eng,20,1-17,(2008)·doi:10.1109/TKDE.2008.79
[8] Bandyopadhyay S,Saha S(2013)《非监督分类相似性度量、经典和元启发式方法及应用》。柏林施普林格·Zbl 1276.62038号
[9] 宾利,JL;魏德,BW;Yao,AC,最近点问题的最优期望时间算法,ACM Trans Math Softw,6563-580,(1980)·兹比尔0441.68077 ·数字对象标识代码:10.1145/355921.355927
[10] Bezdek JC(1973)模式分类中的模糊数学。纽约州伊萨卡康奈尔大学博士论文
[11] 邦,CW;Rajeswari,M,《使用元启发式的多目标聚类:图像分割的当前趋势和方法》,图像处理IET,6,1-10,(2012)·doi:10.1049/iet-ipr.2010.0122
[12] Chou C-H,Su M-C,Lai E(2002)对称性作为聚类有效性的新度量。摘自:第二届WSEAS科学计算和软计算国际会议,第209-213页
[13] 钟,K-L;Lin,J-S,基于点对称的K-means算法更快、更稳健,模式识别,40,410-422,(2007)·Zbl 1118.68136号 ·doi:10.1016/j.patcog.2005.09.015
[14] Deb K,Agrawal S(1998)了解遗传算法参数之间的相互作用。In:《遗传算法基础5》,第265-286页,Morgan Kaufmann
[15] Demšar,J,多数据集上分类器的统计比较,J Mach Learn Res,7,1-30,(2006)·Zbl 1222.68184号
[16] Everitt BS,Landau S,Leese M(2001),聚类分析。阿诺德,伦敦·Zbl 1205.62076号
[17] Fisher,RA,《分类问题中多重测量的使用》,Ann Eugen,3179-188,(1936)·文件编号:10.1111/j.1469-1809.1936.tb02137.x
[18] Friedman,M,《使用秩来避免方差分析中隐含的正态假设》,美国统计协会杂志,32,675-701,(1937)·JFM 63.1098.02号 ·doi:10.1080/01621459.1937.10503522
[19] JH弗里德曼;Bently,JL;Finkel,RA,在对数期望时间内寻找最佳匹配的算法,ACM Trans Math Softw,3209-226,(1977)·Zbl 0364.68037号 ·数字对象标识代码:10.1145/355744.355745
[20] Furutani,H;坂本茂,M;Katayama,S,有限人口规模的影响——有利图式的消失,ICNC,21025-1034,(2005)
[21] Furutani H,Fujimaru T,Zhang Y-A,Sakamoto M(2007)种群规模对乘性景观上遗传算法计算性能的影响。收录:第三届自然计算国际会议论文集,第03卷,ICNC’07,美国华盛顿特区,第488-496页,IEEE计算机学会
[22] 加西亚,S;Herrera,F,《所有两两比较的多数据集分类器统计比较的扩展》,J Mach Learn Res,9,2677-2694,(2008)·Zbl 1225.68178号
[23] 加西亚-皮克,A;Fornells,A型;百加得,J;Orriols-Puig,A;Golobardes,E,多目标进化聚类聚类表示的大规模实验评估,IEEE Trans-Evol Compute,18,36-53,(2014)·doi:10.1109/TEVC.013.2281513
[24] Goldberg DE(1989a)搜索、优化和机器学习中的遗传算法。Addison-Wesley,纽约·Zbl 0721.68056号
[25] Goldberg DE(1989b)为串行和并行遗传算法确定种群大小。收录:第三届遗传算法国际会议论文集,美国加利福尼亚州旧金山,第70-79页,摩根考夫曼出版公司
[26] Goldberg DE,Deb K(1991)天然气选择方案的比较分析。In:GA基础(FOGA),第69-93页
[27] Goldberg,DE;Deb,K;Clark,JH,《遗传算法、噪声和种群规模》,《复杂系统》,第6期,第333-362页,(1992年)·兹比尔0800.68600
[28] Goldberg DE、Kargupta H、Horn J、Cantu-Paz E(1995)《串行和并行遗传算法的临界数据规模》,伊利诺伊大学伊利诺伊GA实验室技术代表。95002报告
[29] Grefenstette,J,遗传算法控制参数优化,IEEE Trans-Syst Man-Cybern,16,122-128,(1986)·doi:10.1109/TSMC.1986.289288
[30] 霍尔,M;E·弗兰克;霍姆斯,G;普法林格,B;鲁特曼,P;Witten,IH,The weka数据挖掘软件:更新;SIGKDD探索,IEEE Trans-Pattern Anal Mach Intell,11,10-18,(2009)
[31] Handl,J;Knowles,J,《多目标聚类的进化方法》,IEEE Trans-Evol Compute,11,56-76,(2007)·doi:10.1109/TEVC.2006.877146
[32] Handl,J;Knowles,J;Purshouse,R(编辑);Fleming,P(编辑);Fonseca,C(编辑);Greco,S(编辑);Shaw,J(编辑),《多目标数据聚类中的证据积累》,第7811、543-557号,(2013),施普林格出版社·doi:10.1007/978-3-642-37140-041
[33] Holland JH(1975)《自然和人工系统的适应》。密歇根大学出版社,安娜堡·Zbl 0317.68006号
[34] 阿拉斯加州贾恩;明尼苏达州默蒂;弗林,PJ,《数据聚类:综述》,ACM Compute Surv,31264-323,(1999)·数字对象标识代码:10.1145/331499.331504
[35] Jardine N,Sibson R(1971)《数学分类学》。纽约威利·Zbl 0322.62065号
[36] 福格·洛博(FG Lobo);Goldberg,DE,无参数遗传算法在实践中,Inf Sci,167217-232,(2004)·Zbl 1080.68630号 ·doi:10.1016/j.ins.2003.03.029
[37] U·莫利克;Bandyopadhyay,S,使用实数编码可变长度遗传算法进行像素分类的模糊划分,IEEE Trans-Geosci遥感,41,1075-1081,(2003)·doi:10.1109/TGRS.2003.810924
[38] 南达,SJ;Panda,G,关于分区聚类的自然启发元启发式算法的调查,Swarm Evolut Comput,16,1-18,(2014)·doi:10.1016/j.swevo.2013.11.003
[39] Nemenyi P(1963)无分布多重比较。博士论文
[40] Pal P,Chanda B(2002)多光谱卫星图像的基于对称性的聚类技术。输入:ICVGIP
[41] Richards JA(1993)遥感数字图像分析:简介。纽约州施普林格·doi:10.1007/978-3-642-88087-2
[42] 萨哈,S;Bandyopadhyay,S,新的基于对称性的聚类有效性指数在卫星图像分割中的应用,IEEE Geosci Remote Sens Lett,5166-170,(2008)·doi:10.1109/LGRS.2008.915595
[43] 萨哈,S;Bandyopadhyay,S,一种新的基于对称性的多目标模拟退火聚类技术,Pattern Recognit Lett,30,1392-1403,(2009)·doi:10.1016/j.patrec.2009.07.015
[44] 萨哈,S;Bandyopadhyay,S,新线对称距离及其在数据聚类中的应用,计算机科学技术杂志,24544-556,(2009)·doi:10.1007/s11390-009-9244-1
[45] 萨哈,S;Bandyopadhyay,S,一种基于对称的多目标聚类技术,用于集群自动演化,模式识别,43,738-751,(2010)·Zbl 1187.68499号 ·doi:10.1016/j.patcog.2009.07.004
[46] 萨哈,S;Bandyopadhyay,S,基于稳定性和对称性概念的新多目标聚类技术,Knowl-Inf-Syst,23,1-27,(2010)·doi:10.1007/s10115-009-0204-4
[47] 萨哈,S;Bandyopadhyay,S,《基于主轴的线对称聚类技术》,Memet Compute,3129-144,(2011)·doi:10.1007/s12293-010-0049-0
[48] 萨哈,S;Bandyopadhyay,S,多目标框架中的广义自动聚类算法,应用软计算,13,89-108,(2013)·doi:10.1016/j.asoc.2012.08.005
[49] 萨哈,S;Maulik,U,一种新的基于线对称距离的自动聚类技术:在图像分割中的应用,Int J Imaging Syst Technol,21,86-100,(2011)·doi:10.1002/ima.20243
[50] Saha S,Spandana R,Ekbal A,Bandyopadhyay S(2015)使用多目标框架同时进行特征选择和基于对称的聚类。应用软计算29:479-486
[51] 盛,W;斯威夫特,S;张,L;Liu,X,用混合小生境遗传算法进行聚类的加权和有效性函数,IEEE Trans-Syst Man Cybern第B部分Cybern,35,56-67,(2005)·doi:10.10109/TSMCB.2005.850173
[52] Srinivas,M;Patnaik,LM,遗传算法中交叉和变异的自适应概率,IEEE Trans-Syst Man-Cybern,24656-667,(1994)·doi:10.1109/21.286385
[53] 苏,M-C;Chou,C-H,基于簇对称的距离的K-means算法的改进版本,IEEE Trans-Pattern Ana Mach Intell,23674-680,(2001)·doi:10.1109/34.927466
[54] Zabrodsky,H;Peleg,S;Avnir,D,作为连续特征的对称性,IEEE Trans-Pattern Ana Mach Intell,171154-1166,(1995)·doi:10.1109/34.476508
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。