×

一种新的基于点对称性的模糊遗传聚类技术,用于聚类的自动进化。 (英语) Zbl 1193.68216号

摘要:提出了一种基于模糊点对称性的遗传聚类技术(fuzzy-VGAPS),它可以自动确定数据集中的簇数,并对数据进行良好的模糊划分。簇可以是任何大小、形状或凸性,只要它们具有对称性。这里使用新提出的基于点对称的距离计算不同簇的点的隶属度值。染色体中编码着数量可变的簇中心。本文首先提出了一种新的基于模糊对称性的聚类有效性指标——(F)Sym-index,然后将其用于衡量染色体的适应度。该索引可以检测具有可变簇数的非凸分区和凸-非超球面分区。它通过与定义明确的硬聚类有效性函数(Dunn指数)的关系在数学上得到了证明,对于该函数,唯一性条件已经建立。在四个人工数据集和四个真实数据集上,将模糊VGAPS的结果与其他七种算法(包括模糊和清晰方法)获得的结果进行了比较。还演示了Fuzzy-VGAPS的一些实际应用,以自动聚类基因表达数据以及分割多发性硬化病变的磁共振脑图像。

MSC公司:

68T05型 人工智能中的学习和自适应系统
68吨10 模式识别、语音识别
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 网址:http://www.ics.uci.edu/mlearn/MLRepository.html。;网址:http://www.ics.uci.edu/mlearn/MLRepository.html。
[2] BrainWeb:模拟大脑数据库<http://www.bic.mni.mcgill.ca/brainweb网站>.; BrainWeb:模拟大脑数据库<http://www.bic.mni.mcgill.ca/brainweb网站>.
[3] Anderberg,M.R.,《计算几何:算法和应用》(2000),施普林格出版社·Zbl 0939.68134号
[4] 安德森,T.W。;Scolve,S.L.,《数据统计分析导论》(1978),霍顿·米夫林·兹伯利0415.62001
[5] Bandyopadhyay,S。;Pal,S.K.,《使用遗传算法的分类和学习:在生物信息学和网络智能中的应用》(自然计算系列)(2007年),Springer-Verlag纽约公司:Springer-Verlag纽约有限公司,美国新泽西州Secaucus·Zbl 1138.68486号
[6] Bandyopadhyay,S。;Saha,S.,GAPS:使用新的基于点对称的距离度量的聚类方法,模式识别,403430-3451(2007)·Zbl 1122.68486号
[7] A.Ben-Hur,I.Guyon,《在分子生物学方法中使用主成分分析检测稳定簇》,人类出版社,2003年。;A.Ben-Hur,I.Guyon,《在分子生物学方法中使用主成分分析检测稳定簇》,人类出版社,2003年。
[8] Bentley,J.L。;魏德,B.W。;Yao,A.C.,最近点问题的最佳期望时间算法,ACM数学软件交易,6,4,563-580(1980)·Zbl 0441.68077号
[9] 贝雷塔,M。;Burczyñski,T.,《数据分析的免疫均值和负选择算法》,信息科学,179,10,1407-1425(2009)
[10] J.C.Bezdek,模式分类中的模糊数学,博士论文,康奈尔大学,伊萨卡,纽约,1973年。;J.C.Bezdek,模式分类中的模糊数学,博士论文,康奈尔大学,伊萨卡,纽约,1973年。
[11] Bezdek,J.C.,《使用模糊目标函数算法进行模式识别》(1981),Plenum:Plenum New York·Zbl 0503.68069号
[12] C.Borgelt,《加速模糊聚类》,信息科学(2008),doi:10.1016/j.ins.2008.09.017。;C.Borgelt,《加速模糊聚类》,信息科学(2008),doi:10.1016/j.ins.2008.09.017。
[13] 坎佩洛,R.J.G.B。;Hruschka,Eduardo R.,聚类分析轮廓宽度标准的模糊扩展,模糊集与系统,1572858-2875(2007)·Zbl 1103.68674号
[14] 坎佩罗,R.J.G.B。;爱德华多·赫鲁什卡(Eduardo R.Hruschka)。;Alves,Vin’cisus S.,《进化模糊聚类的效率》,《启发式杂志》,第15、1、43-75页(2009年)·Zbl 1180.90380号
[15] 坎佩罗,R.J.G.B。;Hruschka,E.R.,关于两个数字序列的比较及其在聚类分析中的应用,信息科学,179,8,1025-1039(2009)·Zbl 1183.68522号
[16] V.Chaoji,M.A.Hasan,S.Salem,M.J.Zaki,SPARCL:高效和有效的基于形状的聚类,摘自:IEEE国际数据挖掘会议论文集,2008年。;V.Chaoji,M.A.Hasan,S.Salem,M.J.Zaki,SPARCL:高效和有效的基于形状的聚类,摘自:IEEE国际数据挖掘会议论文集,2008年。
[17] Chou,H.C。;苏,M.C。;Lai,Eugene,一种新的聚类有效性度量及其在图像压缩中的应用,模式分析与应用,7205-220(2004)
[18] Davies,D.L。;Bouldin,D.W.,集群分离度量,IEEE模式分析和机器智能汇刊,1224-227(1979)
[19] 董义勇,张义杰,张春良,基于多阶段随机抽样遗传算法的模糊C均值聚类算法,载《第三届机器学习与控制论国际会议论文集》,上海,2004年,第2069-273页。;董义勇,张义杰,张春良,基于多阶段随机抽样遗传算法的模糊C均值聚类算法,载《第三届机器学习与控制论国际会议论文集》,上海,2004年,第2069-273页。
[20] 杜布斯,R.C。;Jain,A.K.,《聚类技术:用户的困境》,模式识别,8247-260(1976)
[21] Dunn,J.C.,ISODATA过程的模糊相对论及其在检测紧密分离的簇中的应用,控制论杂志,3,32-57(1973)·Zbl 0291.68033号
[22] 艾森,M.B。;斯佩尔曼,P.T。;布朗,P.O。;Botstein,D.,全基因组表达模式的聚类分析和显示,《美国国家科学院院刊》,9514863-14868(1998)
[23] Everitt,B.S。;兰道,S。;Leese,M.,聚类分析(2001),阿诺德:阿诺德伦敦·Zbl 1205.62076号
[24] 弗里德曼,J.H。;Bently,J.L。;Finkel,R.A.,《在对数期望时间内寻找最佳匹配的算法》,《ACM数学软件交易》,3,3,209-226(1977)·Zbl 0364.68037号
[25] 吉本斯,F.D。;Roth,F.P.,《利用基因注释判断基于基因表达的聚类方法的质量》,《基因组研究》,第12期,第1574-1581页(2002年)
[26] N.Grira,M.E.Houle,《两者皆优:混合中心-中点聚类启发式》,载于:ICML'07:第24届国际机器学习会议论文集,美国纽约州纽约市,ACM,2007年,第313-320页。;N.Grira,M.E.Houle,《两者皆优:混合中心-中点聚类启发式》,载于:ICML'07:第24届国际机器学习会议论文集,美国纽约州纽约市,ACM,2007年,第313-320页。
[27] Gröll,L。;Jäkel,J.,模糊C均值的新收敛证明,IEEE事务模糊系统,13,5,717-720(2005)
[28] 徐,C.-C。;陈,C.-L。;Su,Y.-W.,基于距离层次的混合数据层次聚类,信息科学,177,20,4474-4492(2007)
[29] Jain,A.K。;Duin,P.W。;Jianchang,M.,统计模式识别:综述,IEEE模式分析和机器智能汇刊,22,1,4-37(2000)
[30] Jain,A.K。;Murthy,M.N。;Flynn,P.J.,《数据聚类:综述》,《ACM计算评论》(1999)
[31] Kim,D.-W。;Lee,K.H.(Lee,K.H.)。;Lee,D.,基于簇间邻近性的模糊聚类验证指数,模式识别字母,24,15,2561-2574(2003)
[32] Kim,M。;Ramakrishna,R.S.,《聚类有效性评估的新指数》,《模式识别快报》,26,15,2353-2363(2005)
[33] Kim,Y.-I。;Kim,D.-W。;Lee博士。;Lee,K.H.,基于相对共享度的GK聚类分析的聚类验证指数,信息科学,168,1-4,225-242(2004)·Zbl 1075.62052号
[34] Lee,C.-H。;O.R.扎奥纳。;公园,H.-H。;黄,J。;Greiner,R.,《高维数据聚类:基于图形的放松优化方法》,《信息科学》,178,23,4501-4511(2008)
[35] 刘,Y。;Yi,Z。;Wu,H。;Ye,M。;Chen,K.,最小平方和聚类问题的禁忌搜索方法,信息科学,178,12,2680-2704(2008)·兹比尔1183.68541
[36] 刘,Y。;Yi,Z。;Wu,H。;Ye,M。;Chen,K.,最小平方和聚类问题的禁忌搜索方法,信息科学,178,12,2680-2704(2008)·Zbl 1183.68541号
[37] B.Long,Z.(Mark)Zhang,P.S.Yu,通过软通信组合多重聚类,收录于:ICDM’05:第五届IEEE数据挖掘国际会议论文集,美国华盛顿特区,IEEE计算机学会,2005年,第282-289页。;B.Long,Z.(Mark)Zhang,P.S.Yu,通过软通信组合多重聚类,收录于:ICDM’05:第五届IEEE数据挖掘国际会议论文集,美国华盛顿特区,IEEE计算机学会,2005年,第282-289页。
[38] Maulik,美国。;Bandyopadhyay,S.,一些聚类算法和有效性指标的性能评估,IEEE模式分析和机器智能汇刊,24,12,1650-1654(2002)
[39] Maulik,美国。;Bandyopadhyay,S.,使用实数编码可变长度遗传算法进行像素分类的模糊划分,IEEE地球科学与遥感学报,41,5,1075-1081(2003)
[40] Nguyen,C.D。;Cios,K.J.,GAKREM:一种新型混合聚类算法,《信息科学》,178,22,4205-4227(2008)·Zbl 1151.68613号
[41] 奥巴,S。;佐藤,M。;竹马,I。;蒙登,M。;松原,K。;Ishii,S.,基因表达谱数据的贝叶斯缺失值估计方法,生物信息学,192088-2096(2003)
[42] Pakhira,M.K。;Maulik,美国。;Bandyopadhyay,S.,清晰和模糊聚类的有效性指数,模式识别,37,3487-501(2004)·Zbl 1068.68135号
[43] Rousseeuw,P.,《Silhouettes:聚类分析解释和验证的图形辅助》,《计算与应用数学杂志》,205365(1987)·Zbl 0636.62059号
[44] Sheng,W。;斯威夫特,S。;张,L。;Liu,X.,用混合小生境遗传算法进行聚类的加权和有效性函数,IEEE系统、人与控制论汇刊B部分:控制论,35,6,1156-1167(2005)
[45] Slonim,N。;阿特瓦尔,G.S。;特卡奇克,G。;Bialek,W.,《基于信息的聚类》,《美国国家科学院院刊》,102,5118297-18302(2005)·Zbl 1135.62054号
[46] 斯里尼瓦斯,M。;Patnaik,L.M.,遗传算法中交叉和变异的自适应概率,IEEE系统、人与控制论汇刊,24,4,656-667(1994)
[47] 苏,M.C。;Chou,C.-H.,基于簇对称的距离(K)-均值算法的改进版本,IEEE模式分析和机器智能学报,23,6,674-680(2001)
[48] Wang,Y.-J。;Lee,H.-S.,《确定代表性财务比率的聚类方法》,《信息科学》,178,4,1087-1097(2008)·Zbl 1132.91482号
[49] 谢晓乐。;Beni,G.,模糊聚类的有效性度量,IEEE模式分析和机器智能汇刊,13841-847(1991)
[50] 徐,Z。;陈,J。;Wu,J.,直觉模糊集的聚类算法,信息科学,178,19,3775-3790(2008)·Zbl 1256.62040号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。