×

双指标诱导FCM聚类及其与模糊子空间聚类的集成。 (英语) Zbl 1328.62391号

摘要:模糊c-均值(FCM)及其变体作为最流行的聚类分析算法之一,已被广泛研究。本文从另一个角度提出了一种新的广义形式,称为双指数诱导FCM(DI-FCM)。DI-FCM在目标函数的约束条件中引入幂指数,从而推广了模糊指数m,并定义了选择合适模糊指数m的新准则。此外,可以从熵概念的角度解释,幂指数有助于将基于熵的约束引入模糊聚类算法。作为一种有吸引力且明智的应用,DI-FCM与模糊子空间聚类(FSC)算法相结合,提出了一种新的模糊子空间聚集算法,称为双指标诱导模糊子空间聚簇(DI-FSC)算法。DI-FSC将常用的欧几里得距离替换为特征加权距离,从而在目标函数中具有两个模糊矩阵。通过应用,还建立了DI-FSC的收敛性证明W.I.赞维尔《非线性规划:统一方法》,Cliffs,NJ:Prentice-Hall Inc(1969;Zbl 0195.20804号)]收敛定理。对人工数据和实际数据进行了多次实验,实验结果表明了该算法的有效性。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
62小时86 多元分析与模糊性
68吨10 模式识别、语音识别
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Bezdek JC(1981)模糊目标函数算法模式识别。纽约Plenum出版社·Zbl 0503.68069号 ·doi:10.1007/978-1-4757-0450-1
[2] Bezdek JC(1980)模糊ISODATA聚类算法的收敛定理。IEEE Trans-Pattern Ana Mach Intell公司2:1-8·Zbl 0441.62055号 ·doi:10.1109/TPAMI.1980.4766964
[3] Baraldi A,Blonda P(1999)模式识别模糊聚类算法综述。IEEE Trans-Syst Man Cybern第B部分29(6):778-801·数字对象标识代码:10.1109/3477.809032
[4] Pal NR,Bezdek JC(1995)关于模糊c-均值模型的聚类有效性。IEEE Trans Fuzzy系统3:370-379·数字对象标识代码:10.1109/91.413225
[5] Hall LO,Bensaid AM,Clarke LP(1992)《神经网络和模糊聚类技术在分割大脑磁共振图像中的比较》。IEEE Trans神经网络3:672-682·doi:10.1009/72/159057
[6] Cannon RL、Dave JV、Bezdek JC(1986)《模糊c-均值聚类算法的高效实现》。IEEE Trans-Pattern Ana Mach Intell 8:248-255(IEEE传输模式分析机器智能)·Zbl 0602.68084号 ·doi:10.1109/TPAMI.1986.4767778
[7] Yu J,Cheng Q,Huang H(2004)FCM中加权指数的分析。IEEE Trans-Syst Man Cybern第B部分34(1):634-638·doi:10.1109/TSMCB.2003.810951
[8] Hsu CM,Chen MS(2009)关于高维数据空间中距离函数的设计和适用性。IEEE Trans Knowl Data Eng 21(4):523-536·doi:10.1109/TKDE.2008.178
[9] Beyer K、Goldstein J、Ramakrishnan R、Shaft U(1999)“最近邻居”何时有意义。Lect Notes计算机科学1540:217-235·doi:10.1007/3-540-49257-7_15
[10] Green PE,Carmone FJ,Kim J(1990)《k均值聚类中最优变量权重的初步研究》,J Classif 7:271-285·doi:10.1007/BF01908720
[11] De Soete G(1986)超度量和加性树聚类的最佳变量加权。Qual Quant 20:169-180·doi:10.1007/BF00227423
[12] Gnanadesikan R,Kettering J,Tsao S(1995),聚类分析变量的加权和选择。J类12:113-136·Zbl 0825.62540号 ·doi:10.1007/BF01202271
[13] Shen H,Yang J,Wang S,Liu X(2006)基于属性加权mercer核的一般非球形数据集模糊聚类算法。软计算10(11):1061-1073·文件编号:10.1007/s00500-005-0043-5
[14] Makarenkov V,Legendre P(2001)《超度量树和可加树的最优变量权重和k均值划分:方法和软件》。J类18:245-271·Zbl 1040.91087号
[15] Huang JZ,Ng MK,Rong H,Li Z(2005)k-means型聚类中的自动变量加权。IEEE Trans-Pattern Ana Mach Intell 27(5):1-12·Zbl 1131.30330号 ·doi:10.1109/TPAMI.2005.95
[16] Lee DD,Seung HS(2000)非负矩阵分解算法。摘自:《神经信息系统学报》,第942-948页
[17] Lin CJ(2007)非负矩阵分解的投影梯度法。神经计算19:2756-2779·Zbl 1173.90583号 ·doi:10.1162/neco.2007.19.10.2756
[18] Bucak SS,Gunsel B(2010)通过在线非负矩阵分解实现高效文档聚类。在:2010年IEEE数据挖掘国际会议论文集·Zbl 1178.68395号
[19] Xu W,Liu X,Gong Y(2003)基于非负矩阵分解的文献聚类。In:ACM信息检索特别兴趣小组会议记录,第267-273页,2003年8月
[20] Guan N,Tao D,Luo Z,Yuan B(2012)NeNMF:非负矩阵分解的最优梯度法。IEEE传输信号处理60(6):2882-2898·Zbl 1391.65115号 ·doi:10.1109/TSP.2012.2190406
[21] Ding C,He X,Simon HD(2006)关于非负矩阵分解与谱聚类的等价性。摘自:2006年SIAM数据挖掘会议论文集,第606-610页
[22] Deng Z,Choi K,Chung F,Wang S(2010)结合簇内和簇间信息的增强软子空间聚类。图案识别43(3):767-781·Zbl 1187.68445号 ·doi:10.1016/j.patcog.2009.09.010
[23] Zangwill WI(1969)《非线性规划:统一方法》。新泽西州恩格尔伍德悬崖普伦蒂斯·霍尔·Zbl 0195.20804号
[24] Gan G,Wu J(2008)模糊子空间聚类(FSC)算法的收敛定理。图案编号41:1939-1947·兹比尔1134.68488 ·doi:10.1016/j.patcog.2007.11.011
[25] Hathaway R,Bezdek J,Tucker W(1987)模糊c均值聚类算法的改进收敛定理。In:Bezdek J(ed)《模糊信息分析》,第三卷。CRC出版社,博卡拉顿,第123-131页·Zbl 0662.62069号
[26] Havrda JH,Charvat F(1967)分类过程的量化方法:结构α-熵的概念。凯贝内提卡3:30-35·Zbl 0178.22401号
[27] Krishnapuram R,Keller J(1993)《聚类的可能性方法》,IEEE Trans-Fuzzy Syst 1:98-110·数字对象标识代码:10.1109/91.227387
[28] Pedrycz W,Vukovich G(2002)面向逻辑的模糊聚类。模式识别快报23(13):1515-1527·Zbl 1010.68134号 ·doi:10.1016/S0167-8655(02)00115-0
[29] Wu KL,Yang MS(2002)备选c均值聚类算法。图案识别35(10):2267-2278·Zbl 1006.68876号 ·doi:10.1016/S0031-3203(01)00197-2
[30] Lin Z,Chung FL,Wang ST(2009)改进模糊划分的广义模糊c均值聚类算法。Trans-Syst Man Cybern第B部分39(3):578-591·doi:10.1109/TSMCB.2008.2004818
[31] Newman DJ、Hettich S、Blake CL等人(1998)UCI机器学习数据库库。加州大学欧文分校信息与计算机科学系。(http://archive.ics.uci.edu/ml/)
[32] Aggarwal CC,Procopiuc CM,Wolf JL,Yu PS,Park JS(1999)预测聚类的快速算法。SIGMOD记录28(2):61-72·doi:10.1145/304181.304188
[33] http://glaros.dtc.umn.edu/gkhome/fetch/sw/cluto/datasets.tar.gz, 2009
[34] UCI KDD档案。http://kdd.ics.uci.edu/databases/20新闻组, 2005
[35] Rand WM(1971)聚类方法评估的客观标准。美国统计协会杂志66:846-850·doi:10.1080/01621459.1971.10482356
[36] Zhong S,Ghosh J(2003)《文档聚类生成模型的比较研究》,载《SDW研讨会高维数据聚类及其应用进展》,2003年5月·Zbl 0441.62055号
[37] Jing L,Ng MK,Huang JZ(2007)高维稀疏数据子空间聚类的熵加权k-means算法。IEEE Trans Knowl Data Eng 19(8):1026-1041·doi:10.1010/TKDE.2007.1048
[38] Ng AY、Jordan MI、Weiss Y(2001)《关于光谱聚类:分析和算法》。主题:神经信息处理系统的进展,第849-856页
[39] Kim J,Park H(2008)《迈向更快的非负矩阵分解:一种新算法和比较》。摘自:第八届IEEE数据挖掘国际会议记录,第353-362页
[40] Yu J,Yang MS(2005)广义FCM的最优性检验及其在参数选择中的应用。IEEE Trans Fuzzy系统13(1):164-176·doi:10.1109/TFUZZ.2004.836065
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。