×

交叉熵方法在聚类和矢量量化中的应用。 (英语) Zbl 1127.94301号

摘要:我们将交叉熵(CE)方法应用于聚类和矢量量化问题。聚类的CE算法包括以下迭代步骤:(a)根据指定的参数概率分布生成随机聚类,(b)根据Kullback-Leibler交叉熵更新该分布的参数。通过各种数值实验,我们证明了CE算法的高精度,并表明它可以为相当大的数据集生成接近最优的聚类。我们将CE方法与著名的聚类和矢量量化方法(如K均值、模糊K均值和线性矢量量化)进行了比较,并将每种方法应用于基准和图像分析数据。

MSC公司:

94A08型 信息与通信理论中的图像处理(压缩、重建等)
90立方 非线性规划
62H30型 分类和歧视;聚类分析(统计方面)
68吨10 模式识别、语音识别
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] USC-SIPI图像数据库:http://sipi.usc.edu/services/database/database.html
[2] TSPLIB:旅行推销员问题库。http://www.iwr.uni-heidelberg.de/groups/comopt/software/TSPLIB95/ ·Zbl 0775.90293号
[3] Ahalt S.C.、Krishnamurthy A.K.、Chen P.、Melton D.E.(1990)矢量量化的竞争学习算法。神经网络。3, 277–290 ·doi:10.1016/0893-6080(90)90071-R
[4] Betke,M.,Makris,N.:使用模拟退火在噪声图像中快速识别物体。摘自:《第五届计算机视觉国际会议论文集》,第523–530页(1995年)
[5] Bezdek J.(1981)《模糊目标函数算法的模式识别》。纽约Plenum出版社·Zbl 0503.68069号
[6] Botev,Z.,Kroese,D.P.通过交叉熵方法进行全局似然优化,并应用于混合模型。Ingalls,R.G.,Rossetti,M.D.,Smith,J.S.,Peters,B.A.(编辑)2004年冬季模拟会议论文集,IEEE,华盛顿特区,2004年12月
[7] Brown,L.图像配准技术综述。哥伦比亚大学计算机科学系技术报告(1992年)
[8] Chen J.,Kundu A.(1995)使用多通道分解和隐马尔可夫模型的无监督纹理分割。IEEE传输。图像处理。4, 603–619 ·数字对象标识代码:10.1109/83.382495
[9] de Boer,P.T.、Kroese,D.P.、Mannor,S.、Rubinstein,R.Y.交叉熵方法教程。安·奥珀。研究第134卷,第19-67页。Springer-Verlag(2005)·Zbl 1075.90066号
[10] Dorigo,M.,Di Caro,G.蚁群优化元神经。摘自:Corne,D.,Dorigo,M.,Glover,F.(编辑)《优化的新理念》,第11-32页。McGraw-Hill(1999)
[11] Duda R.O.,Hart P.E.,Stork D.G.(2001)模式分类。纽约威利
[12] Geman S.,Geman D.(1984)图像的随机松弛、吉布斯分布和贝叶斯恢复。IEEE传输。PAMI 6721–741·Zbl 0573.62030号
[13] Glover F.,Laguna M.L.(1993)组合优化的现代启发式技术,第3章:禁忌搜索。牛津大学布莱克威尔科学出版社
[14] Goldberg D.(1989)搜索、优化和机器学习中的遗传算法。Addison Wesley,马萨诸塞州雷丁·兹比尔0721.68056
[15] Hansen P.,MladenovićN.(2001)J-means:最小平方和聚类的一种新的局部搜索启发式算法。模式识别。34, 405–413 ·Zbl 1012.68873号 ·doi:10.1016/S0031-3203(99)00216-2
[16] Hansen P.、MladenovićN.、Perez Brito D.(2001年)。可变邻域分解搜索。启发式杂志7335–350·Zbl 1041.68623号 ·doi:10.1023/A:1011336210885
[17] Jain A.K.、Murty M.N.、Flynn P.J.(1999)《数据聚类:综述》。ACM计算。Surv公司。31, 264–323 ·数字对象标识代码:10.1145/331499.331504
[18] Kaufman L.、Rousseeuw P.(1990)《数据中的发现群体》和《聚类分析导论》。纽约威利·Zbl 1345.62009号
[19] Keith,J.,Kroese,D.P.通过罕见事件模拟进行序列比对。参见:《2002年冬季模拟会议记录》,第320–327页。圣地亚哥(2002)
[20] McLachlan G.,Krishnan T.(1997)EM算法和扩展。纽约威利·Zbl 0882.62012号
[21] Rubinstein R.Y.(1999)组合和连续优化的交叉熵方法。Methodol公司。申请。探针。2, 127–190 ·Zbl 0941.65061号 ·doi:10.1023/A:101091220143
[22] Rubinstein R.Y.,Kroese D.P.(2004)《交叉熵方法:组合优化、蒙特卡罗模拟和机器学习的统一方法》。纽约施普林格-弗拉格·Zbl 1140.90005号
[23] Salomon D.(2000)《数据压缩:完整参考》。纽约施普林格-弗拉格·Zbl 0960.68040号
[24] Sherali H.D.,Desai J.(2005)解决硬聚类问题的基于rlt的全局优化方法。J全球优化。32, 281–306 ·Zbl 1123.62045号 ·doi:10.1007/s10898-004-2706-7
[25] Shi L.,Olafsson S.(2000)用于全局优化的嵌套划分方法。操作。第48(3)号决议:390–407·Zbl 1106.90368号 ·doi:10.1287/opre.48.390.12436
[26] Spall J.C.(2003)《随机搜索与优化导论》。约翰·威利,纽约·邮编1088.90002
[27] Stork D.G.、Yom-Tov E.(2004)《伴奏模式分类计算机手册》。纽约威利·Zbl 1120.68440号
[28] Webb A.(1999)统计模式识别。阿诺德,伦敦·Zbl 0968.68540号
[29] 杨明生,吴国良(2006)非监督可能性聚类。模式识别。39,5–21·doi:10.1016/j.patcog.2005.07.005
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。