×

基于启发式优化和最大熵原理的无监督分类器。 (英文) Zbl 1322.68166号

Emmerich,Michael(ed.)等人,EVOLVE–概率、面向集合的数值和进化计算之间的桥梁IV。根据2013年7月10日至13日在荷兰莱顿举行的国际会议上的演示选择论文。查姆:施普林格(ISBN 978-3-319-01127-1/pbk;978-3-3169-01128-8/电子书)。《智能系统与计算进展》227,17-30(2013)。
摘要:模式识别(尤其是数据挖掘)中的一项基本工作是确定集合中哪些未标记对象具有有趣的属性。这意味着一个奇异的分类过程,通常表示为“聚类”,其中对象根据适当的可能性度量被分组为(k)子集(簇)。聚类可以被认为是最重要的无监督学习问题。更传统的聚类方法基于基于度量或距离的相似性准则最小化。这一事实对发现的簇的几何结构施加了重要约束。由于簇中的每个元素都位于相对于给定中心的径向距离内,因此簇的覆盖物或外壳的形状是超球形(凸面)的,有时不能充分包围属于它的元素。为此,我们建议通过优化香农熵来解决聚类问题。该准则的优化代表了一个困难的组合问题,它不允许使用传统的优化技术,因此,有必要使用非常有效的优化技术。我们认为遗传算法是一个很好的选择。我们表明,我们的方法可以成功地解决集群具有复杂空间布局的问题。这种方法获得具有非凸外壳的簇,外壳充分包围其元素。我们从统计上表明,我们的方法显示了在集群元素正态分布的假设下可以实现的最佳性能。我们还表明,当这个假设不满足时,这是一个很好的选择。
关于整个系列,请参见[Zbl 1386.68006号].

MSC公司:

68吨10 模式识别、语音识别
2015年1月62日 贝叶斯推断
68T05型 人工智能中的学习和自适应系统
68T20型 人工智能背景下的问题解决(启发式、搜索策略等)
94甲17 信息的度量,熵
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Casella,G.,Robert,C.P.:蒙特卡洛统计方法(1999)·Zbl 0935.62005号
[2] De Sa,J.M.:模式识别:概念、方法和应用。斯普林格(2001)
[3] Digalakis,J.,Margaritis,K.:遗传算法基准函数的实验研究(2002)·Zbl 1147.68881号
[4] Duda,R.,Hart,P.,Stork,D.:图案分类,第10节,第6页。约翰·威利,纽约(2001)·兹伯利0968.68140
[5] Eshelman,L.:chc自适应搜索算法。从事非传统基因重组时如何进行安全搜索(1991)
[6] Gallager,R.G.:《信息理论与可靠通信》(1968年)·Zbl 0198.52201号
[7] 哈尔基迪,M。;巴蒂斯塔基斯,Y。;Vazirgiannis,M.,《集群验证技术》,《智能信息系统杂志》,17,2,107-145(2001)·Zbl 0998.68154号 ·doi:10.1023/A:1012801612483
[8] Haykin,S.:《神经网络:综合基础》,第2版。(1998) ·Zbl 0934.68076号
[9] Hsu,C.W.,Chang,C.C.,Lin,C.J.等:支持向量分类实用指南(2003)
[10] 约翰逊,J.L.:计算机科学的概率和统计。威利在线图书馆(2003)·Zbl 1027.68002号
[11] Kim,J.H.,Myung,H.:约束优化问题的进化编程技术(1997)
[12] Kuri-Morales,A.:统计遗传算法(1999)·Zbl 1077.68833号
[13] Kuri-Morales,A.,Aldana-Bobadilla,E.:结构不同的遗传算法的综合比较研究(发送出版,2013年)
[14] Kuri-Morales,A。;Aldana-Bobadilla,E.,《数据挖掘中不规则形状簇的搜索》(2011年),长谷川:Kimito、Funatsu和Kiyoshi,长谷川庆
[15] MacQueen,J.等人:多变量观测的一些分类和分析方法。摘自:美国加利福尼亚州伯克利第五届数理统计与概率研讨会论文集,第1卷,第14页(1967年)·Zbl 0214.46201号
[16] Mitchell,M.:遗传算法导论。麻省理工学院出版社(1996)·Zbl 0906.68113号
[17] Mitchell,M.,Holland,J.,Forrest,S.:什么时候遗传算法会超越爬山?摘自:神经信息处理系统进展6,第51-58页。Morgan Kaufmann(1994)
[18] Molga,M.,Smutnicki,C.:优化需求测试函数,第41-42页(2005),http://www.zsd.ict.pwr.wroc.pl/files/docs/functions.pdf(2012年3月11日检索)
[19] Pohlheim,H.:Geatbx:用于matlab文档的遗传和进化算法工具箱(2012)
[20] Rezaee,J.,Hashemi,A.,Nilsaz,N.,Dezfouli,H.:解决约束优化问题的启发式技术策略分析(2012)
[21] Rudolph,G.,标准遗传算法的收敛性分析,IEEE神经网络汇刊,5,1,96-101(1994)·doi:10.1009/7.265964
[22] Rumelhart,D.E。;辛顿,G.E。;Williams,R.J.,《通过反向传播错误学习表征》,《自然》,3236088533-536(1986)·Zbl 1369.68284号 ·数字对象标识代码:10.1038/323533a0
[23] Sánchez-Ferrero,G.,Arribas,J.:选择乳房X光照片中最重要特征的统计遗传算法(2007)
[24] Shannon,C.E.,通信数学理论,ACM SIGMOBILE移动计算与通信评论,5,1,3-55(2001)·数字对象标识代码:10.1145/584091.584093
[25] Steliga,K.,Szynal,D.:关于markov型不等式(2010)·Zbl 1195.60031号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。