×

用于自动学习的模式选择、特定于类的特征选择和分类方法。 (英语) 兹比尔1296.68141

总结:本文提出了用于自动学习的训练模式(原型)选择、特定类特征选择和分类方法。对于训练模式选择,我们提出了一种采样方法,从数据集中提取少量有代表性的训练模式(原型)。其思想是提取一组表示分类问题中每个类区域的原型训练模式。在特定于类的特征选择中,我们尝试为每个类找到一个单独的特征集,以便将该类与其他类分开。然后,我们基于该类自己的特征集为其构建单独的分类器。本文还提出了一种新的超球面分类算法。超球面网与径向基函数网相似,属于核函数网的一类。证明了这些方法的多项式时间复杂性。学习算法的多项式时间复杂度对神经网络领域具有重要意义。提供了许多著名数据集的计算结果。算法的所有参数都没有针对任何已解决的问题进行微调,这支持了学习方法自动化的思想。学习自动化对于更广泛地部署学习技术至关重要。

MSC公司:

68T05型 人工智能中的学习和自适应系统
68吨10 模式识别、语音识别
62H30型 分类和区分;聚类分析(统计方面)
65年第68季度 算法和问题复杂性分析

软件:

UCI-毫升
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 阿龙,美国。;北巴尔凯。;诺特曼,D。;Gish,K。;伊巴拉,S。;Mack,D.,通过寡核苷酸阵列探测的肿瘤和正常结肠组织的聚类分析揭示的广泛基因表达模式,美国国家科学院学报,96,12,6745-6750(1999)
[3] Batchelor,B.G.,《模式分类的实用方法》(1974年),《阻燃:阻燃纽约》
[5] Battiti,R.,在监督神经网络学习中使用互信息选择特征,IEEE神经网络汇刊,54,537-550(1994)
[6] Bennett,K.P。;Mangasarian,O.L.,通过线性规划进行神经网络训练,(Pardalos,P.M.,《优化和并行计算进展》(1992),北荷兰:北荷兰阿姆斯特丹)·Zbl 0814.90072号
[8] Blum,A.L。;Rivest,R.L.,训练一个三节点神经网络是NP完全的,神经网络,5,117-127(1992)
[9] 布拉德利,P.S。;Mangasarian,O.L。;Street,W.N.,《通过数学编程进行特征选择》,《信息计算杂志》,10209-217(1998)·兹伯利1034.90529
[10] 布鲁姆黑德(D.Broomhead)。;Lowe,D.,多变量函数插值和自适应网络,复杂系统,2321-355(1988)·Zbl 0657.68085号
[11] Bu,H.L。;李国忠。;曾晓庆,利用特征选择降维减少肿瘤分类误差,(运筹学讲义(2007)),232-241
[12] Buhmann,Martin D.,径向基函数:理论与实现(2003),剑桥大学出版社·Zbl 1038.41001号
[13] Cooper,P.W.,模式识别中的超球面,信息与控制,5324-346(1962)·Zbl 0113.13101号
[14] Cooper,P.W.,关于自适应超球面决策边界的注释,IEEE电子计算机汇刊,948-949(1966)·Zbl 0168.17503号
[15] 库珀,L.N.,《我们如何学习》;我们如何记忆:走向对大脑和神经系统的理解:Leon N.Cooper(1995)的论文选集,《世界科学:世界科学新加坡》·Zbl 0913.92005号
[16] 盖,T.M。;托马斯·J·A,《信息理论的要素》(1991),威利:威利·奇切斯特·兹比尔0762.94001
[17] 戴建杰。;Lieu,L。;Roke,D.,基因表达数据分类的降维,遗传学和分子生物学中的统计应用,5,1(2006)·Zbl 1166.62337号
[18] 多明戈,C。;加瓦尔达,R。;Watanabe,O.,扩大知识发现算法的自适应采样方法,数据挖掘和知识发现,6,2,131-152(2002)·Zbl 1009.68036号
[19] 杜达,R。;Hart,P.,《模式分类和场景分析》(1973年),威利出版社:威利纽约·Zbl 0277.68056号
[20] 杜达,R。;哈特,P。;Stork,D.,模式分类(2001),威利:威利纽约·Zbl 0968.68140号
[21] Dudoit,S。;Fridlyand,J。;Speed,T.P.,《利用基因表达数据对肿瘤分类的判别方法比较》,《美国统计协会杂志》,97,457,77-87(2002)·Zbl 1073.62576号
[22] Fukunaga,K.,《统计模式识别》(1990),学术出版社:纽约学术出版社·Zbl 0711.62052号
[23] Golub,T。;斯隆,D。;Tamayo,P.,《癌症的分子分类:通过基因表达的类别发现和类别预测》,《科学》,286531-537(1999)
[24] 格罗斯曼,R.L。;Guo,Y.,《将数据挖掘算法缩放到大型数据集的并行方法》,(Zytkow,Jan M.,《数据挖掘和知识发现手册》(2002),牛津大学出版社),433-442
[25] Grunwald,P.,最小描述长度原则(2007),麻省理工学院出版社
[26] 约翰,G.H。;Kohavi,R。;Pfleger,K.,《无关特征和子集选择问题》,(第11届机器学习国际会议论文集(1994),Morgan Kaufman:Morgan Koufman San Mateo,CA)
[27] Judd,S.,《神经网络设计和学习的复杂性》(1990年),麻省理工学院出版社:麻省理学院出版社,马萨诸塞州剑桥
[29] Kim,S.,胶质瘤分类的组合基因集识别,分子癌症治疗学,1129-1236(2002)
[30] Kira,K。;Rendell,L.,特征选择问题:传统方法和新算法,(第十届全国人工智能大会论文集(1992年),Morgan Kaufman:Morgan Kaufman-San-Mateo,CA),129-134
[31] Kittler,J.,特征选择和提取,(Fu,Y.,《模式识别和图像处理手册》(1986),学术出版社:纽约学术出版社)
[32] 科勒,K。;Sahami,M.,走向最佳特征选择,(机器学习:第十三届国际会议论文集(1996),Morgan Kaufman:Morgan Koufman San Mateo,CA),284-292
[33] Knuth,D.E.,《计算机编程的艺术》。第3卷:排序和搜索(1975),Addison-Wesley:马萨诸塞州Addison-Whesley Reading
[35] Lim,T.-S。;卢,W.-Y。;Shih,Y.-S.,三十三种新旧分类算法的预测准确性、复杂性和训练时间的比较,机器学习,40,3,203-228(2000)·Zbl 0969.68669号
[36] 明斯基,M。;Papert,S.,Perceptrons(1988年),麻省理工学院出版社:麻省剑桥麻省理学院出版社·Zbl 0794.68104号
[37] 穆迪,J。;Darken,C.,《局部感受野学习》(Touretky,D.;Hinton,G.;Sejnowski,T.,《1988年联结主义模型暑期学校会议录》(1988),Morgan-Kaufmann:Morgan-Koufmann-San Mateo),133-143
[38] Mukhopadhyay,S。;罗伊,A。;Kim,L.S。;Govil,S.,生成用于模式分类的神经网络的多项式时间算法——稳定性特性和一些测试结果,神经计算,5,2,225-238(1993)
[39] 穆萨维,麻省理工。;艾哈迈德·W。;Chan,K.H。;Faris,K.B。;Hummels,D.M.,关于径向基函数分类器的训练,神经网络,5,4,595-603(1992)
[41] Oja,E.,模式识别的子空间方法(1983),研究出版社
[43] 小泽,S。;罗伊,A。;Roussinov,D.,在线模式识别的多任务学习模型,IEEE神经网络汇刊,20,3,430-445(2009)
[44] Pomeroy,S.L。;Tamayo,P。;Gaasenbeek,M.,《基于基因表达的中枢神经系统胚胎肿瘤预后预测》,《自然》,4156870436-442(2002)
[45] Quinlan,J.R.,在C4.5中构建决策树,(机器学习程序(1993),Morgan Kaufman),17-26
[46] 赖利,D.L。;Cooper,L.N.,《神经网络概述:现实世界系统的早期模型》,(Zornetzer,S.F.;Davis,J.L.;Lau,C.,《神经和电子网络导论》(1990),学术出版社:圣地亚哥学术出版社)
[47] 赖利,D.L。;库珀,L.N。;Elbaum,C.,分类学习的神经模型,生物控制论,45,35-41(1982)
[48] Ripley,B.D.,模式分类和神经网络(1996),剑桥·Zbl 0853.62046号
[49] Rissanen,J.,《统计建模中的信息和复杂性》(2007),施普林格出版社·兹比尔1156.62005
[54] Roy,A.,生成径向基函数(RBF)网络的新学习理论和多项式时间自主学习算法,(Howlett,R.J.;Jain,L.C.,径向基函数神经网络:设计和应用(2000),Springer Verlag)
[58] 罗伊,A。;Kim,L.S。;Mukhopadhyay,S.,一类多层感知器的构造和训练的多项式时间算法,神经网络,6,4,535-545(1993)
[59] 罗伊,A。;Govil,S。;Miranda,R.,为分类问题生成类径向基函数(RBF)网络的算法,神经网络,8,2,179-202(1995)
[60] 罗伊,A。;Govil,S。;Miranda,R.,神经网络学习理论和多项式时间RBF算法,IEEE神经网络汇刊,8,6,1301-1313(1997)
[61] 罗伊,A。;Mukhopadhyay,S.,使用线性规划在多项式时间内迭代生成高阶网络,IEEE神经网络学报,8,2,402-412(1997)
[62] Saeys,Y。;Inza,I。;Larrañaga,P.,《生物信息学中的特征选择技术综述》,生物信息学,23,19,2507-2517(2007)
[63] 斯科菲尔德,C.L。;赖利,D.L。;Elbaum,C。;Cooper,L.N.,无限制存储密度存储器中的模式类简并,(神经信息处理系统(1988),美国物理研究所),674-682
[64] (Shakhnarovish;Darrell;Indyk,《学习和视觉中的近邻方法》(2005),麻省理工出版社)
[65] 西德莱基。;Sklansky,J.,《关于自动特征选择》,《国际模式识别和人工智能杂志》,2,2,197-220(1988)
[67] Statnikov,A。;Aliferis,C.F。;沙马尔迪诺斯一世。;哈丁,D。;Levy,S.,微阵列基因表达癌症诊断多类别分类方法的综合评估,生物信息学,21,5,631-643(2005)
[68] Stone,M.,统计预测的交叉验证选择和评估,《皇家统计学会杂志》,36111-147(1974)·Zbl 0308.62063号
[70] Van Gestel,T。;苏肯斯,J。;Baesens,B。;Viaene,S。;Vantheinen,J。;Dedene,G.,基准最小二乘支持向量机分类器,机器学习,54,1,5-32(2004)·兹比尔1078.68737
[71] 沃德,M。;彭,W。;王欣,大规模数据的分层可视化数据挖掘,计算统计学,19,1,147-158(2004)·兹比尔1050.62005
[72] 渡边,S。;Lambert,P.F。;库利科夫斯基,C.A。;巴克斯顿,J.L。;Walker,R.,《模式识别中变量的评估和选择》(Computer and information sciences II(1967),学术出版社:纽约学术出版社)·兹比尔0214.47403
[73] Young,T.Y。;Calvert,T.W.,《分类、估计和模式识别》(1974年),爱思唯尔科学出版社:阿姆斯特丹爱思唯尔科学出版社·Zbl 0277.68055号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。