×

用于ROC优化的学习矢量量化分类器。 (英语) Zbl 1417.68171号

摘要:针对二进制分类问题,本文提出了一种广义学习向量量化器(GLVQ)变体,它明确优化了接收机工作特性(ROC)曲线下的区域,而不是分类精度,这通常不适合分类器评估。在类分布重叠的情况下,这一点尤其重要,因为用户必须在高真阳性和良好假阳性性能之间进行权衡。该模型保持了基于原型的随机梯度下降学习矢量量化的思想。为此,提出了一种基于GLVQ的成本函数,该函数根据局部判别函数的和来描述ROC曲线下的面积。该代价函数反映了ROC分析中的基本秩统计,该秩统计涉及到基于原型的判别函数的设计中。原型向量的最终学习方案使用结构化输入,即。两类数据向量的有序对。

MSC公司:

68T05型 人工智能中的学习和自适应系统
62H30型 分类和区分;聚类分析(统计方面)
62页第10页 统计学在生物学和医学中的应用;元分析
68吨10 模式识别、语音识别
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Ataman K,Street WN,Zhang Y(2006)通过线性规划最大化AUC学习排名。收录:IEEE国际神经网络联合会议(IJCNN)会议记录。IEEE出版社,第123-129页
[2] 巴尔迪,P;布鲁纳克,S;乔文,Y;安达信,C;尼尔森,H,《评估分类预测算法的准确性:概述》,生物信息学,16,412-424,(2000)·doi:10.1093/bioinformatics/16.5.412
[3] Bengio,Y,《学习人工智能的深层架构》,Found Trends Mach Learn,2,1-127,(2009)·Zbl 1192.68503号 ·doi:10.1561/2200000006
[4] Berger JO(1993)统计决策理论和贝叶斯分析。斯普林格统计学系列,第三版。纽约州施普林格
[5] 贝尔,M;锤子,B;Merényi,E;斯佩尔杜蒂,A;Villman,T,《超高维数据背景下的学习》(Dagstuhl研讨会11341),Dagstuhl Rep,167-95,(2011)
[6] Biehl M,Kaden M,Stürmer P,Villmann T(2014)学习向量量化分类器中的ROC优化和统计质量度量。Mach Learn Rep,8(MLR-01-2014):23-34,ISSN:1865-3960,http://www.techfak.uni-bielefeld.de/fschleif/mlr/mlr_01_2014.pdf
[7] Bishop CM(2006)模式识别和机器学习。纽约州施普林格·Zbl 1107.68072号
[8] Blake CL、Merz CJ(1998),机器学习数据库的UCI存储库。加州大学欧文分校信息与计算机科学系。http://www.ics.edu/mlearn/ML存储库.html
[9] Bradley,AP,ROC曲线下面积在机器学习算法评估中的使用,模式识别,30,1149-1155,(1997)·doi:10.1016/S0031-3203(96)00142-2
[10] Brefeld U,Scheffer T(2005)AUC最大化支持向量学习。摘自:ICML 2005机器学习ROC分析研讨会论文集,第377-384页
[11] 考尔德,T;雅罗斯泽维奇,S;Kok,JN(编辑);Koronacki,J(编辑);Mantaras,R Lopez(编辑);Matwin,S(编辑);Mladenic,D(编辑);Skowron,A(编辑),分类的高效AUC优化,42-53,(2007),柏林·doi:10.1007/978-3-540-74976-98
[12] 科尔特斯,C;Vapnik,V,支持向量网络,马赫学习,20,1-20,(1995)·Zbl 0831.68098号
[13] 克拉默,K;吉拉德·巴赫拉赫,右;纳沃特,A;蒂什比,A;Becker,S(编辑);Thrun,S(编辑);Obermayer,K(ed.),LVQ算法的边缘分析,第15期,462-469,(2003),剑桥
[14] Cristianini N,Shawe-Taylor J(2000)支持向量机和其他基于内核的学习方法简介。剑桥大学出版社·Zbl 0994.68074号 ·doi:10.1017/CBO9780511801389
[15] Duda RO,Hart PE(1973),模式分类和场景分析。纽约威利·Zbl 0277.68056号
[16] Fawcett,T,《ROC分析导论》,Pattern Recogn Lett,27861-874,(2006)·doi:10.1016/j.parec.2005.010
[17] Fisher,RA,在分类学问题中使用多重测量,Ann Eugen,7199-188,(1936)·文件编号:10.1111/j.1469-1809.1936.tb02137.x
[18] Graf S,Lushgy H(2000)随机向量量化基础。LNM-1730。柏林施普林格·Zbl 0951.60003号
[19] 格维纳尔,HA;Kurtcephe,M,《通过最大化ROC曲线下面积对实例进行排名》,IEEE Trans Knowl Data Eng,252356-2366,(2013)·doi:10.1109/TKDE.2012.214
[20] 锤子,B;斯特里克特,M;Villmann,T,关于GRLVQ网络的泛化能力,神经过程Lett,21,109-120,(2005)·doi:10.1007/s11063-004-1547-1
[21] 锤子,B;内贝尔,D;里德尔,M;维尔曼,T;Villmann,T(编辑);Schleif,F-M(编辑);卡登,M(编辑);Lange,M(编辑),基于原型的生成分类与区分分类,123-132,(2014),柏林·doi:10.1007/978-3-319-07695-9_12
[22] 锤子,B;维尔曼,T,广义相关学习矢量量化,神经网络,15,1059-1068,(2002)·doi:10.1016/S0893-6080(02)00079-5
[23] JA Hanley;麦克尼尔,BJ,接收器工作特性下区域的含义和使用,放射学,143,29-36,(1982)·doi:10.1148/放射学.143.1.7063747
[24] JA Hanley;McNeil,BJ,《比较同一案例中得出的接收器工作特性曲线下面积的方法》,《放射学》,148839-843,(1983)·doi:10.1148/放射学.148.3.6878708
[25] Haykin Simon(1994)神经网络。全面的基础。纽约麦克米伦·Zbl 0828.68103号
[26] 赫尔曼,W;巴瑟尔,H;黑塞,S;Villmann,Th;Wagner,A,Korrelation der motorisch evozierten potentiale mit dem striatalen glukosestofwechsel bei patienten mit einem morbus Wilson,Aktuelle Neurol,5,242-246,(2002年)·doi:10.1055秒-2002-32029
[27] 赫尔曼,W;巴瑟尔,H;黑塞,S;格拉曼,F;库恩,H-J;瓦格纳,A;Villmann,Th,威尔逊病临床类型与锥体外运动脑区葡萄糖代谢的比较,神经学杂志,249896-901,(2002)·doi:10.1007/s00415-002-0756-7
[28] 赫尔曼,W;Villmann,Th;格拉曼,F;库恩,HJ;Wagner,A,威尔逊氏病精细运动障碍的研究,神经科学,23,279-285,(2003)·doi:10.1007/s100720300002
[29] Herschtal A,Raskutti B(2004)使用梯度下降优化ROC曲线下的面积。摘自:第21届机器学习国际会议论文集。班夫,第49-56页
[30] 怀春,W;Dopazo,J;Carazo,JM,氨基酸分类的自组织树生长网络,生物信息学,14,376-377,(1998)·doi:10.1093/bioinformatics/14.4.376
[31] 黄,J;Ling,CX,《使用AUC和准确性评估学习算法》,IEEE Trans Knowl Data Eng,17,299-310,(2005)·doi:10.1010/TKDE.2005.50
[32] 卡登,M;赫尔曼,W;维尔曼,T;Verleysen,M(ed.),基于学习矢量量化的分类通用统计精度度量优化,47-52,(2014),比利时
[33] 卡登,M;兰格,M;内贝尔,D;里德尔,M;Geweniger,T;Villmann,T,《分类学习方面——学习矢量量化最新发展回顾》,《发现计算决策科学》,39,79-105,(2014)·Zbl 1328.68166号
[34] 卡登,M;里德尔,M;赫尔曼,W;维尔曼,T,广义学习向量量化中的边界敏感学习:支持向量机的替代方案,软计算,192423-2434,(2015)·doi:10.1007/s00500-014-1496-1
[35] Kästner,M;里德尔,M;斯特里克特,M;赫尔曼,W;维尔曼,T;罗哈斯,I(编辑);Joya,G(编辑);Cabestany,J(ed.),核化学习矢量量化中的边界敏感学习,357-366,(2013),柏林
[36] Keilwagen,J;格罗斯,I;Grau,J,加权和未加权数据的精确重调用曲线下面积,PLos One,9,1-13,(2014)·doi:10.1371/journal.pone.0092209
[37] Kohonen T(1990)学习矢量量化的改进版本。摘自:IJCNN-90神经网络国际联合会议论文集,第一卷,皮斯卡塔韦,IEEE服务中心,圣地亚哥,第545-550页
[38] Kohonen Teuvo(1986)模式识别的学习矢量量化。报告TKK-F-A601,赫尔辛基理工大学,埃斯波·Zbl 0495.92003号
[39] Kohonen,T,学习矢量量化,神经网络,1303,(1988)
[40] Kohonen,T;Taylor,JG(编辑);Mannion,CLT(编辑),学习矢量量化和自组织映射,235-242,(1992),伦敦·doi:10.1007/978-1-4471-1833-6_15
[41] Kohonen Teuvo(1995)《自组织地图》,信息科学史普林格系列第30卷。施普林格,柏林,海德堡(1997年第二次扩展版)·Zbl 0827.68092号
[42] Landgrebe,TCW;税,D;帕西克,P;Duin,RPW,基于距离的拒绝分类器的分类和拒绝性能之间的相互作用,模式识别快报,27908-917,(2006)·doi:10.1016/j.patrec.2005.10.015
[43] TA拉斯科;巴格瓦特,JG;邹,KH;Ohno-Machado,L,《接收器工作特性曲线在生物医学信息学中的应用》,《生物识别信息杂志》,38,404-415,(2005)·doi:10.1016/j.jbi.2005.02.008
[44] LeCun,Y;本吉奥,Y;Hinton,G,《深度学习》,《自然》,521436-444,(2015)·doi:10.1038/nature14539
[45] 曼恩,HB;Whitney,DR,关于两个随机变量中的一个是否随机大于另一个的测试,Ann Math Stat,18,50-60,(1947)·Zbl 0041.26103号 ·doi:10.1214/aoms/1177730491
[46] McLachlan GJ(1992)判别分析与统计模式识别。,概率和数理统计中的威利级数:应用概率和统计·Zbl 1108.62317号 ·doi:10.1002/0471725293
[47] Mitchell T(1997)机器学习。麦克劳希尔,纽约·Zbl 0913.68167号
[48] 内贝尔,D;维尔曼,T;Verleysen,M(ed.),基于ROC优化的不同数据分类的中值-LVQ,1-6,(2015),比利时
[49] 昆兰JR(1993)C4.5:机器学习程序。Morgan Kaufmann,旧金山
[50] Rakotomamonjy A(2004)使用SVM优化ROC曲线下的区域。摘自:《人工智能ROC分析研讨会论文集》,汉堡,第71-80页
[51] Rijsbergen CJ(1979)《信息检索》,第二版。巴特沃斯,伦敦·Zbl 0227.68052号
[52] 罗宾斯,H;Monro,S,《随机近似方法》,《数学统计年鉴》,22400-407,(1951)·Zbl 0054.05901号 ·doi:10.1214/aoms/1177729586
[53] Sachs L(1992)Angewandte Statistik,第7版。柏林斯普林格·弗拉格·Zbl 0755.6202号 ·doi:10.1007/978-3-662-05747-6
[54] 桑托斯·佩雷拉,CM;Pires,AM,关于最优拒绝规则和ROC曲线,Pattern Recogn Lett,26943-952,(2005)·doi:10.1016/j.patrec.2004.09.042
[55] 佐藤,A;山田,K;Touretzky,DS(编辑);Mozer,MC(编辑);Hasselmo,ME(编辑),广义学习矢量量化,423-429,(1996),剑桥
[56] Schmidhuber,J,《神经网络中的深度学习:概述》,神经网络,61,85-117,(2015)·doi:10.1016/j.neunet.2014.09.003
[57] 施耐德,P;锤子,B;Biehl,M,学习矢量量化中的自适应相关矩阵,神经计算,213532-3561,(2009)·Zbl 1192.68537号 ·doi:10.1116/neco.2009.11-08-908
[58] Schölkopf B,Smola A(2002)《内核学习》。麻省理工学院出版社,剑桥·Zbl 1019.68094号
[59] Shawe-Taylor J,Cristianini N(2004),模式分析和发现的核方法。剑桥大学出版社·Zbl 0994.68074号 ·doi:10.1017/CBO9780511809682
[60] Steinwart,I,关于核对支持向量机一致性的影响,J Mach Learn Res,267-93,(2001)·Zbl 1009.68143号
[61] 斯特里克特,M;施莱夫,F-M;塞弗特,U;Villmann,T,《基于梯度分析生物医学数据的皮尔逊相关性导数》,Inteligencia Artificial,Revista Iberoamericana de Inteligenica Artifical,37,37-44,(2008)
[62] 斯特里克特,M;Keilwagenan,J;施莱夫,F-M;维尔曼,T;贝尔,M;Cabestany,J(编辑);等。,生物医学数据的矩阵度量自适应线性判别分析,933-940,(2009),海德堡
[63] Vapnik V(1998)统计学习理论。纽约威利·Zbl 0935.62007号
[64] 维尔曼,T;Haase,S;Kaden,M,梯度学习中的核化矢量量化,神经计算,147,83-95,(2015)·doi:10.1016/j.neucom.2013.11.048
[65] 维尔曼,T;卡登,M;内贝尔,D;贝尔,M;Azzopardi,G(编辑);Petkov,N(编辑),《基于自适应成本的异常值重投影的学习矢量量化》,772-782,(2015),柏林,海德堡
[66] 维尔曼,T;卡登,M;波恩萨克,A;萨拉拉朱,S;维尔曼,J-M;Drogies,T型;锤子,B;Merényi,E(编辑);Mendenhall,MJ(编辑);O'Driscoll,P(编辑),基于原型分类中的自我调整拒绝选项,269-279,(2016),柏林,海德堡·数字对象标识代码:10.1007/978-3-319-28518-4_24
[67] Villmann T、Schleif F-M、Kaden M、Lange M(eds)(2014)《自组织映射和学习矢量量化进展——第十届国际研讨会论文集》,WSOM 2014,Mittweida。智能系统和计算进展排名295。海德堡施普林格·Zbl 1293.68034号
[68] Wilcoxon,F,《通过排名方法进行安迪维迪亚尔比较》,生物统计学,1,80-83,(1945)·doi:10.2307/3001968
[69] Yan L,Dodier R,Mozer MC,Wolniewicz R(2003)通过近似Wilcoxon-Mann-Witney统计优化分类器性能。摘自:第20届机器学习国际会议论文集。AAAI出版社,门罗公园,第848-855页
[70] Yu G,Russell W,Schwartz R,Makhoul J(1990)用于连续语音识别的判别分析和监督矢量量化。摘自:ICASPSP-90,国际声学、语音和信号处理会议,第二卷,第685-688页,皮斯卡塔韦。IEEE,IEEE服务中心
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。