×

利用两两类距离进行序数分类。 (英语) Zbl 1448.91247号

摘要:顺序分类是指由于所研究概念的性质而使类别具有自然顺序的分类问题。一些有序分类方法执行从输入空间到一维(潜在)空间的投影,一维(潜在的)空间被划分为一系列区间(每个类一个区间)。然后根据新输入模式的投影所处的时间间隔来确定其类身份。此投影仅作为整体模型拟合的一部分进行间接训练。与任何其他潜在模型拟合一样,关于潜在模型的所需形式的直接构造提示对于获得高质量模型是非常有用的。这封信的关键思想是直接构建这样一个投影模型,利用从两两距离计算中获得的关于类分布的见解。使用8种标称分类器和序数分类器方法、10个真实世界的序数分类数据集和4个不同的性能度量对该方法进行了广泛评估。当考虑到三个性能指标时,新方法在平均排名中获得了最佳结果,尽管只有一些方法存在显著差异。此外,在观察了潜在空间中的其他内部行为方法后,我们得出结论,内部投影并不能完全反映模式的类内行为。我们的方法本质上简单、直观、易于理解,但与最先进的顺序分类方法相比具有很强的竞争力。

MSC公司:

91E45型 心理学中的测量和表现
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Agresti,A.(1984)。有序分类数据分析。纽约:Wiley·Zbl 0647.62052号
[2] Arens,R.(2010)。使用文档元数据和生物医学领域的主动学习,从用户反馈中学习SVM排名函数。J.Fürnkranz和E.Hüllermier(编辑),《偏好学习》(第363-383页)。纽约:Springer-Verlag,
[3] Asuncion,A.和Newman,D.(2007年)。UCI机器学习库。加利福尼亚州欧文:加利福尼亚大学欧文分校。
[4] Baccianella,S.、Esuli,A.和Sebastiani,F.(2009年)。序数回归的评价方法。第九届智能系统设计与应用国际会议记录(ISDA'09)(第283-287页)。加利福尼亚州圣马特奥:IEEE计算机学会,
[5] Barker,D.(1995)。牧场生产数据集。在线提供时间:网址:http://www.cs.waikato.ac.nz/ml/weka/datasets.html
[6] Cardoso,J.S.和Pinto da Costa,J.F.(2007)。学习对有序数据进行分类:数据复制方法。机器学习研究杂志,81393-1429·Zbl 1222.68157号
[7] Cardoso,J.、Pinto da Costa,J.和Cardoso,M.(2005年)。用SVM模拟顺序关系:应用于乳腺癌保守治疗的客观美学评估。神经网络,18(5-6),808-817,
[8] Cardoso,J.S.和Sousa,R.(2011年)。衡量顺序分类的性能。《国际模式识别与人工智能杂志》,25(8),1173-1195,
[9] Chang,C.-C.和Lin,C.-J.(2011)。LIBSVM:支持向量机库。ACM事务处理。智力。系统。技术。,2, 27:1-27:27. ,
[10] Chu,W.和Ghahramani,Z.(2005)。序数回归的高斯过程。机器学习研究杂志,61019-1041·Zbl 1222.68170号
[11] Chu,W.,&Keerthi,S.S.(2005)。支持向量顺序回归的新方法。《2005年国际机器学习大会:第22届国际机器学习会议记录》(第145-152页)。纽约:ACM,
[12] Chu,W.和Keerthi,S.S.(2007)。支持向量序数回归。神经计算,19(3),792-815·Zbl 1127.68080号
[13] Cortes,C.和Vapnik,V.(1995年)。支持向量网络。机器学习,20(3),273-297·Zbl 0831.68098号
[14] Crammer,K.和Singer,Y.(2001年)。乱搞排名。T.G.Dieterrich、S.Becker和Z.Ghahramani(编辑),《神经信息处理系统的进展》,14(第641-647页)。马萨诸塞州剑桥:麻省理工学院出版社。
[15] Crammer,K.和Singer,Y.(2005年)。通过投影进行在线排名。神经计算,17(1),145-175·Zbl 1093.68138号
[16] Cruz-Ramírez,M.、Hervás-Martínez,C.、sánchez-Monedero,J.和Gutiérrez,P.A.(2011年)。序数度量的初步研究,以指导多目标进化算法。《第十一届智能系统设计与应用国际会议论文集》(ISDA 2011)(第1176-1181页)。加利福尼亚州圣马特奥:IEEE计算机协会,
[17] Demšar,J.(2006)。多个数据集上分类器的统计比较。J.马赫。学习。研究,7,1-30·Zbl 1222.68184号
[18] Fouad,S.,&Tiňo,P.(2012)。用于有序分类的自适应度量学习矢量量化。神经计算,24(11),2825-2851·Zbl 1268.68137号
[19] Frank,E.和Hall,M.(2001)。序数分类的简单方法。《第12届欧洲机器学习会议论文集》(第145-156页)。纽约:Springer-Verlag·Zbl 1007.68529号
[20] 弗里德曼M.(1940)。m排名问题显著性替代测试的比较。数理统计年鉴,11(1),86-92·JFM 66.1305.08标准
[21] Gutiérrez,P.、Salcedo-Sanz,S.、HerváS-Martínez,C.、Carro-Calvo,L.、Sánchez-Monedero,J.和Prieto,L.(2013)。根据天气压力模式对风速进行顺序和标称分类。人工智能的工程应用,26(3),1008-1015,
[22] Hall,M.、Frank,E.、Holmes,G.、Pfahringer,B.、Reutemann,P.和Witten,I.H.(2009)。WEKA数据挖掘软件:更新。知识发现和数据挖掘探索者新闻稿特别兴趣小组,11,10-18。
[23] Herbrich,R.、Graepel,T.和Obermayer,K.(2000)。序数回归的大边距秩边界。A.Smola、P.Bartlett、B.Schölkopf和D.Schurmans(编辑),《大边距分类器的进展》(第115-132页)。马萨诸塞州剑桥:麻省理工学院出版社。
[24] 徐春伟、林春杰(2002)。多类支持向量机方法的比较。IEEE神经网络汇刊,13(2),415-425,
[25] Hühn,J.C.和Hüllermier,E.(2008)。序数类结构在分类器学习中有用吗?国际数据挖掘、建模和管理杂志,1(1),45-67·Zbl 1184.68402号
[26] Kendall,M.G.(1962年)。等级相关法(第三版)。纽约:哈夫纳出版社。
[27] Kibler,D.F.、Aha,D.W.和Albert,M.K.(1989年)。基于实例的实值属性预测。计算智能,5,51,
[28] Kim,K.-J.和Ahn,H.(2012年)。使用多类支持向量机和有序成对划分方法的企业信用评级模型。计算机与运筹学,39(8),1800-1811·Zbl 1251.91068号
[29] Kotsiantis,S.B.和Pintelas,P.E.(2004年)。序数分类问题的成本敏感技术。G.Vouros和T.Panayiotopoulos(编辑),《人工智能的方法和应用》(第220-229页)。柏林:Springer-Verlag·Zbl 1128.68422号
[30] Kramer,S.、Widmer,G.、Pfahringer,B.和de Groeve,M.(2010年)。使用回归树预测序数类。Z.Ras&S.Ohsuga(编辑),《智能系统基础》(第665-674页)。柏林:Springer-Verlag·Zbl 0983.68695号
[31] Li,L.,&Lin,H.-T.(2007)。扩展二进制分类的序数回归。B.Schölkopf、J.Platt和T.Hofmann(编辑),《神经信息处理系统的进展》,19(第865-872页)。马萨诸塞州剑桥:麻省理工学院出版社。
[32] Lim,T.-S.,Loh,W.-Y.,&Shih,Y.-S.(2000年)。比较了33种新旧分类算法的预测精度、复杂度和训练时间。机器学习,40,203-228·Zbl 0969.68669号
[33] Lin,H.-T.,&Li,L.(2012)。从成本敏感的顺序排序减少到加权二进制分类。神经计算,24(5),1329-1367·Zbl 1247.68219号
[34] Mackay,D.J.C.(1994年)。反向传播网络的贝叶斯方法。E.Domany、J.L.van Hemmen和K.Schulten(编辑),《神经网络模型III》(第211-254页)。纽约:Springer-Verlag。
[35] McCullagh,P.(1980)。有序数据的回归模型。英国皇家统计学会杂志,B辑(方法学),42(2),109-142·Zbl 0483.62056号
[36] Neal,R.M.(1996)。神经网络的贝叶斯学习。纽约:Springer-Verlag·Zbl 0888.62021号
[37] Perez-Ortiz,M.、Gutierrez,P.A.、Garcia-Alonso,C.、Salvador-Carulla,L.、Salinas-Perez,J.A.和Hervas-Martinez,C.(2011年)。抑郁症空间流行热点的有序分类。第十一届智能系统设计与应用国际会议(ISDA)论文集(第1170-1175页)。加利福尼亚州圣马特奥:IEEE计算机协会,
[38] Pinto da Costa,J.F.、Alonso,H.和Cardoso,J.S.(2008)。有序数据分类的单峰模型。神经网络,21,78-91·Zbl 1254.68220号
[39] Raykar,V.C.、Duraiswami,R.和Krishnapuram,B.(2008年)。一种从大规模数据集中学习排名函数的快速算法。IEEE模式分析和机器智能汇刊,30,1158-1170,
[40] Sánchez-Monedero,J.、Gutiérrez,P.A.、Fernández-Navarro,F.和HerváS-Martinez,C.(2011)。进化多类分类器的加权有效精度和最小灵敏度。《神经处理快报》,34(2),101-116,
[41] Schölkopf,B.和Smola,A.J.(2001)。使用内核学习:支持向量机、正则化、优化等。马萨诸塞州剑桥:麻省理工学院出版社。
[42] Shashua,A.和Levin,A.(2002年)。大幅度排名原则:两种方法。S.Becker、S.Thrün和K.Obermeyer(编辑),《神经信息处理系统的进展》,15(第937-944页)。马萨诸塞州剑桥:麻省理工学院出版社。
[43] Sonnenburg,D.S.(2011)。机器学习数据集存储库。http://midata.org
[44] Sun,B.-Y.、Li,J.、Wu,D.D.、Zhang,X.-M.和Li,W.-B.(2010)。序数回归的核判别学习。IEEE知识与数据工程汇刊,22(6),906-910,
[45] Vapnik,V.(1999)。统计学习理论概述。IEEE神经网络汇刊,10(5),988-999,
[46] Verwaeren,J.、Waegeman,W.和De Baets,B.(2012年)。使用基于核的比例优势模型学习部分序数类成员关系。计算统计与数据分析,56(4),928-942·Zbl 1243.62096号
[47] Waegeman,W.和Boullart,L.(2009年)。序数回归的加权支持向量机集合。国际计算机系统科学与工程杂志,3(1),47-51。
[48] Waegeman,W.和De Baets,B.(2011年)。基于ROC的序数回归研究综述。J.Fürnkranz和E.Hüllermier(编辑),偏好学习(第127-154页)。柏林:Springer-Verlag·Zbl 1214.68303号
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。