×

两两多类分类中二分排序的及物性分析。 (英语) 兹比尔1204.62103

摘要:统计和机器学习中的许多多类分类算法通常将几个二进制分类器组合在一起,以构建一个整体分类器。在流行的成对组合中,为每对类构建一个分类器,从而实现成对二分排名。相反,序数回归算法考虑几个有序类的单个排名函数。在文献中已知,成对集合可以用于有序回归。然而,单等级模型能对多类别分类做出贡献吗?这一问题的答案应该是肯定的,这一点得到了本文提出的理论结果的支持。
我们对成对二分排名的一致性进行了形式化分析,揭示了在何种条件下可以用单个排名等效地表示它们。与成对偏好关系的效用可表示性类似,传递性在成对二分排名的排名可表示性表征中起着至关重要的作用。为此,我们引入了严格排序代表性的新概念,一个易于验证的限制条件,以及接收机工作特性曲线(AUC)排序代表性下的面积,这是一个更难验证的实用条件。然而,成对二分排名和骰子游戏之间的联系允许我们为AUC排名代表性制定必要的及物性条件。另一方面,通过引入一种新的传递性,得到了一个充分条件,这种传递性可以通过求解一个整数二次规划来验证。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
62小时86 多元分析与模糊性
65立方厘米60 统计学中的计算问题(MSC2010)
62G99型 非参数推理

软件:

截止2001年
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] 阿加瓦尔,S。;Graepel,T。;Herbrich,R。;Har-Peled,S。;Roth,D.,ROC曲线下面积的概化界限,机器学习研究杂志,6393-425(2005)·Zbl 1222.68129号
[2] Billot,A.,模糊效用函数的一个存在定理:一个新的初等证明,模糊集与系统,74271-276(1995)·兹比尔0858.90014
[3] 楚·W。;Keerthi,S.,支持向量顺序回归,神经计算,19,3,792-815(2007)·Zbl 1127.68080号
[4] 科尔特斯,C。;Mohri,M.,(AUC优化vs.错误率最小化。AUC优化VS.错误率最小,神经信息处理系统进展,第16卷(2003),麻省理工学院出版社:加拿大温哥华麻省理学院出版社)
[5] Dasgupta,M。;Deb,R.,传递性与模糊偏好,《社会选择与福利》,第13期,第305-318页(1996年)·Zbl 1075.91526号
[6] De Baets,B。;De Meyer,H.,关于T传递闭包的存在和构造,信息科学,152167-192(2003)·Zbl 1040.03039号
[7] De Baets,B。;De Meyer,H.,互易关系的传递性框架:循环传递性与FG传递性,模糊集与系统,152249-270(2005)·Zbl 1114.91031号
[9] De Baets,B。;De Meyer,H。;De Schuymer,B。;Jenei,S.,互惠关系及物性的循环评价,《社会选择与福利》,26,217-238(2006)·Zbl 1158.91338号
[10] De Meyer,H。;De Baets,B。;De Schuymer,B.,《关于随机变量的共单调和反单调比较的传递性》,《多变量分析杂志》,98177-193(2007)·Zbl 1114.60018号
[11] De Schuymer,B。;De Meyer,H。;De Baets,B.,独立随机变量的循环传递比较,多元分析杂志,96,352-373(2005)·Zbl 1087.60018号
[12] De Schuymer,B。;De Meyer,H。;De Baets,B.,《极端连接词与有序列表的比较》,《理论与决策》,62195-217(2007)·Zbl 1115.60019号
[13] De Schuymer,B。;De Meyer,H。;De Baets,B。;Jenei,S.,关于骰子模型的循环传递性,理论与决策,54,261-285(2003)·Zbl 1075.60011号
[14] Di Nola,A。;科洛德齐耶奇克(Kolodziejczyk,W.)。;Sessa,S.,模糊互反矩阵幂的收敛,信息科学,75,99-107(1995)·Zbl 0803.15014号
[15] 迪亚兹,S。;加西亚·拉普雷斯塔,J。;Montes,S.,有限序数尺度上互惠偏好传递性的一致模型,信息科学,178,13,2832-2848(2008)·Zbl 1152.91402号
[16] Doignon,J。;Monjardet,B。;鲁本斯,M。;芬克,P。;家庭、生物秩序、价值关系和偏好建模,《数学心理学杂志》,30435-480(1986)·兹比尔0612.92020
[17] Fawcett,T.,ROC分析简介,模式识别快报,27,8,861-874(2006)
[20] Fishburn,P.,《决策的效用理论》(1970),威利·Zbl 0213.46202号
[23] Fono,L。;Andjiga,N.,max-*-传递性下可数集上模糊偏好的效用函数,社会选择与福利,28667-683(2007)·Zbl 1180.91122号
[24] Fürnkranz,J.,《循环分类》,《机器学习研究杂志》,2723-747(2002)·Zbl 1033.68086号
[25] Fürnkranz,J。;Hüllermier,E。;Vanderlooy,S.,多部分排名的二进制分解方法,计算机科学讲义,5781359-374(2009)
[26] 手,D。;Till,R.,多类问题ROC曲线下面积的简单推广,机器学习,45171-186(2001)·Zbl 1007.68180号
[27] Hanley,J。;McNeil,B.,接收器工作特性曲线下面积的含义和使用,放射学,143,29-36(1982)
[28] 哈斯蒂,T。;Tibshirani,R.,《两两耦合分类》,《统计年鉴》,26,2,451-471(1998)·兹比尔0932.62071
[29] Herbrich,R。;Graepel,T。;Obermayer,K.,《有序回归的大边距秩界》(Smola,A.;Bartlett,P.;Schölkopf,B.;Schurmans,D.,《大边距分类器的进展》(2000),麻省理工出版社)·Zbl 0988.68145号
[31] Hüllermier,E。;Hühn,J.,序数类结构在分类器学习中有用吗?,国际数据挖掘、建模和管理杂志,1,1,45-67(2009)·Zbl 1184.68402号
[32] Hüllermier,E。;Vanderlooy,S.,《组合成对分类中的预测:最优自适应投票策略及其与加权投票的关系》,模式识别,43,129-142(2010)·Zbl 1191.68578号
[33] Kahn,A.,大型网络的拓扑排序,ACM的通信,558-562(1962)·Zbl 0106.32602号
[34] Koppen,M.,二元选择概率的随机效用表示:产生临界必要条件的临界图,《数学心理学杂志》,39,21-39(1995)·Zbl 0897.92045号
[35] Krzysko,M。;Wolynski,W.,成对分类的新变体,《欧洲运筹学杂志》,199,512-519(2009)·Zbl 1176.90380号
[36] 卢斯,R。;Suppes,P.,《数学心理学手册》。数学心理学手册,第章。偏好、效用和主观概率(1965),威利
[37] 奥兹蒂尔克,M。;Tsoukiás,A。;Vinke,P.,《偏好建模》(Figueira,J.;Greco,S.;Ehrgott,M.,《多标准决策分析》,《现状调查》(2005),施普林格-弗拉格出版社),27-71·Zbl 1072.90018号
[38] Provost,F。;Fawcett,T.,不精确环境的鲁棒分类,机器学习,42203-231(2001)·Zbl 0969.68126号
[39] Schrijver,A.,组合优化(2003),Springer·Zbl 0542.90067号
[40] Switalski,Z.,模糊互惠偏好矩阵的一般传递性条件,模糊集与系统,137,85-100(2003)·Zbl 1052.91033号
[41] 托拉,V。;多明戈·费勒,J。;Mateo-Sanz,J。;Ng,M.,无基本连续变量序数变量的回归,信息科学,176465-476(2006)
[42] Tversky,A.,《偏好、信念与相似性》(1998),麻省理工学院出版社
[43] Waegeman,W。;De Baets,B。;Boullart,L.,《使用结构化支持向量机学习分层排序函数》,神经网络,21,10,1511-1523(2008)·Zbl 1254.68190号
[44] Waegeman,W。;De Baets,B。;Boullart,L.,序数回归学习中的ROC分析,《模式识别快报》,29,1-9(2008)
[45] Wu,F。;林,C。;Weng,R.,通过两两耦合对多类支持向量机进行概率估计,机器学习研究杂志,5,975-1005(2004)·Zbl 1222.68336号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。