×

误差水平有界的最小模糊集值分类器。 (英语) Zbl 1478.62175号

小结:在大多数分类任务中,观察结果是模糊的,因此很难正确标记。集值分类器输出似是而非的标签集,从而为模糊实例的标记提供了更合适、更具信息性的处理方法。我们引入了一个多类集值分类框架,其中分类器保证用户定义的覆盖或置信水平(真实标签包含在集合中的概率),同时最小化模糊性(输出的预期大小)。我们首先推导出假设真实分布已知的oracle分类器。我们证明了oracle分类器是从定义每个类的条件概率的函数的水平集中获得的。然后我们发展了具有良好渐近性和有限样本性质的估计量。所建议的估计器基于现有的单标签分类器。最佳分类器有时可以输出空集,但我们提供了两种适合各种实际需要的解决方案来解决此问题。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 奥迪伯特,J.-Y。;Tsybakov,A.B.,插件分类器的快速学习率,《统计年鉴》,35,608-633(2007)·Zbl 1118.62041号
[2] Bartlett,P.L。;Wegkamp,M.H.,使用铰链损失的拒绝选项分类,机器学习研究杂志,91823-1840(2008)·兹比尔1225.62080
[3] Chow,C.K.,《关于最佳识别错误和拒绝权衡》,IEEE信息理论汇刊,16,41-46(1970)·Zbl 0185.47804号
[4] Del Coz,J.J。;Diez,J。;Bahamonde,A.,《学习非确定性分类器》,机器学习研究杂志,102273-2293(2009)·Zbl 1235.68144号
[5] 丹尼斯,C。;Hebiri,M.,半监督学习中用于分类的插入置信集的一致性,arXiv:150707235(2015)
[6] Devroye,L.,最近邻回归函数估计的一致收敛性及其在优化中的应用,IEEE信息理论汇刊,24142-151(1978)·Zbl 0375.62083号
[7] Grycko,E.,《具有集值决策函数的分类、信息和分类》,《分类研究、数据分析和知识组织》,218-224(1993),海德堡:斯普林格
[8] 赫贝,R。;Wegkamp,M.H.,《拒绝选项分类》,《加拿大统计杂志》,34,709-721(2006)·Zbl 1151.62302号
[9] 乐村,Y。;Boser,B。;Denker,J.S。;亨德森·D·。;霍华德·R·E。;Hubbard,W。;Jackel,L.D.,用反向传播网络进行手写数字识别,神经信息处理系统的进展2。1989年会议记录,396-404(1990)
[10] Lei,J.,《信心分类》,《生物特征》,101755-769(2014)·Zbl 1306.62143号
[11] Lei,J。;里纳尔多,A。;Wasserman,L.,《探索功能数据的保角预测方法》,《数学与人工智能年鉴》,74,29-43(2014)·Zbl 1317.62039号
[12] Lei,J。;罗宾斯,J。;Wasserman,L.,无分布预测集,《美国统计协会杂志》,108,278-287(2013)·Zbl 06158342号
[13] Lei,J。;Wasserman,L.,《非参数回归的无分布预测带》,《皇家统计学会杂志》,7671-96(2014)·Zbl 1411.62103号
[14] Lichman,M.,UCI机器学习库(2013)
[15] 帕帕佐普洛斯,H。;普罗德罗,K。;沃夫克,V。;Gammerman,A.,回归的归纳置信机器,机器学习:ECML 2002,345-356(2002),Springer·Zbl 1014.68514号
[16] 拉马斯瓦米,H.G。;Tewari,A。;Agarwal,S.,带拒绝选项的多类分类一致算法,《电子统计杂志》,第12期,第530-554页(2018年)·兹比尔1473.62229
[17] 谢弗,G。;Vovk,V.,《保角预测教程》,《机器学习研究杂志》,9,371-421(2008)·Zbl 1225.68215号
[18] Silverman,B.W.,《统计和数据分析密度估计》,26(1986),佛罗里达州博卡拉顿:CRC出版社,佛罗里达州波卡拉顿·Zbl 0617.62042号
[19] Stone,C.,非参数回归的最优全局收敛速度,统计年鉴,101040-1053(1982)·Zbl 0511.62048号
[20] Tsoumakas,G。;Katakis,I.,《多标签分类:概述》,《国际数据仓库与挖掘杂志》,3,1-13(2007)
[21] Tsybakov,A.B.,《非参数估计导论》(2009),纽约:Springer,纽约·Zbl 1176.62032号
[22] Van De Geer,S.A.,《高维广义线性模型和拉索》,《统计年鉴》,36614-645(2008)·Zbl 1138.62323号
[23] Vovk,V.,归纳共形预测的条件有效性,机器学习,92349-376(2013)·Zbl 1273.68307号
[24] 沃夫克,V。;费多罗娃,V。;努列丁诺夫,I。;Gammerman,A.,保角预测效率标准,《2016年COPA会议录》(第五届保角和概率预测及应用研讨会),23-39(2016)
[25] 沃夫克,V。;Gammerman,A。;Shafer,G.,《随机世界中的算法学习》(2005),纽约:Springer,纽约·Zbl 1105.68052号
[26] 沃夫克,V。;佩特伊,I。;Fedorova,V.,《从保角预测到概率预测》,COPA 2014年论文集,人工智能应用与创新,221-230(2014)
[27] 袁,M。;Wegkamp,M.,基于凸风险最小化的拒绝选项分类方法,机器学习研究杂志,11,111-130(2010)·Zbl 1242.62066号
[28] 张,M.L。;Zhou,Z.H.,Ml-knn:多标签学习的懒惰学习方法,模式识别,402038-2048(2007)·Zbl 1111.68629号
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。