毛里西奥·萨丁勒;雷,京;拉里·瓦瑟曼 误差水平有界的最小模糊集值分类器。 (英语) Zbl 1478.62175号 美国统计协会。 114,编号525,223-234(2019). 小结:在大多数分类任务中,观察结果是模糊的,因此很难正确标记。集值分类器输出似是而非的标签集,从而为模糊实例的标记提供了更合适、更具信息性的处理方法。我们引入了一个多类集值分类框架,其中分类器保证用户定义的覆盖或置信水平(真实标签包含在集合中的概率),同时最小化模糊性(输出的预期大小)。我们首先推导出假设真实分布已知的oracle分类器。我们证明了oracle分类器是从定义每个类的条件概率的函数的水平集中获得的。然后我们发展了具有良好渐近性和有限样本性质的估计量。所建议的估计器基于现有的单标签分类器。最佳分类器有时可以输出空集,但我们提供了两种适合各种实际需要的解决方案来解决此问题。 引用于13文件 MSC公司: 62H30型 分类和区分;聚类分析(统计方面) 关键词:模糊观测;贝叶斯分类器;多类别分类;非确定性分类器;oracle分类器;拒绝选项 软件:UCI-毫升;ML-KNN公司 PDF格式BibTeX公司 XML格式引用 \textit{M.Sadile}et al.,J.Am.Stat.Assoc.114,No.525,223--234(2019;Zbl 1478.62175) 全文: 内政部 arXiv公司 参考文献: [1] 奥迪伯特,J.-Y。;Tsybakov,A.B.,插件分类器的快速学习率,《统计年鉴》,35,608-633(2007)·Zbl 1118.62041号 [2] Bartlett,P.L。;Wegkamp,M.H.,使用铰链损失的拒绝选项分类,机器学习研究杂志,91823-1840(2008)·兹比尔1225.62080 [3] Chow,C.K.,《关于最佳识别错误和拒绝权衡》,IEEE信息理论汇刊,16,41-46(1970)·Zbl 0185.47804号 [4] Del Coz,J.J。;Diez,J。;Bahamonde,A.,《学习非确定性分类器》,机器学习研究杂志,102273-2293(2009)·Zbl 1235.68144号 [5] 丹尼斯,C。;Hebiri,M.,半监督学习中用于分类的插入置信集的一致性,arXiv:150707235(2015) [6] Devroye,L.,最近邻回归函数估计的一致收敛性及其在优化中的应用,IEEE信息理论汇刊,24142-151(1978)·Zbl 0375.62083号 [7] Grycko,E.,《具有集值决策函数的分类、信息和分类》,《分类研究、数据分析和知识组织》,218-224(1993),海德堡:斯普林格 [8] 赫贝,R。;Wegkamp,M.H.,《拒绝选项分类》,《加拿大统计杂志》,34,709-721(2006)·Zbl 1151.62302号 [9] 乐村,Y。;Boser,B。;Denker,J.S。;亨德森·D·。;霍华德·R·E。;Hubbard,W。;Jackel,L.D.,用反向传播网络进行手写数字识别,神经信息处理系统的进展2。1989年会议记录,396-404(1990) [10] Lei,J.,《信心分类》,《生物特征》,101755-769(2014)·Zbl 1306.62143号 [11] Lei,J。;里纳尔多,A。;Wasserman,L.,《探索功能数据的保角预测方法》,《数学与人工智能年鉴》,74,29-43(2014)·Zbl 1317.62039号 [12] Lei,J。;罗宾斯,J。;Wasserman,L.,无分布预测集,《美国统计协会杂志》,108,278-287(2013)·Zbl 06158342号 [13] Lei,J。;Wasserman,L.,《非参数回归的无分布预测带》,《皇家统计学会杂志》,7671-96(2014)·Zbl 1411.62103号 [14] Lichman,M.,UCI机器学习库(2013) [15] 帕帕佐普洛斯,H。;普罗德罗,K。;沃夫克,V。;Gammerman,A.,回归的归纳置信机器,机器学习:ECML 2002,345-356(2002),Springer·Zbl 1014.68514号 [16] 拉马斯瓦米,H.G。;Tewari,A。;Agarwal,S.,带拒绝选项的多类分类一致算法,《电子统计杂志》,第12期,第530-554页(2018年)·兹比尔1473.62229 [17] 谢弗,G。;Vovk,V.,《保角预测教程》,《机器学习研究杂志》,9,371-421(2008)·Zbl 1225.68215号 [18] Silverman,B.W.,《统计和数据分析密度估计》,26(1986),佛罗里达州博卡拉顿:CRC出版社,佛罗里达州波卡拉顿·Zbl 0617.62042号 [19] Stone,C.,非参数回归的最优全局收敛速度,统计年鉴,101040-1053(1982)·Zbl 0511.62048号 [20] Tsoumakas,G。;Katakis,I.,《多标签分类:概述》,《国际数据仓库与挖掘杂志》,3,1-13(2007) [21] Tsybakov,A.B.,《非参数估计导论》(2009),纽约:Springer,纽约·Zbl 1176.62032号 [22] Van De Geer,S.A.,《高维广义线性模型和拉索》,《统计年鉴》,36614-645(2008)·Zbl 1138.62323号 [23] Vovk,V.,归纳共形预测的条件有效性,机器学习,92349-376(2013)·Zbl 1273.68307号 [24] 沃夫克,V。;费多罗娃,V。;努列丁诺夫,I。;Gammerman,A.,保角预测效率标准,《2016年COPA会议录》(第五届保角和概率预测及应用研讨会),23-39(2016) [25] 沃夫克,V。;Gammerman,A。;Shafer,G.,《随机世界中的算法学习》(2005),纽约:Springer,纽约·Zbl 1105.68052号 [26] 沃夫克,V。;佩特伊,I。;Fedorova,V.,《从保角预测到概率预测》,COPA 2014年论文集,人工智能应用与创新,221-230(2014) [27] 袁,M。;Wegkamp,M.,基于凸风险最小化的拒绝选项分类方法,机器学习研究杂志,11,111-130(2010)·Zbl 1242.62066号 [28] 张,M.L。;Zhou,Z.H.,Ml-knn:多标签学习的懒惰学习方法,模式识别,402038-2048(2007)·Zbl 1111.68629号 此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。