×

外推大型多类问题的预期精度。 (英语) Zbl 1407.68422号

摘要:多类分类的难度通常随着类数的增加而增加。使用一小部分类的数据,我们可以预测分类器随着类数的增加而扩展的程度吗?我们提出了一个研究这个问题的框架,假设两个集合中的类都是从相同的人群中采样的,并且分类器基于独立学习的评分函数。在这个框架下,我们可以将一组(k)类的分类精度表示为判别函数的(k-1)阶矩;判别函数本身不依赖于\(k)。我们利用这一结果为判别函数开发了一个非参数回归估计量,它可以将精度结果外推到更大的未观测集。我们还形式化了一种替代方法,该方法分别为每个类推断准确性,并确定两种方法之间的权衡。我们表明,这两种方法都可以准确预测分类器上的性能在模拟以及真实的人脸识别或字符识别任务中,标签设置的大小是原始集的十倍。

MSC公司:

68T05型 人工智能中的学习和自适应系统
62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: arXiv公司 链接

参考文献:

[1] 费利克斯·阿布拉莫维奇和玛丽安娜·彭斯基。可能有大量类的高维法向量的特征选择和分类。arXiv预印本arXiv:1506.015672015。
[2] 拉凯什·阿坎塔和特雷弗·哈斯蒂。使用深度学习的泰卢固语OCR框架。arXiv预印arXiv:1509.059622015。
[3] Brandon Amos、Bartosz Ludwiczuk和Mahadev Satyanarayanan。Openface:带有移动应用程序的通用人脸识别库。技术报告,CMU-CS16-118,CMU计算机科学学院,2016年。
[4] Ricardo Cao、Antonio Cuevas和Wensceslao Gonz´alez Manteiga。密度估计中几种平滑方法的比较研究。计算统计与数据分析,17(2):153-1761994·Zbl 0937.62518号
[5] Koby Crammer和Yoram Singer。关于基于核的多类向量机的算法实现。机器学习研究杂志,2(12月):265-2922001·Zbl 1037.68110号
[6] 贾斯汀·戴维斯(Justin Davis)、玛丽安娜·彭斯基(Marianna Pensky)和威廉·克兰普顿(William Crampton)。贝叶斯特征选择用于可能包含大量类的分类。《统计规划与推断杂志》,141(9):3256-32662011·Zbl 1216.62037号
[7] 贾登、亚历山大·贝尔格、凯丽和李飞飞。对10000多个图像类别进行分类告诉了我们什么?在欧洲计算机视觉会议上,第71-84页。施普林格,2010年。
[8] Jeff Donahue、Yangqing Jia、Oriol Vinyals、Judy Hoffman、Ning Zhang、Eric Tzeng和Trevor Darrell。Decaf:用于一般视觉识别的深度卷积激活功能。2014年,在机器学习国际会议上,第647-655页。28
[9] 皮纳尔·迪古鲁(Pinar Duygulu)、科布斯·巴纳德(Kobus Barnard)、若昂·福格·德·弗雷塔斯(Joao FG de Freitas)和大卫·A·福赛斯(David A Forsyth)。作为机器翻译的对象识别:学习固定图像词汇的词汇。在欧洲计算机视觉会议上,第97-112页。斯普林格,2002年·Zbl 1039.68623号
[10] 格雷戈里·格里芬(Gregory Griffin)、亚历克斯·霍卢布(Alex Holub)和彼得罗·佩罗纳(Pietro Perona)。Caltech-256对象类别数据集。2007
[11] 玛雅·R·古普塔(Maya R Gupta)、萨米·本吉奥(Samy Bengio)和杰森·韦斯顿(Jason Weston)。训练高度多类分类器。机器学习研究杂志,15(1):1461-14922014·Zbl 1318.68143号
[12] Gary B.Huang、Manu Ramesh、Tamara Berg和Erik Learnd-Miller。野外标记人脸:一个用于研究无约束环境中人脸识别的数据库。《技术报告07-49》,马萨诸塞大学阿默斯特分校,2007年10月。
[13] 肯德里克·恩·凯(Kendrick N Kay)、托马斯·纳塞拉里斯(Thomas Naselaris)、瑞安·普伦格(Ryan J Prenger)和杰克·加兰特(Jack L Gallant)。从人类大脑活动中识别自然图像。《自然》,452(3月):352-3552008。
[14] Yoonkyung Lee、Yi Lin和Grace Wahba。多类别支持向量机:微阵列数据和卫星辐射数据分类的理论和应用。《美国统计协会杂志》,99(465):67-812004·Zbl 1089.62511号
[15] 马克西姆·奥夸布(Maxime Oquab)、莱昂·博图(Leon Bottou)、伊万·拉普特夫(Ivan Laptev)和约瑟夫·西维奇(Josef Sivic)。使用卷积神经网络学习和传输中级图像表示。《IEEE计算机视觉和模式识别会议论文集》,第1717-1724页,2014年。
[16] 潘睿,王汉生,李润泽。基于两两确定独立筛选的超高维多类线性判别分析。《美国统计协会杂志》,111(513):169-1792016。
[17] 潘嘉麟和杨强。关于迁移学习的调查。IEEE知识与数据工程汇刊,22(10):1345-13592010。
[18] 弗朗西斯科·佩雷拉(Francisco Pereira)、宾·卢(Bin Lou)、布里安娜·普里切特(Brianna Pritchett)、塞缪尔·里特(Samuel Ritter)、塞穆尔·杰什曼(Samuell J Gershman)、南希·坎维舍(Nancy Kanwisher)、。从大脑激活走向语言意义的通用解码。《自然通讯》,9(1):9632018年。
[19] 大卫·W·斯科特。多元密度估计:理论、实践和可视化。威利,1992年·Zbl 0850.62006号
[20] 克劳德·沙农(Claude E.Shannon)。传播数学理论。贝尔系统技术期刊,27(3):379-4231948·Zbl 1154.94303号
[21] Ali Sharif Razavian、Hossein Azizpour、Josephine Sullivan和Stefan Carlsson。美国有线电视新闻网(CNN)的特色是:一个令人震惊的识别基线。《IEEE计算机视觉和模式识别研讨会会议记录》,第806-813页,2014年。
[22] 埃夫斯塔蒂奥斯·斯塔马塔托斯(Efstathios Stamatatos)、沃尔特·戴尔曼斯(Walter Daelemans)、本·维霍芬(Ben Verhoeven)、帕特里克·朱奥拉(Patrick Juola)、奥雷里奥·欧佩兹·欧佩兹(Aurelio L´opezL´opez)、马丁·。2014年PAN作者识别任务概述。在CLEF(工作说明)中,第877-897页,2014年。
[23] 罗伯托·托涅里和丹尼尔·普莱拉。说话人识别概述:准确性和稳健性问题。IEEE电路与系统杂志,11(2):23-612011。29
[24] 杰森·韦斯顿和克里斯·沃特金斯。支持向量机进行多类模式识别。在ESANN,第99卷,第219-224页,1999年。
[25] Wing H Wong和Li Ma。可选P’olya树和贝叶斯推断。《统计年鉴》,38(3):1433-14592010·Zbl 1189.62048号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。