×

兹马思-数学第一资源

盲人引导下的无知:一种用于细粒度分类的人机混合视觉系统。(英语) Zbl 1328.68237号
摘要:我们提出了一个用于细粒度视觉分类的视觉识别系统。该系统由一个人和一个机器共同工作,结合了计算机视觉算法和(非专家)人类用户的互补优势。人类用户提供了两种不同形式的信息对象部分点击和选择题的答案。该机器智能地选择信息量最大的问题向用户提出,以便尽快识别对象类。通过利用计算机视觉和分析用户的反应,所需的人力资源总量(以秒为单位)被最小化。我们的形式展示了如何将许多不同类型的计算机视觉算法整合到人在回路框架中,包括标准的多类方法、基于零件的方法以及局部的多类和属性方法。我们通过建立鸟类识别现场指南来探索我们的想法。实验结果表明,将无知的人类和弱视的机器结合起来的优势,混合系统在包含200种鸟类的数据集上实现了快速准确的鸟类识别。

理学硕士:
68T45型 机器视觉与场景理解
68吨10 模式识别,语音识别
62小时30分 分类和区分;聚类分析(统计方面)
PDF格式 BibTeX公司 XML 引用
全文: 内政部
参考文献:
[1] Belhumer,P.,Chen,D.,Feiner,S.,Jacobs,D.,Kress,W.,Ling,H.,Lopez,I.,Ramamoorthi,R.,Sheorey,S.,White,S.&Zhang,L.(2008年)。搜寻世界上的植物标本。在ECCV。
[2] 贝格,T.&Belhumer,P.N.(2013年)。Poof:Part-based one-vs-one特征,用于细粒度分类、人脸验证和属性估计。在CVPR中。
[3] Biederman,I.,Subramaniam,S.,Bar,M.,Kalocsai,P.,&Fiser,J.(1999年)。重新检查了下级对象分类。心理学研究,63(2-3),131-153。
[4] 博尔德夫,L.&Malik,J.(2009年)。Poselets:使用3d注释训练的身体部位探测器。在ICCV中。
[5] 布兰森,S.,佩罗纳,P.&Belongie,S.(2011年)。强监督,弱注解。在ICCV中。
[6] Branson,S.,Wah,C.,Schroff,F.,Babenko,B.,Welinder,P.,Perona,P.&Belongie,S.(2010年)。人在回路中的视觉识别。在ECCV。
[7] Chai,Y.,Lempitsky,V.&Zisserman,A.(2011年)。Bicos:一种双层共分割方法。ICCV中。
[8] Chai,Y.,Lempitsky,V.&Zisserman,A.(2013年)。共生分割和局部定位在细粒度分类中的应用。在ICCV中。
[9] Chai,Y.,Rahtu,E.,Lempitsky,V.,Van Gool,L.&Zisserman,A.(2012年)。特里科斯。在ECCV。
[10] Cox,I.J.,Miller,M.L.,Minka,T.P.,Papathomas,T.V.&Yianilos,P.N.(2000年)。贝叶斯图像检索系统,pichunter:理论,实现和心理物理实验。图像处理。
[11] 多纳休,J.&Grauman,K.(2011年)。视觉识别的注释原理。在ICCV中。
[12] Douze,M.,Ramisa,A.&施密德,C.(2011年)。结合属性和fisher向量进行有效的图像检索。在CVPR中。
[13] Duan,K.,Parikh,D.,Crandall,D.&Grauman,K.(2012年)。发现用于细粒度识别的本地化属性。在CVPR中。
[14] Fang,Y.&Geman,D.(2005年)。心理人脸检索实验。在AVBPA中。
[15] Farhadi,A.,Endres,I.&霍伊姆,D.(2010年)。用于泛化的中心属性识别。在CVPR中。
[16] Farhadi,A.,Endres,I.,霍伊姆,D.&Forsyth,D.(2009年)。用属性描述对象。在CVPR中。
[17] Farrell,R.,Oza,O.,Zhang,N.,Morariu,V.,Darrell,T.&戴维斯,L.(2011年)。小鸟。在ICCV中。
[18] 费尔岑斯瓦尔布,P.&Huttenlocher,D.(2002年)。图像结构的有效匹配。在CVPR中。
[19] Felzenszwalb,P.,McAllester,D.&Ramanan,D.(2008年)。一个有区别的训练,多尺度,可变形的零件模型。在CVPR中。
[二十] 费雷卡图,M.&Geman,D.(2007年)。心理匹配的交互式搜索。在ICCV中。
[21] 费雷卡图,M.&Geman,D.(2009年)。一个从心理图像中搜索图像类别的统计框架。在帕米。
[22] Gavves,E.,Fernando,B.,Snoek,C.,Smeulders,A.&Tuytelaars,T.(2013年)。通过对齐进行细粒度分类。在ICCV中。
[23] 杰曼,D.&Jedynak,B.(1993年)。形状识别和20个问题。沃兹沃斯。
[24] 杰曼,D.&Jedynak,B.(1996年)。卫星图像中道路跟踪的主动测试模型。在帕米。
[25] Jedynak,B.,Frazier,P.I.,&Sznitman,R.(2012年)。噪声的二十个问题:熵损失的Bayes最优策略。应用概率杂志,49(1),114-136·13162018.1升
[26] 科斯拉,A.,Jayadevaprakash,N.,Yao,B.&Li,F.F.(2011年)。fgvc的新数据集:斯坦福狗。圣地亚哥:关于FGVC的CVPR研讨会。
[27] Kumar,N.,Belhumer,P.,比斯瓦,A.,雅各布,D.,克雷斯,W.,洛佩兹,I.&Soares,J.(2012年)。Leafsnap:一个用于植物物种自动识别的计算机视觉系统。在ECCV。
[28] Kumar,N.,Belhumer,P.&Nayar,S.(2008年)。Facetracer:一个搜索引擎,用于搜索包含人脸的大量图像。在ECCV。
[29] Kumar,N.,Berg,A.C.,Belhumer,P.N.&Nayar,S.K.(2009年)。用于人脸验证的属性分类器和明喻分类器。在ICCV中。
[30] 兰伯特,C.,尼克什,H.&Harmeling,S.(2009年)。学习检测看不见的对象类。在CVPR中。
[31] Larios,N.,Soran,B.,Shapiro,L.G.,Martinez Munoz,G.,Lin,J.&Dieterich,T.G.(2010年)。基于Haar随机森林特征和svm空间匹配核的石蝇物种识别。在ICPR中。
[32] Lazebnik,S.,Schmid,C.&Ponce,J.(2005年)。基于最大熵的零件纹理和目标识别框架。在ICCV中。
[33] Levin,A.,Lischinski,D.&韦斯,Y.(2007年)。自然图像抠图的封闭形式解决方案。帕米。
[34] Liu,J.,金泽,A.,Jacobs,D.&Belhumer,P.(2012年)。利用局部定位进行犬种分类。在ECCV。
[35] 卢,Y.,胡,C.,朱,X.,张,H.&Yang,Q.(2000年)。图像检索系统中基于语义和特征的相关反馈统一框架。在ACM多媒体中。
[36] Maji,S.(2012年)。发现部分和属性的词典。在ECCV部件和属性中。
[37] 马吉,S.&Shakhnarovich,G.(2012年)。通过成对对应的零件注释。在人工智能研讨会上。
[38] Martınez Munoz等人(2009年)。非常相似对象的无词典分类。在CVPR中。
[39] Mervis,C.B.,&Crisafi,文学硕士(1982年)。下级、基本和上级类别的获取顺序。儿童发展,53(1),256-266。
[40] 尼尔斯巴克,M.&Zisserman,A.(2008年)。自动花卉分类。在ICVGIP中。
[41] 尼尔斯巴克,M.E.&Zisserman,A.(2006年)。花卉分类的视觉词汇。在CVPR中。
[42] Ott,P.&Everingham,M.(2011年)。基于可变形零件模型的共享零件。在CVPR中。
[43] 帕里克,D.&Grauman,K.(2011年)。交互式地构建属性词汇表。在CVPR中。
[44] 帕里克,D.&Grauman,K.(2011年)。相对属性。ICCV中。
[45] 帕里克,D.&Grauman,K.(2013年)。隐含反馈:学习图像搜索中用户行为的细微差别。在ICCV中。
[46] 帕里克,D.&Zitnick,C.L.(2011年a)。找出人体探测器中最薄弱的环节。在CVPR中。
[47] 帕里克,D.&Zitnick,C.L.(2011年b)。机器的人工调试。在人群的智慧中。
[48] 帕克什,A.&Parikh,D.(2012年)。分类器反馈的属性。在ECCV。
[49] 帕基,O.,韦达尔迪,A.,齐瑟曼,A.&Jawahar,C.(2012年)。猫和狗。在CVPR中。
[50] Parkhi,O.M.,Vedaldi,A.,Jawahar,C.&Zisserman,A.(2011年)。关于猫和狗的真相。在ICCV中。
[51] 佩罗宁,F.,桑切斯,J.&Mensink,T.(2010年)。改进了fisher核。在ECCV。
[52] 普拉特,J.C.(1999年)。支持向量机的概率输出。阿尔蒙。
[53] 昆兰,J.R.(1993年)。补体第四成份。5: 机器学习程序。伯灵顿:摩根考夫曼。
[54] Rasiwasia,N.,Moreno,P.J.&Vasconcelos,N.(2007年)。弥合鸿沟:语义示例查询。在多媒体中。
[55] Rosch,E.(1999年)。分类原则。概念:核心阅读。
[56] Rosch,E.,Mervis,C.B.&Gray,W.D.,Johnson,D.M.,Boyes Braem,P.(1976年)。自然范畴中的基本对象。认知心理学。
[57] Rother,C.,Kolmogorov,V.&布莱克,A.(2004年)。Grabcut:交互式前景提取。穿上衣。
[58] Settles,B.(2008年)。好奇的机器:使用结构化实例进行主动学习。
[59] 斯塔克,M.,克劳斯,J.,佩皮克,B.,梅格,D.,利特尔,J.J.,斯基尔,B.&Koller,D.(2012年)。用于三维场景理解的细粒度分类。在BMVC中。
[60] Sznitman,R.,巴苏,A.,Richa,R.,Handa,J.,Gehlbach,P.,Taylor,R.H.,Jedynak,B.&Hager,G.D.(2011年)。视网膜显微手术中的统一检测与跟踪。在麦凯。
[61] Sznitman,R.&Jedynak,B.(2010年)。用于人脸检测和定位的主动测试。在帕米。
[62] Tsiligkaridis,T.,萨德勒,B.&Hero,A.(2013年)。一个人机交互的20问题协同目标搜索模型。在ICASSP中·Zbl 1360.94116
[63] Tsochantaridis,I.,Joachims,T.,Hofmann,T.&奥尔顿,Y.(2006年)。结构化和相互依赖的输出变量的大边际法。在JMLR·68ZB321.2升
[64] Vijayanarasimhan,S.&Grauman,K.(2009年)。你要花多少钱?在CVPR中·Zbl 1235.68296
〔65〕 Vijayanarasimhan,S.&Grauman,K.(2011年)。大规模的现场主动学习。在CVPR中·Zbl 1235.68296
[66] Vondrick,C.&Ramanan,D.(2011年)。具有主动学习功能的视频注释和跟踪。在夹缝里。
[67] 沃德里克,C.,拉马南,D.&Patterson,D.(2010年)。高效地放大视频注释。在ECCV。
[68] 华,C.,布兰森,S.,佩罗纳,P.&Belongie,S.(2011年)。多类识别和零件定位与人在回路。在ICCV中。
〔69〕 华,C.,布兰森,S.,韦林德,P.,佩罗纳,P.&Belongie,S.(2011年)。加州理工大学UCSD Birds-200-2011数据集。技术代表CNS-TR-2011-001,帕萨迪纳:加州理工大学。
[70] Wang,G.&Forsyth,D.(2009年)。视觉属性、对象类的联合学习。在ICCV中。
[71] 王安杰,王安杰;Everingham,M.(2009年)。从自然语言描述中识别物体的学习模型。在BMVC中。
[72] Wu,W.&Yang,J.(2006年)。SmartLabel:一种对象标记工具。在多媒体中。
[73] Yang,Y.&Ramanan,D.(2011年)。基于混合部件的关节姿态估计。在CVPR中。
[74] Yao,B.,Bradski,G.,Fei Fei,L.:面向fgvc的无代码本和注释方法。输入:CVPR(2012)
[75] Yao,B.,科斯拉,A.&Fei Fei,L.(2011年)。将随机和判别相结合用于fgvc。在CVPR中。
[76] Zhang,N.,Farrell,R.&Darrell,T.(2012年)。用于子类别识别的位姿池核。在CVPR中。
[77] Zhang,N.,Farrell,R.,Iandola,F.&Darrell,T.(2013年)。用于细粒度识别和属性预测的可变形零件描述符。在ICCV中。
[78] 周,X。&Huang,T.(2003年)。图像检索中的相关反馈。在多媒体中。
此参考列表基于出版商或数字数学图书馆提供的信息。它的项被试探性地匹配到zbMATH标识符,并且可能包含数据转换错误。它试图尽可能准确地反映原始论文中列出的参考文献,而不要求匹配的完整性或精确性。