LSDA:通过自适应进行大规模检测

的一部分神经信息处理系统进展27(NIPS 2014)

Biptex公司 元数据 纸类 评论

作者

朱迪·霍夫曼(Judy Hoffman)、塞尔吉奥·瓜达拉玛(Sergio Guadarrama)、埃里克·曾荫权(Eric S.Tzeng)、胡荣杭(Ronghang Hu)、杰夫·多纳休(Jeff Donahue)、罗斯·吉希克(Ross Girshick)、特雷

摘要

缩放对象检测的一个主要挑战是难以获得大量类别的标记图像。最近,深度卷积神经网络(CNN)已成为对象分类基准测试的明显赢家,部分原因是使用1.2M+标记的分类图像进行训练。不幸的是,这些标签中只有一小部分可用于检测任务。从搜索引擎中收集大量图像级标签比收集检测数据并用精确的边界框标记要便宜得多,也更容易。在本文中,我们提出了大规模自适应检测(LSDA)算法,该算法学习两个任务之间的差异,并将此知识传递给类别分类器,而无需限定带方框注释的数据,将其转换为检测器。我们的方法有可能检测到成千上万个没有边界框注释但有大量分类数据的类别。对ImageNet LSVRC-2013检测挑战的评估证明了我们的方法的有效性。该算法使我们能够通过使用ImageNet树中叶节点的可用分类数据生成>7.6K的检测器。我们还演示了如何修改我们的架构以产生快速检测器(7.6K检测器以2fps运行)。模型和软件位于