美国有线电视新闻网

CNN-RNN:一个统一的多标签图像分类框架。虽然深度卷积神经网络(CNNs)在单标签图像分类方面取得了巨大成功,但值得注意的是,现实世界中的图像通常包含多个标签,这些标签可以对应于图像中不同的对象、场景、动作和属性。传统的多标签图像分类方法为每个类别学习独立的分类器,并对分类结果进行排序或阈值分割。这些技术虽然工作良好,但无法显式地利用图像中的标签依赖性。本文利用递归神经网络来解决这一问题。结合CNNs,CNN-RNN框架学习了一种联合图像标签嵌入方法来表征图像标签的语义依赖性和相关性,并可以从头开始训练端到端地将这两种信息集成到一个统一的框架中。在公共基准数据集上的实验结果表明,该体系结构比现有的多标签分类模型具有更好的性能