计算机科学>计算机视觉和模式识别
标题: 图像识别中的深度残差学习
摘要: 更深层的神经网络更难训练。 我们提出了一个剩余学习框架,以简化比以前使用的网络更深的网络训练。 我们明确地将层重新定义为参考层输入的学习剩余函数,而不是学习未参考的函数。 我们提供了全面的经验证据,表明这些剩余网络更容易优化,并且可以从显著增加的深度中获得精度。 在ImageNet数据集上,我们评估深度高达152层的残差网,深度是VGG网的8倍,但复杂性仍然较低。 这些残差网络的集合在ImageNet测试集上达到3.57%的误差。 该结果在ILSVRC 2015分类任务中获得了第一名。 我们还对具有100层和1000层的CIFAR-10进行了分析。 表征的深度对于许多视觉识别任务至关重要。 仅由于我们非常深入的表示,我们在COCO对象检测数据集上获得了28%的相对改进。 深度残差网是我们提交ILSVRC和COCO 2015竞赛的基础,我们在ImageNet检测、ImageNetwork定位、COCO检测和COCO分割任务上也获得了第一名。