Deep Residual Learning for Image Recognition

He, Kaiming; Zhang, Xiangyu; Ren, Shaoqing; Sun, Jian

计算机科学>计算机视觉和模式识别

arXiv:1512.03385（cs）

【2015年12月10日提交】

标题：图像识别中的深度残差学习

作者：何开明,张湘玉,任绍清,孙健

查看PDF

摘要：更深层的神经网络更难训练。我们提出了一个剩余学习框架，以简化比以前使用的网络更深的网络训练。我们明确地将层重新定义为参考层输入的学习剩余函数，而不是学习未参考的函数。我们提供了全面的经验证据，表明这些剩余网络更容易优化，并且可以从显著增加的深度中获得精度。在ImageNet数据集上，我们评估深度高达152层的残差网，深度是VGG网的8倍，但复杂性仍然较低。这些残差网络的集合在ImageNet测试集上达到3.57%的误差。该结果在ILSVRC 2015分类任务中获得了第一名。我们还对具有100层和1000层的CIFAR-10进行了分析。
表征的深度对于许多视觉识别任务至关重要。仅由于我们非常深入的表示，我们在COCO对象检测数据集上获得了28%的相对改进。深度残差网是我们提交ILSVRC和COCO 2015竞赛的基础，我们在ImageNet检测、ImageNetwork定位、COCO检测和COCO分割任务上也获得了第一名。

评论：	技术报告
学科：	计算机视觉和模式识别（cs.CV）
引用为：	arXiv:1512.03385[cs.CV]
	（或 arXiv:1512.03385v1型[cs.CV]对于此版本）
	https://doi.org/10.48550/arXiv.1512.03385

提交历史记录

发件人：何开明[查看电子邮件]
[第1版]2015年12月10日星期四19:51:55 UTC（494 KB）

计算机科学>计算机视觉和模式识别

标题：图像识别中的深度残差学习

提交历史记录

访问纸张：

参考文献和引文

106个博客链接

DBLP公司-CS书目

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目

计算机科学>计算机视觉和模式识别

标题：图像识别中的深度残差学习

提交历史记录

访问纸张：

参考文献和引文

106个博客链接

DBLP公司-CS书目

BibTeX格式的引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目