寻找高效的多尺度结构进行密集图像预测

的一部分神经信息处理系统进展31(NeurIPS 2018)

Bibtex公司 元数据 纸类 评论 补充的

作者

Liang-Chieh Chen、Maxwell Collins、Yukun Zhu、George Papandreou、Barret Zoph、Florian Schroff、Hartwig Adam、Jon Shlens

摘要

神经网络体系结构的设计是实现机器学习系统跨越广泛任务的最新性能的重要组成部分。许多工作都致力于通过巧妙地构建搜索空间和简单的学习算法来自动设计和构建架构。最近的进展表明,这种元学习方法在图像分类任务上可能超过可伸缩的人类发明的体系结构。一个悬而未决的问题是这种方法可以推广到新领域的程度。在这项工作中,我们探索了用于稠密图像预测的元学习技术的构建,重点是场景解析、人-部分分割和语义图像分割。由于视觉信息的多尺度表示以及操作高分辨率图像的必要性,在该领域构建可行的搜索空间具有挑战性。基于对稠密图像预测技术的综述,我们构造了一个递归搜索空间,并证明即使使用有效的随机搜索,我们可以识别出性能优于人类发明的架构,并在三个密集预测任务中实现最先进的性能,包括82.7%的城市景观(街道场景解析)、71.3%的PASCAL-Person-Part(人-部分分割)和87.9%的PASCAL VOC 2012(语义图像分割)。此外,所得到的体系结构在计算上更高效,需要与先前的现有技术系统一样一半的参数和一半的计算成本。