Panoptic-DepLab:自下而上的全景分割的简单、强大和快速基线

程伯文(Bowen Cheng)、柯林斯(Maxwell D.Collins; IEEE/CVF计算机视觉和模式识别会议记录,2020年,第12475-12485页

摘要


在这项工作中,我们引入了Panoptic-DepLab,这是一个简单、强大和快速的全景分割系统,旨在为自下而上的方法建立坚实的基础,该方法可以实现两阶段方法的类似性能,同时产生快速的推理速度。特别是,Panoptic DeepLab分别采用了针对语义和实例分割的双ASPP和双解码器结构。语义分割分支与任何语义分割模型(例如DeepLab)的典型设计相同,而实例分割分支是类认知的,涉及简单的实例中心回归。因此,我们的单个Panoptic-DepLab同时在所有三个城市景观基准中排名第一,在测试集上达到了84.2%mIoU、39.0%AP和65.5%PQ的最新水平。此外,配备MobileNetV3的Panoptic-DepLab几乎可以实时运行单个1025x2049图像(每秒15.8帧),同时在Cityscapes上取得了具有竞争力的性能(测试集上达到54.1 PQ%)。在Mapillary Vistas测试集上,我们的六款车型组合达到42.7%的PQ,以1.5%的健康差距超过2018年的冠军。最后,在具有挑战性的COCO数据集上,我们的Panoptic-DepLab还可以与几种自顶向下的方法媲美。我们首次证明了自下而上的方法可以提供最先进的全景分割结果。

相关材料


[pdf格式][支持][视频]
[围巾]
@会议记录{Cheng_2020_CVPR,
作者={Cheng,Bowen and Collins,Maxwell D.and Zhu,Yukun and Liu,Ting and Huang,Thomas S.and Adam,Hartwig and Chen,Liang-Chieh},
title={Panoptic-DepLab:自下而上的全景分割的简单、强大和快速基线},
booktitle={IEEE/CVF计算机视觉和模式识别(CVPR)会议记录},
月={6月},
年份={2020年}
}