SYNTHIA数据集

SYNTHIA数据集:用于城市场景语义分割的大量合成图像集合。城市场景中基于视觉的语义分割是自主驾驶的关键功能。最近深度卷积神经网络(DCNNs)的革命性结果预示着可靠的分类器的出现,以执行这些视觉任务。然而,DCNNs需要从原始图像中学习许多参数,因此需要有足够数量的具有类注释的不同图像。这些注释是通过繁琐的人工劳动获得的,这对于语义分割来说尤其具有挑战性,因为需要像素级的注释。在这篇论文中,我们提出使用虚拟世界来自动产生具有像素级注解的真实合成影像。然后,我们讨论这样的数据对语义分割有多大的用处,特别是在使用DCNN范式时。为了回答这个问题,我们生成了一个综合的城市图像集合,命名为SYNTHIA,并自动生成类注释。我们将SYNTHIA与公开提供的真实城市图像结合使用,并提供手动注释。然后,我们用DCNNs进行了实验,证明在训练阶段加入SYNTHIA可以显著提高语义分割任务的性能。