计算机科学>计算机视觉和模式识别
职务: 从鸟瞰布局生成街道视图图像
摘要: 鸟瞰视图(BEV)感知近年来受到了越来越多的关注,因为它提供了跨视图的简洁统一的空间表示,并有利于各种下游驾驶应用程序。 与此同时,自主驾驶的数据驱动模拟已成为近期研究的重点,但几乎没有完全数据驱动和可控的方法。 理想的模拟模型不是使用真实场景中的感知数据,而是生成符合给定高清地图和交通布局的逼真街景图像,这对于可视化复杂交通场景和开发强大的自动驾驶感知模型至关重要。 在本文中,我们提出了BEVGen,这是一种条件生成模型,它综合了一组与交通场景的BEV布局相匹配的真实且空间一致的周围图像。 BEVGen将一种新颖的交叉视图转换与空间注意力设计相结合,该设计学习相机和地图视图之间的关系,以确保它们的一致性。 我们在具有挑战性的NuScenes和Argoverse 2数据集上评估了所提出的模型。 经过训练,BEVGen可以准确地渲染道路和车道线,并生成不同天气条件和一天中不同时间的交通场景。