调节以视觉为中心的自动驾驶的中间3D特征

作者

  • 徐俊凯 浙江大学计算机辅助设计与计算国家重点实验室法布公司。
  • 梁鹏 浙江大学计算机辅助设计与计算国家重点实验室法布公司。
  • 程浩然 浙江大学计算机辅助设计与计算国家重点实验室Fabu公司。
  • 夏琳轩 浙江大学计算机辅助设计与计算国家重点实验室法布公司。
  • 齐州 浙江大学计算机辅助设计与计算国家重点实验室法布公司。
  • 丹登 法布公司。
  • 魏谦 Fabu公司。
  • 王文晓 浙江大学软件技术学院
  • 邓才 浙江大学计算机辅助设计与计算国家重点实验室法布公司。

DOI(操作界面):

https://doi.org/10.1609/aaai.v38i6.28449

关键词:

CV:机器人和自动驾驶的视觉,CV:应用,CV:对象检测和分类,CV:视觉的表示学习,CV:场景分析和理解,CV:分割

摘要

多摄像头感知任务在自动驾驶领域得到了广泛关注。然而,由于投影性质和不可控的致密化过程,现有的基于多摄像机设置中的Lift-Splat-Shot(LSS)的框架无法生成合适的致密3D特征。为了解决这个问题,我们建议通过体绘制来调节中等密度的三维特征。具体来说,我们使用体绘制来处理稠密的三维特征,以获得相应的二维特征(例如深度图、语义图),这些特征在训练中由相关标签进行监督。这种方式在特征层次上调节密集三维特征的生成,为多感知任务提供适当的密集统一特征。因此,我们的方法被称为Vampire,代表“作为多摄像机感知中间功能调节器的体积渲染”。在Occ3D和nuScenes数据集上的实验结果表明,Vampire有助于细粒度和适当提取密集的3D特征,并且在3D占用率预测、LiDAR分割和3D目标检测等多种下游感知任务中与现有的SOTA方法相竞争,同时利用中等GPU资源。我们在补充材料中提供了视频演示,代码可在github.com/cskkxjk/Vampire上获得。

出版

2024-03-24

如何引用

Xu,J.、Peng,L.、Cheng,H.、Xia,L.,Zhou,Q.、Deng,D.、Qian,W.、Wang,W.和Cai,D.(2024)。为以视觉为中心的自动驾驶调节中间3D功能。AAAI人工智能会议记录,38(6), 6306-6314. https://doi.org/10.1609/aaai.v38i6.28449

问题

章节

AAAI计算机视觉技术跟踪V