Regulating Intermediate 3D Features for Vision-Centric Autonomous Driving

Junkai Xu; Liang Peng; Haoran Cheng; Linxuan Xia; Qi Zhou; Dan Deng; Wei Qian; Wenxiao Wang; Deng Cai

doi:10.1609/aaai.v38i6.28449

作者

徐俊凯浙江大学计算机辅助设计与计算国家重点实验室法布公司。
梁鹏浙江大学计算机辅助设计与计算国家重点实验室法布公司。
程浩然浙江大学计算机辅助设计与计算国家重点实验室Fabu公司。
夏琳轩浙江大学计算机辅助设计与计算国家重点实验室法布公司。
齐州浙江大学计算机辅助设计与计算国家重点实验室法布公司。
丹登法布公司。
魏谦 Fabu公司。
王文晓浙江大学软件技术学院
邓才浙江大学计算机辅助设计与计算国家重点实验室法布公司。

DOI（操作界面）：

https://doi.org/10.1609/aaai.v38i6.28449

关键词：

CV：机器人和自动驾驶的视觉，CV：应用，CV:对象检测和分类，CV:视觉的表示学习，CV:场景分析和理解，CV:分割

摘要

多摄像头感知任务在自动驾驶领域得到了广泛关注。然而，由于投影性质和不可控的致密化过程，现有的基于多摄像机设置中的Lift-Splat-Shot（LSS）的框架无法生成合适的致密3D特征。为了解决这个问题，我们建议通过体绘制来调节中等密度的三维特征。具体来说，我们使用体绘制来处理稠密的三维特征，以获得相应的二维特征（例如深度图、语义图），这些特征在训练中由相关标签进行监督。这种方式在特征层次上调节密集三维特征的生成，为多感知任务提供适当的密集统一特征。因此，我们的方法被称为Vampire，代表“作为多摄像机感知中间功能调节器的体积渲染”。在Occ3D和nuScenes数据集上的实验结果表明，Vampire有助于细粒度和适当提取密集的3D特征，并且在3D占用率预测、LiDAR分割和3D目标检测等多种下游感知任务中与现有的SOTA方法相竞争，同时利用中等GPU资源。我们在补充材料中提供了视频演示，代码可在github.com/cskkxjk/Vampire上获得。

调节以视觉为中心的自动驾驶的中间3D特征

作者

DOI（操作界面）：

关键词：

摘要

下载

出版

如何引用

问题

章节

问询处

开发人

订阅