调节以视觉为中心的自动驾驶的中间3D特征 作者 徐俊凯 浙江大学计算机辅助设计与计算国家重点实验室法布公司。 梁鹏 浙江大学计算机辅助设计与计算国家重点实验室法布公司。 程浩然 浙江大学计算机辅助设计与计算国家重点实验室Fabu公司。 夏琳轩 浙江大学计算机辅助设计与计算国家重点实验室法布公司。 齐州 浙江大学计算机辅助设计与计算国家重点实验室法布公司。 丹登 法布公司。 魏谦 Fabu公司。 王文晓 浙江大学软件技术学院 邓才 浙江大学计算机辅助设计与计算国家重点实验室法布公司。 DOI(操作界面): https://doi.org/10.1609/aaai.v38i6.28449 关键词: CV:机器人和自动驾驶的视觉,CV:应用,CV:对象检测和分类,CV:视觉的表示学习,CV:场景分析和理解,CV:分割 摘要多摄像头感知任务在自动驾驶领域得到了广泛关注。然而,由于投影性质和不可控的致密化过程,现有的基于多摄像机设置中的Lift-Splat-Shot(LSS)的框架无法生成合适的致密3D特征。为了解决这个问题,我们建议通过体绘制来调节中等密度的三维特征。具体来说,我们使用体绘制来处理稠密的三维特征,以获得相应的二维特征(例如深度图、语义图),这些特征在训练中由相关标签进行监督。这种方式在特征层次上调节密集三维特征的生成,为多感知任务提供适当的密集统一特征。因此,我们的方法被称为Vampire,代表“作为多摄像机感知中间功能调节器的体积渲染”。在Occ3D和nuScenes数据集上的实验结果表明,Vampire有助于细粒度和适当提取密集的3D特征,并且在3D占用率预测、LiDAR分割和3D目标检测等多种下游感知任务中与现有的SOTA方法相竞争,同时利用中等GPU资源。我们在补充材料中提供了视频演示,代码可在github.com/cskkxjk/Vampire上获得。 下载 PDF格式 视频/海报 出版 2024-03-24 如何引用 Xu,J.、Peng,L.、Cheng,H.、Xia,L.,Zhou,Q.、Deng,D.、Qian,W.、Wang,W.和Cai,D.(2024)。为以视觉为中心的自动驾驶调节中间3D功能。AAAI人工智能会议记录,38(6), 6306-6314. https://doi.org/10.1609/aaai.v38i6.28449 更多引文格式 ACM公司 ACS公司 亚太地区 澳大利亚北卡罗来纳州 芝加哥 哈佛 电气与电子工程师协会 MLA公司 图拉宾语 温哥华 下载引文 尾注/佐特罗/门德利(RIS) BibTeX公司 问题 第38卷第6期:AAAI-24技术轨道6 章节 AAAI计算机视觉技术跟踪V