What You See Is What You Detect: Towards better Object Densification in 3D detection

Liu, Tianran; Zhang, Zeping; Pasandi, Morteza Mousa; Laganiere, Robert

计算机科学>计算机视觉和模式识别

arXiv：2310.17842（cs）

【于2023年10月27日提交(第1版)，上次修订日期：2023年11月14日（此版本，v2）]

标题：所见即检测：在3D检测中实现更好的目标密度

作者：刘天然,张泽平,莫泰萨·穆萨·帕桑迪,罗伯特·拉加尼埃尔

查看PDF

摘要：最近的工作证明了目标完成在激光雷达信号三维感知中的重要性。已经提出了几种方法，其中使用模块来加密激光扫描仪产生的点云，从而获得更好的召回和更准确的结果。为了朝着这个方向努力，我们在这项工作中提出了一个反直觉的观点：广泛使用的全形状完成方法实际上导致了更高的误差上限，特别是对于遥远的物体和行人等小物体。基于这一观察结果，我们引入了一种可视部分完成方法，该方法只需要之前方法生成的11.3\%的预测点。为了恢复稠密表示，我们提出了一种基于网格变形的方法来增加与可见前景对象相关的点集。考虑到我们的方法只关注前景对象的可见部分以实现精确的三维检测，我们将我们的方法命名为“所见即所得”（WYSIWYD）。因此，我们提出的方法是一个检测器相关模型，它由两部分组成：网格内分割变换器（IFST）和网格深度完成网络（MDCNet），后者通过网格变形预测前景深度。这样，我们的模型就不需要大多数基于伪生命的方法所使用的耗时的全深度完成任务。我们的实验评估表明，与KITTI和NuScenes数据集上的大多数公共基线模型相比，我们的方法可以提供高达12.2%的性能改进，将最先进的技术提升到了一个新的水平。代码将在\textcolor[RGB]{0,0255}{\url上提供{此https URL}

学科：	计算机视觉和模式识别（cs.CV）; 机器人（cs.RO）
引用为：	arXiv:2310.17842[cs.CV]
	（或 arXiv:2310.17842v2[cs.CV]对于此版本）
	https://doi.org/10.48550/arXiv.2310.17842

提交历史记录

发件人：刘天然[查看电子邮件]
[第1版]2023年10月27日星期五01:46:37 UTC（7531 KB）
[版本2]2023年11月14日星期二23:03:35 UTC（7514 KB）

计算机科学>计算机视觉和模式识别

标题：所见即检测：在3D检测中实现更好的目标密度

提交历史记录

访问纸张：

参考文献和引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目

计算机科学>计算机视觉和模式识别

标题：所见即检测：在3D检测中实现更好的目标密度

提交历史记录

访问纸张：

参考文献和引文

BibTeX格式的引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目