计算机科学>计算机视觉和模式识别
标题: 所见即检测:在3D检测中实现更好的目标密度
摘要: 最近的工作证明了目标完成在激光雷达信号三维感知中的重要性。 已经提出了几种方法,其中使用模块来加密激光扫描仪产生的点云,从而获得更好的召回和更准确的结果。 为了朝着这个方向努力,我们在这项工作中提出了一个反直觉的观点:广泛使用的全形状完成方法实际上导致了更高的误差上限,特别是对于遥远的物体和行人等小物体。 基于这一观察结果,我们引入了一种可视部分完成方法,该方法只需要之前方法生成的11.3\%的预测点。 为了恢复稠密表示,我们提出了一种基于网格变形的方法来增加与可见前景对象相关的点集。 考虑到我们的方法只关注前景对象的可见部分以实现精确的三维检测,我们将我们的方法命名为“所见即所得”(WYSIWYD)。 因此,我们提出的方法是一个检测器相关模型,它由两部分组成:网格内分割变换器(IFST)和网格深度完成网络(MDCNet),后者通过网格变形预测前景深度。 这样,我们的模型就不需要大多数基于伪生命的方法所使用的耗时的全深度完成任务。 我们的实验评估表明,与KITTI和NuScenes数据集上的大多数公共基线模型相比,我们的方法可以提供高达12.2%的性能改进,将最先进的技术提升到了一个新的水平。 代码将在\textcolor[RGB]{0,0255}{\url上提供{ 此https URL }