计算机科学>计算机视觉和模式识别
标题: OPA-3D:用于单目3D目标检测的遮挡软件像素线聚合
摘要: 尽管由于使用预处理深度估计器进行伪LiDAR恢复,最近单目3D目标检测取得了重大进展,但这种两阶段方法通常会出现过拟合问题,并且无法明确封装深度和对象边界框之间的几何关系。 为了克服这一局限性,我们提出了OPA-3D,这是一种单阶段、端到端的遮挡软件像素线聚合网络,用于通过深度边界框残差和对象边界框联合估计稠密场景深度,从而实现对3D对象的双流检测,从而显著提高检测的鲁棒性。 因此,表示为几何流的几何流结合了可见深度和深度边界框残差,通过显式遮挡软件优化恢复对象边界框。 此外,还采用了基于包围盒的几何投影方案来增强距离感知。 第二个流被命名为上下文流,直接回归3D对象的位置和大小。 这种新颖的两流表示法进一步使我们能够执行跨流一致性项,使两个流的输出对齐,从而提高整体性能。 在公共基准上进行的大量实验表明,OPA-3D在保持实时推理速度的同时,在主要汽车类别上优于最先进的方法。 我们计划很快发布所有代码和经过培训的模型。