计算机科学>计算机视觉和模式识别
标题: DAIR-V2X:一种用于车-地协同三维目标检测的大尺度数据集
摘要: 由于缺乏全球视野和远程感知能力的限制,自动驾驶面临着巨大的安全挑战。 人们普遍认为,要实现5级自治,就需要进行车地基础设施合作。 然而,对于计算机视觉研究人员来说,仍然没有来自真实场景的数据集可用于研究与车辆-基础设施合作相关的问题。 为了加快车辆-基础结构协同自主驾驶(VICAD)的计算机视觉研究和创新,我们发布了DAIR-V2X数据集,这是第一个大规模、多模态、多视图的VICAD真实场景数据集。 DAIR-V2X包括71254个LiDAR帧和71254相机帧,所有帧都是通过3D注释从真实场景中捕获的。 介绍了车载基础设施协同三维目标检测问题(VIC3D),该问题利用来自车辆和基础设施的感官输入,制定了协同定位和识别三维对象的问题。 除了解决传统的三维目标检测问题外,VIC3D的解决方案还需要考虑车辆和基础设施传感器之间的时间异步问题以及它们之间的数据传输成本。 此外,我们提出了时间补偿延迟融合(TCLF),这是一种用于VIC3D任务的延迟融合框架,作为基于DAIR-V2X的基准。 在上查找数据、代码和更多最新信息 此https URL 和 此https URL .