DAIR-V2X: A Large-Scale Dataset for Vehicle-Infrastructure Cooperative 3D Object Detection

Yu, Haibao; Luo, Yizhen; Shu, Mao; Huo, Yiyi; Yang, Zebang; Shi, Yifeng; Guo, Zhenglong; Li, Hanyu; Hu, Xing; Yuan, Jirui; Nie, Zaiqing

计算机科学>计算机视觉和模式识别

arXiv公司：2204.05575（cs）

【于2022年4月12日提交】

标题：DAIR-V2X：一种用于车-地协同三维目标检测的大尺度数据集

作者：海宝余,罗一珍,毛书,伊伊霍伊,杨泽邦,一峰石,郭正龙,李汉宇（Hanyu Li）,星虎,袁继瑞,聂再庆

查看PDF

摘要：由于缺乏全球视野和远程感知能力的限制，自动驾驶面临着巨大的安全挑战。人们普遍认为，要实现5级自治，就需要进行车地基础设施合作。然而，对于计算机视觉研究人员来说，仍然没有来自真实场景的数据集可用于研究与车辆-基础设施合作相关的问题。为了加快车辆-基础结构协同自主驾驶（VICAD）的计算机视觉研究和创新，我们发布了DAIR-V2X数据集，这是第一个大规模、多模态、多视图的VICAD真实场景数据集。DAIR-V2X包括71254个LiDAR帧和71254相机帧，所有帧都是通过3D注释从真实场景中捕获的。介绍了车载基础设施协同三维目标检测问题（VIC3D），该问题利用来自车辆和基础设施的感官输入，制定了协同定位和识别三维对象的问题。除了解决传统的三维目标检测问题外，VIC3D的解决方案还需要考虑车辆和基础设施传感器之间的时间异步问题以及它们之间的数据传输成本。此外，我们提出了时间补偿延迟融合（TCLF），这是一种用于VIC3D任务的延迟融合框架，作为基于DAIR-V2X的基准。在上查找数据、代码和更多最新信息此https URL和此https URL.

评论：	CVPR2022型
学科：	计算机视觉和模式识别（cs.CV）; 人工智能（cs.AI）
引用为：	arXiv:2204.05575[cs.CV]
	（或 arXiv:2204.05575v1[cs.CV]对于此版本）
	https://doi.org/10.48550/arXiv.2204.05575

提交历史记录

发件人：余海宝[查看电子邮件]
[第1版]2022年4月12日星期二07:13:33 UTC（7951 KB）

计算机科学>计算机视觉和模式识别

标题：DAIR-V2X：一种用于车-地协同三维目标检测的大尺度数据集

提交历史记录

访问纸张：

参考文献和引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

Demos公司

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目

计算机科学>计算机视觉和模式识别

标题：DAIR-V2X：一种用于车-地协同三维目标检测的大尺度数据集

提交历史记录

访问纸张：

参考文献和引文

BibTeX格式引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

Demos公司

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目