Linking vision and motion for self-supervised object-centric perception

Stocking, Kaylene C.; Murez, Zak; Badrinarayanan, Vijay; Shotton, Jamie; Kendall, Alex; Tomlin, Claire; Burgess, Christopher P.

计算机科学>计算机视觉和模式识别

arXiv公司：2307.07147（个）

【于2023年7月14日提交】

标题：将视觉和运动联系起来，实现自我监督的以对象为中心的感知

作者：凯琳C.袜子,扎克·穆雷斯,维杰·巴德里纳亚南,究院的杰米·肖顿,亚历克斯·肯德尔,克莱尔·汤姆林,克里斯托弗·伯吉斯

查看PDF

摘要：以对象为中心的表示使自主驾驶算法能够推理许多独立代理和场景特征之间的交互。传统上，这些表示是通过监督学习获得的，但这将感知与下游驾驶任务解耦，并可能损害泛化。在这项工作中，我们采用了一种自监督的以对象为中心的视觉模型，以仅使用RGB视频和车辆姿势作为输入来执行对象分解。我们证明了我们的方法在Waymo Open感知数据集上取得了很好的结果。虽然对象遮罩质量落后于使用更多特权信息的监督方法或替代方法，但我们发现，我们的模型能够学习一种随时间融合多个摄像头视点的表示，并成功跟踪数据集中的许多车辆和行人。我们模型的代码可从以下网址获得：此https URL.

评论：	在CVPR 2023视觉中心自动驾驶研讨会上发表
学科：	计算机视觉和模式识别（cs.CV）
引用为：	arXiv公司：2307.07147[cs.CV]
	（或 arXiv:2307.07147v1[cs.CV]对于此版本）
	https://doi.org/10.48550/arXiv.2307.07147

提交历史记录

发件人：Kaylene Stocking[查看电子邮件]
[第1版]2023年7月14日星期五04:21:05 UTC（3254 KB）

全文链接：

访问纸张：

查看许可证

当前浏览上下文：

反恐精英。个人简历

<上一版本 | 下一个>

新的 | 最近的 |2023-07

更改为浏览方式：

反恐精英

参考文献和引文

导出BibTeX引文

计算机科学>计算机视觉和模式识别

标题：将视觉和运动联系起来，实现自我监督的以对象为中心的感知

提交历史记录

访问纸张：

参考文献和引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目

计算机科学>计算机视觉和模式识别

标题：将视觉和运动联系起来，实现自我监督的以对象为中心的感知

提交历史记录

访问纸张：

参考文献和引文

BibTeX格式的引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目