FEELVOS:视频对象分割的快速端到端嵌入学习

Paul Voigtlaender、Yuning Chai、Florian Schroff、Hartwig Adam、Bastian Leibe、Liang-Chieh Chen; 2019年IEEE/CVF计算机视觉和模式识别会议记录,第9481-9490页

摘要


许多最近成功的视频对象分割(VOS)方法过于复杂,严重依赖于对第一帧的微调,并且/或者速度较慢,因此实际用途有限。在这项工作中,我们提出了FEELVOS作为一种简单快速的方法,它不依赖于微调。为了分割视频,FEELVOS针对每一帧使用语义像素嵌入以及全局和局部匹配机制,将信息从第一帧以及从视频的前一帧传输到当前帧。与之前的工作相比,我们的嵌入仅用作卷积网络的内部指导。我们的新型动态分割头允许我们为具有交叉熵损失的多对象分割任务对网络进行端到端的训练,包括嵌入。在DAVIS 2017验证集上,J&F测量值为71.5%,我们在无需微调的情况下实现了视频对象分割的最新水平。我们在以下网址提供代码和模型:https://github.com/tensorflow/models/tree/master/research/feelvos。

相关材料


[pdf格式][支持]
[围巾]
@会议记录{Voigtlaender_2019_CVPR,
author={Voigtlaender、Paul和Chai、Yuning和Schroff、Florian和Adam、Hartwig和Leibe、Bastian和Chen、Liang-Chieh},
title={FEELVOS:视频对象分割的快速端到端嵌入学习},
booktitle={计算机视觉和模式识别(CVPR)的IEEE/CFF会议记录},
月={6月},
年份={2019}
}