你想看到的变化
WACV 2023年


拉加夫·萨奇德瓦
安德鲁·齐瑟曼


牛津大学视觉几何组






让我们玩一个熟悉的游戏。以下图像对有4个更改/差异,您的任务是找到它们。当您确定更改的区域时,您可以点击查看答案.


未针对窄屏幕进行优化。


太难了?如果我们能自动检测,那不是很好吗所有的变化?想象一下,当你知道你可以点击按钮时,你能睡得多么安详在一对图像中!好吧,这正是我们要尝试的在这项研究工作中要做的事情。




摘要

我们生活在一个动态的世界里,事情总是在变化。给定同一场景的两幅图像,能够自动检测它们在许多领域都有实际应用。在本文中,我们解决了变化检测问题,其目标是检测图像对中的“对象级别”变化,尽管它们的视点和照明不同。为此,我们做出了以下四个贡献:(i)我们提出了一种可扩展的方法来获得利用现有对象分割基准的大规模变化检测训练数据集;(ii)我们引入了一种基于共同注意的新型架构,能够隐式地确定对应关系在图像对之间找到边界框预测形式的变化;(iii)我们贡献了四个评估数据集,这些数据集涵盖了各种领域和转换,包括合成图像变化、3D场景的真实监控图像以及带有摄像机运动的合成3D场景;(iv)我们在这四个数据集上评估了我们的模型,并展示了零镜头和超越训练的变换泛化。



结果

结果图

我们显示了边界框预测(实体)在各种图像对上的模型,以及基本事实(虚线)更改了区域。



共同关注数字

给定Query图像中的一些预定义区域,我们将参考图像中的交叉关注区域可视化来自我们模型的共同关注层。



方法

给定一个有一些更改的图像对,我们以有监督的方式训练以下体系结构。



建筑图形

我们提出的网络架构。



现在的问题是:监管从哪里来?用带注释的更改来管理真实世界中的大规模数据集既昂贵又耗时。相反,我们重新利用现有的对象检测/分割数据集进行训练。下图说明了我们如何从单个COCO图像中生成具有更改区域的多个图像对。

 培训数据生成管道

给定一幅原始COCO图像,我们首先使用一种内画方法来计算多幅带有内画区域的图像。


 培训数据生成管道

然后,给定原始图像和修复图像,我们随机抽取一对图像进行训练,以及他们的基本事实边界框,如图所示。请注意,图像对可能包含无效更改的修复区域。这样可以防止模型崩溃,而只需学习绘制噪声模式。




纸类

纸张缩略图

你想看到的变化

拉加夫·萨奇德娃(Ragav Sachdeva)、安德鲁·齐瑟曼(Andrew Zisserman)

2023年IEEE/CVF计算机视觉应用冬季会议论文集。

@会议记录{Sachdeva_WACV_2023,title={你想看到的变化},作者={Sachdeva,Ragav和Zisserman,Andrew},booktitle={IEEE/CVF计算机视觉应用冬季会议论文集(WACV)},年份={2023},}



致谢

本研究得到了EPSRC计划资助VisualAI EP/T028572/1和皇家学会研究教授RP\R1\191132的支持。