A Unified Query-based Paradigm for Camouflaged Instance Segmentation

Dong, Bo; Pei, Jialun; Gao, Rongrong; Xiang, Tian-Zhu; Wang, Shuo; Xiong, Huan

计算机科学>计算机视觉和模式识别

arXiv公司：2308.07392（cs）

【于2023年8月14日提交(第1版)，上次修订日期：2023年8月29日（此版本，v2）]

职务：一种基于查询的伪装实例分割统一范式

作者：Bo Dong（博东）,贝佳伦,高荣荣,天珠香,Shuo Wang（王朔）,浣熊

查看PDF

摘要：由于伪装实例与背景的高度相似性，最近提出的伪装实例分割（CIS）在准确定位和实例分割方面面临挑战。为此，受基于查询的变换器的启发，我们提出了一个用于伪装实例分割的统一的基于查询的多任务学习框架，称为UQFormer，它构建一组掩码查询和一组边界查询来学习共享的组合查询表示，并有效地集成全局伪装对象区域和边界线索，以便在伪装场景中同时进行实例分割和实例边界检测。具体来说，我们设计了一种组合查询学习范式，该范式通过在设计的多尺度统一学习变换解码器中掩码查询和边界查询的交叉注意交互，学习共享表示来捕获对象区域和边界特征。然后，我们提出了一个基于变换器的多任务学习框架，该框架基于学习的组合查询表示，用于同时进行伪装实例分割和伪装实例边界检测，这也迫使模型学习一个强实例级的查询表示。值得注意的是，我们的模型将实例分割视为一个基于查询的直接集预测问题，没有其他的后处理，例如非最大值抑制。与14种最先进的方法相比，我们的UQFormer显著提高了伪装实例分割的性能。我们的代码将在此https URL.

评论：	本论文已被ACM MM2023接受
学科：	计算机视觉和模式识别（cs.CV）
引用为：	arXiv:2308.07392[cs.CV]
	（或 arXiv:2308.07392v2[cs.CV]对于此版本）
	https://doi.org/10.48550/arXiv.2308.07392

提交历史记录

发件人：田竹香[查看电子邮件]
[第1版]2023年8月14日星期一18:23:18 UTC（1626 KB）
[版本2]2023年8月29日星期二12:37:04 UTC（1626 KB）

计算机科学>计算机视觉和模式识别

职务：一种基于查询的伪装实例分割统一范式

提交历史记录

访问纸张：

参考文献和引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目

计算机科学>计算机视觉和模式识别

职务：一种基于查询的伪装实例分割统一范式

提交历史记录

访问纸张：

参考文献和引文

BibTeX格式的引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目