×

约拉克++

swMATH编号: 34916
软件作者: Daniel Bolya、Chong Zhou、Fanyi Xiao、Yong Jae Lee
描述: YOLACT++:更好的实时实例分段。我们提出了一个用于实时(>30 fps)实例分割的简单、完全卷积模型,该模型在单个Titan Xp上评估的MS COCO上取得了具有竞争力的结果,这比以前任何最先进的方法都要快得多。此外,我们只在一个GPU上进行了训练,就得到了这个结果。我们通过将实例分割分成两个并行子任务来实现这一点:(1)生成一组原型掩码和(2)预测per-instance掩码系数。然后,我们通过将原型与掩码系数线性组合来生成实例掩码。我们发现,因为这个过程不依赖于再冷却,所以这种方法可以产生非常高质量的掩模,并免费展示时间稳定性。此外,我们分析了原型的涌现行为,并表明它们学会了以翻译变体的方式自己定位实例,尽管它们是完全卷积的。我们还提出了快速NMS,这是对标准NMS的一种12毫秒的快速替换,只会带来边际性能损失。最后,通过将可变形卷积合并到主干网络中,优化具有更好锚定尺度和纵横比的预测头,并添加新的快速掩码重取分支,我们的YOLACT++模型可以在MS COCO上以33.5 fps的速度实现34.1 mAP,这与最先进的方法相当接近,但仍在实时运行。
主页: https://arxiv.org/abs/1912.06218
源代码:  https://github.com/dbolya/yolact
关键词: 计算机视觉;模式识别;arXiv_cs。个人简历;机器学习;arXiv_cs。LG公司;图像处理;arXiv_eess(_E)。四、;实例分段
相关软件: MS-COCO公司;SegNet公司;SYNTHIA数据集;摄像头视频;PASCAL上下文;分析网;10万孟加拉塔卡;ADE20k公司;地图视觉;城市风光;PASCAL挥发性有机化合物;DecovNet公司;PyDenseCRF公司;Panoptic-Dep实验室;掌中宽带;基蒂;抓斗切割;效率PS;Axial-Dep实验室;深层实验室
引用于: 2文件

在1个字段中引用

2 计算机科学(68至XX)

按年份列出的引文