软件搜索-zbMATH Open

×

约拉克++

swMATH编号：	34916
软件作者：	Daniel Bolya、Chong Zhou、Fanyi Xiao、Yong Jae Lee
描述：	YOLACT++：更好的实时实例分段。我们提出了一个用于实时（>30 fps）实例分割的简单、完全卷积模型，该模型在单个Titan Xp上评估的MS COCO上取得了具有竞争力的结果，这比以前任何最先进的方法都要快得多。此外，我们只在一个GPU上进行了训练，就得到了这个结果。我们通过将实例分割分成两个并行子任务来实现这一点：（1）生成一组原型掩码和（2）预测per-instance掩码系数。然后，我们通过将原型与掩码系数线性组合来生成实例掩码。我们发现，因为这个过程不依赖于再冷却，所以这种方法可以产生非常高质量的掩模，并免费展示时间稳定性。此外，我们分析了原型的涌现行为，并表明它们学会了以翻译变体的方式自己定位实例，尽管它们是完全卷积的。我们还提出了快速NMS，这是对标准NMS的一种12毫秒的快速替换，只会带来边际性能损失。最后，通过将可变形卷积合并到主干网络中，优化具有更好锚定尺度和纵横比的预测头，并添加新的快速掩码重取分支，我们的YOLACT++模型可以在MS COCO上以33.5 fps的速度实现34.1 mAP，这与最先进的方法相当接近，但仍在实时运行。
主页：	https://arxiv.org/abs/1912.06218
源代码：	https://github.com/dbolya/yolact
关键词：	计算机视觉;模式识别;arXiv_cs。个人简历;机器学习;arXiv_cs。LG公司;图像处理;arXiv_eess（_E）。四、;实例分段
相关软件：	MS-COCO公司;SegNet公司;SYNTHIA数据集;摄像头视频;PASCAL上下文;分析网;10万孟加拉塔卡;ADE20k公司;地图视觉;城市风光;PASCAL挥发性有机化合物;DecovNet公司;PyDenseCRF公司;Panoptic-Dep实验室;掌中宽带;基蒂;抓斗切割;效率PS;Axial-Dep实验室;深层实验室
引用于：	2文件

全部的前5名

被7位作者引用

1	尤尼萨·阿赫桑
1	鲍里斯·奇德洛夫斯基
1	加布里埃拉·苏尔卡
1	马修·黑根
1	李汉燕
1	里卡多·沃尔皮
1	王远波

连载1篇

2	计算机图形学和视觉的基础和发展趋势

在1个字段中引用

2	计算机科学（68至XX）

按年份列出的引文

© 2024FIZ卡尔斯鲁厄股份有限公司隐私政策法律声明条款和条件