基于可伸缩弱监督聚类的Web图像人脸动作单元学习

赵凯丽、朱文胜、阿列克斯·马丁内斯; IEEE计算机视觉与模式识别会议论文集,2018,第2090-2099页

摘要


我们提出了一种可扩展的弱监督聚类方法,用于从免费的大型web图像中学习面部动作单元(AU)。与大多数依赖于完全注释数据的现有方法(例如CNN)不同,我们的方法利用带有不准确注释的web图像。具体来说,我们推导了一种弱监督谱算法,该算法学习嵌入空间以耦合图像外观和语义。该算法具有有效的梯度更新,并且可以通过随机扩展扩展到大量图像。在学习到的嵌入空间中,我们采用秩序聚类来识别视觉和语义相似的图像组,并对这些图像组进行重新标注以训练AU分类器。对100万个EmotioNet数据集的评估表明了我们方法的有效性:(1)我们学习的注释与7个常见AU上的人工注释平均达到91.3%的一致性,(2)使用重新命名图像训练的分类器的性能与基于监督CNN的分类器相比,有时甚至更好,以及(3)我们的方法提供了直观的离群值/噪声修剪,而不是对每个图像强制一个注释。代码可用。

相关材料


[pdf格式]
[围巾]
@会议记录{Zhao_2018_CVPR,
author={赵,凯里和楚,文胜和马丁内斯,Aleix M.},
title={利用可扩展的弱监督聚类从网络图像学习面部动作单元},
booktitle={IEEE计算机视觉和模式识别会议论文集},
月={6月},
年份={2018年}
}