×

使用单个图像进行人脸识别和合成的位置编码球面谐波。 (英语) Zbl 1184.94073号

小结:不同姿态下的人脸识别是一个具有挑战性的问题,尤其是在光照变化的情况下。在本文中,我们建议解决人脸识别中最具挑战性的场景之一。也就是说,从数据库中该对象的一个训练样本(也称为图库图像)在不同姿势和照明条件下获取的测试图像中识别该对象。例如,测试图像可以是半正面的,由多个光源照明,而相应的训练图像在单个光源下是正面的。在朗伯反射假设下,球面谐波表示已被证明能够有效地建模固定姿态下的照明变化。在本文中,我们扩展了球面谐波表示来编码姿势信息。更具体地说,我们利用了不同姿态下的二维调和基图像通过闭合形式的线性变换进行关联的事实,并给出了一个更方便的变换矩阵来直接用于基图像。一个直接的应用是,通过改变球面谐波表示的系数,我们可以很容易地在任意照明条件下合成对象的不同视图。更重要的结果是,为了解决上述具有挑战性的场景,基于线性变换的正交性,提出了一种有效的人脸识别方法。因此,我们直接将非正面视图测试图像投影到正面视图调和基图像的空间中。投影引起的一些经验因素的影响嵌入到稀疏翘曲矩阵中;对于大多数情况,我们表明,将测试图像扭曲到正面后,识别性能不会恶化。该方法对合成图像和具有挑战性的真实图像都取得了很好的识别效果。

MSC公司:

94A08型 信息与通信理论中的图像处理(压缩、重建等)
94A11号机组 正交函数和其他特殊函数的应用
68吨10 模式识别、语音识别

软件:

CMU项目
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] doi:10.1145/954339.954342·doi:10.1145/954339.954342
[2] doi:10.1109/TPAMI.2003.1227983·doi:10.1109/TPAMI.2003.1227983
[3] doi:10.1109/TPAMI.2006.53·doi:10.1109/TPAMI.2006.53
[4] doi:10.1109/TPAMI.2003.1177153·doi:10.1109/TPAMI.2003.1177153
[5] doi:10.1109/TPAMI.2002.1039204·doi:10.10109/TPAMI.2002.1039204
[7] doi:10.11145/1027411.1027416·doi:10.11145/1027411.1027416
[8] doi:10.1109/34.598228·doi:10.1109/34.598228
[9] doi:10.1023/A:1012369907247·Zbl 0991.68085号 ·doi:10.1023/A:1012369907247
[11] doi:10.1109/34.927467·doi:10.1109/34.927467
[12] doi:10.1109/JPROC.2006.886019·doi:10.1109/JPROC.2006.886019
[14] doi:10.1007/s11263-006-8525-1·doi:10.1007/s11263-006-8525-1
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。