研究论文

视觉分类中的稀疏判别Fisher向量

作者:

悉达多钱德拉、和

C.与。贾瓦哈尔作者信息和声明

ICVGIP’12：第八届印度计算机视觉、图形和图像处理会议记录

2012年12月

文章编号：55，页数1-8

https://doi.org/10.1145/2425333.2425388

出版:2012年12月16日出版历史

获取访问权限

摘要

从局部特征描述符构造全局图像表示是大多数视觉分类任务中的常见步骤。传统上，涉及硬矢量量化的特征包（BoF）表示已广泛用于此类任务。最近的研究表明，软作业的表现优于硬作业。在大多数基准数据集上，Fisher向量表示已被证明优于其他全局表示。Fisher向量（i）使用软赋值，以及（ii）通过捕获平均值的偏差来减少量化导致的信息损失。然而，Fisher向量表示是巨大的，并且表示大小随词汇表大小线性增加。最近的研究表明，Fisher向量的分类性能与词汇量成正比。然而，计算和存储需求不鼓励使用任意大的词汇表。此外，Fisher向量本身并不是有区别的。本文设计了一种计算稀疏Fisher表示的新策略。这使得我们可以在很少的计算和存储开销的情况下增加词汇表的大小，并且仍然可以获得更大词汇表的性能。此外，我们描述了一种在Fisher向量中编码类鉴别信息的方法。我们在四个流行的数据集上评估了我们的方法。实证结果表明，我们的表示始终优于传统的Fisher向量表示，并且与最先进的方法相当。

工具书类

[1]

R.Arandjelović和A.Zisserman。要改进对象检索，每个人都应该知道三件事。在CVPR公司, 2012.

数字图书馆

[2]

Y.-L.Boureau、F.Bach、Y.LeCun和J.Ponce。学习中级识别功能。在CVPR公司, 2010.

[3]

K.查特菲尔德、V.伦皮茨基、A.韦达尔迪和A.齐瑟曼。问题在于细节：对最新特征编码方法的评估。在BMVC公司, 2011.

[4]

C.chung Chang和C.-J.Lin.Libsvm:支持向量机库，2001年。

数字图书馆

[5]

L.V.der Maaten公司。学习有辨别力的fisher内核。在ICML公司, 2011.

[6]

S.Gao、I.W.-H.Tsang和L.-T.Chia。用于图像分类和人脸识别的核稀疏表示。在电子计算机控制, 2010.

数字图书馆

[7]

J.C.Gemert、J.-M Geusebroek、C.J.Veenman和A.W.Smeulders。用于场景分类的内核代码簿。在电子对抗车辆, 2008.

数字图书馆

[8]

T.Jaakkola和D.Haussler。在区分分类器中开发生成模型。在NIPS公司, 1998.

数字图书馆

[9]

H.Jégou、F.Perronnin、M.Douze、J.Sánchez、P.Pérez和C.Schmid。将局部图像描述符聚合为紧凑代码。PAMI公司, 2011.

[10]

F.Jurie和B.Triggs。为视觉识别创建高效的代码簿。在CVPR公司, 2005.

数字图书馆

[11]

J.Krapac、J.J.Verbeek和F.Jurie。用fisher向量建模空间布局以进行图像分类。在ICCV公司, 2011.

数字图书馆

[12]

E.P.X.李佳丽、郝苏和L.Fei-Fei。对象库：用于场景分类和语义特征稀疏化的高级图像表示。在NIPS公司, 2010.

[13]

M.Pandey和S.Lazebnik。基于可变形部分模型的场景识别和弱监督目标定位。CVPR公司, 2011.

数字图书馆

[14]

F.佩罗宁和C.R.丹斯。图像分类视觉词汇的Fisher内核。在CVPR公司, 2007.

[15]

F.Perronnin、Y.Liu、J.Sanchez和H.Poirier。基于压缩fisher向量的大尺度图像检索。在CVPR公司, 2010.

[16]

F.Perronnin、J.Sánchez和T.Mensink。改进fisher核用于大规模图像分类。在电子计算机控制, 2010.

数字图书馆

[17]

A.Quattoni和A.B.Torralba。识别室内场景。在CVPR公司, 2009.

[18]

J.Sanchez和F.Perronnin。用于大规模图像分类的高维特征压缩。在CVPR公司, 2011.

数字图书馆

[19]

C.施密德。除了一袋袋的特征：用于识别自然场景类别的空间金字塔匹配。在CVPR公司, 2006.

数字图书馆

[20]

G.Sharma、F.Jurie和C.Schmid。用于图像分类的判别空间显著性。在CVPR公司, 2012.

数字图书馆

[21]

A.Vedaldi和B.Fulkerson。VLFeat：一个开放的、可移植的计算机视觉算法库。网址：http://www.vlfeat.org/, 2008.

[22]

A.Vedaldi和A.Zisserman。稀疏核近似用于有效的分类和检测。在CVPR公司, 2012.

数字图书馆

[23]

J.Wang、J.Yang、K.Yu、F.Lv、T.S.Huang和Y.Gong。用于图像分类的局部约束线性编码。在CVPR公司, 2010.

[24]

J.Wright、Y.Ma、J.Mairal、G.Sapiro、T.Huang和S.Yan。计算机视觉和模式识别的稀疏表示。IEEE会议记录, 2010.

[25]

J.Wu和J.M.Rehg。Centrist：用于场景分类的视觉描述符。PAMI公司, 2011.

数字图书馆

[26]

J.Xiao、J.Hays、K.A.Ehinger、A.Oliva和A.Torralba。太阳数据库：从修道院到动物园的大规模场景识别。CVPR公司, 2010.

[27]

X.Zhou、K.Yu、T.Zhang和T.S.Huang。使用局部图像描述符的超矢量编码进行图像分类。在电子对抗车辆, 2010.

数字图书馆

引用人

王H邓W(2015)基于紧凑Fisher向量的人脸识别生物特征识别技术10.1007/978-3-319-25417-3_9(68-77)在线发布日期：2015年10月24日
https://doi.org/10.1007/978-3-319-25417-3_9

索引术语

视觉分类中的稀疏判别Fisher向量
1. 计算方法

建议

基于判别局部保持向量的人脸识别

我们提出了一种基于鉴别局部保持向量方法（DLPV）的有效人脸识别方法。利用局部保持投影的特征谱建模分析，选择了可靠的人脸变化子空间。。。
阅读更多信息
利用Fisher向量从语音中预测感冒；SVM和XGBoost作为分类器
语音和计算机
摘要
筛选a寒冷的在这项研究中，我们提出了一种通过使用感冒患者的语音对其进行分类的技术。为了实现这一目标，我们利用框架级。。。
阅读更多信息
基于稀疏表示的图像分类Fisher判别字典学习

所使用的字典在稀疏表示或基于稀疏编码的图像重建和分类中起着重要作用，而从训练数据中学习字典已经在图像分类方面取得了最新的成果。。。
阅读更多信息

评论

信息和贡献者

问询处

发布于

封面图片ACM其他会议

ICVGIP’12：第八届印度计算机视觉、图形和图像处理会议记录

2012年12月

633页

十亿英镑：9781450316606

内政部：10.1145/2425333

课程主席：
账单触发
法国CNRS
,
卡维塔·巴拉
康奈尔大学
,
莎拉·钱德兰
印度孟买IIT

版权所有©2012 ACM。

如果复制品不是为了盈利或商业利益而制作或分发的，并且复制品的第一页载有本通知和完整引文，则允许免费制作本作品的全部或部分数字或硬拷贝以供个人或课堂使用。必须尊重ACM以外的其他人对本作品组成部分的版权。允许用信用证进行摘要。要以其他方式复制或重新发布，在服务器上发布或重新发布到列表，需要事先获得特定许可和/或付费。从请求权限[电子邮件保护]

出版商

计算机协会

美国纽约州纽约市

出版历史

出版：2012年12月16日

权限

请求对此文章的权限。

检查更新

作者标记

限定符

研究文章

会议

ICVGIP’12

ICVGIP’12：第八届印度视觉、图形和图像处理会议

2012年12月16日至19日

印度孟买

接受率

286份提交文件的总体接受率为95，33%

贡献者

其他指标

查看文章指标

文献计量学和引文

文献计量学

文章指标

1
引文总数
查看引文
140
总下载次数

下载次数（过去12个月）0
下载次数（最近6周）0

其他指标

查看作者指标

引文

引用人

王H邓W(2015)基于紧致Fisher向量的人脸识别生物特征识别技术10.1007/978-3-319-25417-3_9(68-77)在线发布日期：2015年10月24日
https://doi.org/10.1007/978-3-319-25417-3_9

视图选项

获取访问权限

登录选项

检查您是否可以通过登录凭据或您的机构访问本文。

完全访问权限

获取此出版物

视图选项

PDF格式

以PDF文件的形式查看或下载。

电子阅读器

使用联机查看电子阅读器.

电子阅读器

媒体

数字

其他

桌子