跳到主要内容
10.1145/2425333.2425388交流会议文章/章节视图摘要出版物页面icvgip公司会议记录会议集合
研究论文

视觉分类中的稀疏判别Fisher向量

出版:2012年12月16日 出版历史
  • 获取引文提醒
  • 摘要

    从局部特征描述符构造全局图像表示是大多数视觉分类任务中的常见步骤。传统上,涉及硬矢量量化的特征包(BoF)表示已广泛用于此类任务。最近的研究表明,软作业的表现优于硬作业。在大多数基准数据集上,Fisher向量表示已被证明优于其他全局表示。Fisher向量(i)使用软赋值,以及(ii)通过捕获平均值的偏差来减少量化导致的信息损失。然而,Fisher向量表示是巨大的,并且表示大小随词汇表大小线性增加。最近的研究表明,Fisher向量的分类性能与词汇量成正比。然而,计算和存储需求不鼓励使用任意大的词汇表。此外,Fisher向量本身并不是有区别的。本文设计了一种计算稀疏Fisher表示的新策略。这使得我们可以在很少的计算和存储开销的情况下增加词汇表的大小,并且仍然可以获得更大词汇表的性能。此外,我们描述了一种在Fisher向量中编码类鉴别信息的方法。我们在四个流行的数据集上评估了我们的方法。实证结果表明,我们的表示始终优于传统的Fisher向量表示,并且与最先进的方法相当。

    工具书类

    [1]
    R.Arandjelović和A.Zisserman。要改进对象检索,每个人都应该知道三件事。CVPR公司, 2012.
    [2]
    Y.-L.Boureau、F.Bach、Y.LeCun和J.Ponce。学习中级识别功能。CVPR公司, 2010.
    [3]
    K.查特菲尔德、V.伦皮茨基、A.韦达尔迪和A.齐瑟曼。问题在于细节:对最新特征编码方法的评估。BMVC公司, 2011.
    [4]
    C.chung Chang和C.-J.Lin.Libsvm:支持向量机库,2001年。
    [5]
    L.V.der Maaten公司。学习有辨别力的fisher内核。ICML公司, 2011.
    [6]
    S.Gao、I.W.-H.Tsang和L.-T.Chia。用于图像分类和人脸识别的核稀疏表示。电子计算机控制, 2010.
    [7]
    J.C.Gemert、J.-M Geusebroek、C.J.Veenman和A.W.Smeulders。用于场景分类的内核代码簿。电子对抗车辆, 2008.
    [8]
    T.Jaakkola和D.Haussler。在区分分类器中开发生成模型。NIPS公司, 1998.
    [9]
    H.Jégou、F.Perronnin、M.Douze、J.Sánchez、P.Pérez和C.Schmid。将局部图像描述符聚合为紧凑代码。PAMI公司, 2011.
    [10]
    F.Jurie和B.Triggs。为视觉识别创建高效的代码簿。CVPR公司, 2005.
    [11]
    J.Krapac、J.J.Verbeek和F.Jurie。用fisher向量建模空间布局以进行图像分类。ICCV公司, 2011.
    [12]
    E.P.X.李佳丽、郝苏和L.Fei-Fei。对象库:用于场景分类和语义特征稀疏化的高级图像表示。NIPS公司, 2010.
    [13]
    M.Pandey和S.Lazebnik。基于可变形部分模型的场景识别和弱监督目标定位。CVPR公司, 2011.
    [14]
    F.佩罗宁和C.R.丹斯。图像分类视觉词汇的Fisher内核。CVPR公司, 2007.
    [15]
    F.Perronnin、Y.Liu、J.Sanchez和H.Poirier。基于压缩fisher向量的大尺度图像检索。CVPR公司, 2010.
    [16]
    F.Perronnin、J.Sánchez和T.Mensink。改进fisher核用于大规模图像分类。电子计算机控制, 2010.
    [17]
    A.Quattoni和A.B.Torralba。识别室内场景。CVPR公司, 2009.
    [18]
    J.Sanchez和F.Perronnin。用于大规模图像分类的高维特征压缩。CVPR公司, 2011.
    [19]
    C.施密德。除了一袋袋的特征:用于识别自然场景类别的空间金字塔匹配。CVPR公司, 2006.
    [20]
    G.Sharma、F.Jurie和C.Schmid。用于图像分类的判别空间显著性。CVPR公司, 2012.
    [21]
    A.Vedaldi和B.Fulkerson。VLFeat:一个开放的、可移植的计算机视觉算法库。网址:http://www.vlfeat.org/, 2008.
    [22]
    A.Vedaldi和A.Zisserman。稀疏核近似用于有效的分类和检测。CVPR公司, 2012.
    [23]
    J.Wang、J.Yang、K.Yu、F.Lv、T.S.Huang和Y.Gong。用于图像分类的局部约束线性编码。CVPR公司, 2010.
    [24]
    J.Wright、Y.Ma、J.Mairal、G.Sapiro、T.Huang和S.Yan。计算机视觉和模式识别的稀疏表示。IEEE会议记录, 2010.
    [25]
    J.Wu和J.M.Rehg。Centrist:用于场景分类的视觉描述符。PAMI公司, 2011.
    [26]
    J.Xiao、J.Hays、K.A.Ehinger、A.Oliva和A.Torralba。太阳数据库:从修道院到动物园的大规模场景识别。CVPR公司, 2010.
    [27]
    X.Zhou、K.Yu、T.Zhang和T.S.Huang。使用局部图像描述符的超矢量编码进行图像分类。电子对抗车辆, 2010.

    引用人

    查看全部

    建议

    评论

    信息和贡献者

    问询处

    发布于

    封面图片ACM其他会议
    ICVGIP’12:第八届印度计算机视觉、图形和图像处理会议记录
    2012年12月
    633页
    十亿英镑:9781450316606
    内政部:10.1145/2425333
    如果复制品不是为了盈利或商业利益而制作或分发的,并且复制品的第一页载有本通知和完整引文,则允许免费制作本作品的全部或部分数字或硬拷贝以供个人或课堂使用。必须尊重ACM以外的其他人对本作品组成部分的版权。允许用信用证进行摘要。要以其他方式复制或重新发布,在服务器上发布或重新发布到列表,需要事先获得特定许可和/或付费。从请求权限[电子邮件保护]

    出版商

    计算机协会

    美国纽约州纽约市

    出版历史

    出版:2012年12月16日

    权限

    请求对此文章的权限。

    检查更新

    作者标记

    1. Fisher向量
    2. 区别特征
    3. 稀疏表示
    4. 目视分类

    限定符

    • 研究文章

    会议

    ICVGIP’12

    接受率

    286份提交文件的总体接受率为95,33%

    贡献者

    其他指标

    文献计量学和引文

    文献计量学

    文章指标

    • 下载次数(过去12个月)0
    • 下载次数(最近6周)0

    其他指标

    引文

    引用人

    查看全部

    视图选项

    获取访问权限

    登录选项

    完全访问权限

    视图选项

    PDF格式

    以PDF文件的形式查看或下载。

    PDF格式

    电子阅读器

    使用联机查看电子阅读器.

    电子阅读器

    媒体

    数字

    其他

    桌子

    分享

    分享

    共享此出版物链接

    在社交媒体上分享