×

可变形分类器。 (英语) Zbl 1414.62294号

摘要:物体的几何变化不会修改物体类别,这对物体识别提出了一个主要挑战。这些变化可以是刚性变换,也可以是非刚性变换。在本文中,我们设计了一个用于训练可变形分类器的框架,其中引入了潜在的变换变量,并根据分类器输出计算对象图像到参考实例化的变换,分别针对每个类。转换后,将比较每个类的分类器输出,以得出最终决策。作为分类的副产品,这会将输入对象转换为参考姿势,可用于下游任务,如对象支持计算。我们为我们的框架应用了一种两步训练机制,它交替优化潜在的变换变量和分类器参数,以最小化损失函数。我们表明,多层感知器(也称为深度网络)非常适合这种方法,并在旋转的MNIST和Google Earth数据集上实现了最先进的结果,并且当在较小的训练数据子集上训练时,在MNIST和CIFAR-10上产生了有竞争力的结果。

MSC公司:

62华氏35 多元分析中的图像分析
62H30型 分类和区分;聚类分析(统计方面)
第60页 统计学在工程和工业中的应用;控制图
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Allassonni`“ere,S.;Amit,Y.;Trouv'”{e},A.,《走向致密可变形模板估计的相干统计框架》,J.R.Stat.Soc.Ser。B统计方法。,69, 1, 3-29 (2007) ·Zbl 07555347号 ·doi:10.1111/j.1467-9868.2007.00574.x
[2] 阿米特,Y。;美国格伦纳德。;Piccioni,M.,通过可变形模板恢复结构图像,美国统计协会杂志,86,414,376-387(1991)
[3] 阿米特,Y。;Trouv’e,A.,Pop:对象识别零件模型的拼接,国际期刊。公司的。视觉。,75, 267-282 (2007)
[4] S.Andrews、I.Tsochantaridis和T.Hofmann,用于多实例学习的支持向量机,《神经信息处理系统的进展》,第577-584页,2003年。
[5] F.L.Bookstein,《主要翘曲:薄板样条和变形分解》,IEEE模式分析和机器智能汇刊,11(6):567-5851989年·Zbl 0691.65002号
[6] T.S.Cohen和M.Welling,群等变卷积网络,arXiv预印本arXiv:1602.07576(2016)。
[7] T.S.Cohen和M.Welling。Steerable cnns,arXiv预印本arXiv:1612.08498(2016)。
[8] S.Dieleman、J.De Fauw和。Kavukcuoglu,利用卷积神经网络中的循环对称性,arXiv预印本arXiv:1602.02660(2016)。
[9] A.Dosovitskiy、J.T.Springenberg、M.Riedmiller和T.Brox,卷积神经网络的非监督鉴别特征学习,神经信息处理系统进展,第766-774页,2014年。
[10] S.Dieleman、K.W.Willett和J.Dambre,用于星系形态预测的旋转不变卷积神经网络,皇家天文学会月刊,450(2):1441-14592015。
[11] P.F.Felzenszwalb、R.B.Girshick、D.McAllester和D.Ramanan,基于区分训练的部件模型的对象检测,模式分析和机器智能方面的IEEE事务,32(9):1627-16452010年。
[12] B.Fasel和D.Gatica-Perez,《旋转变异新感受器》,模式识别,2006年。ICPR 2006。第18届国际会议,第3卷,第336-339页。IEEE,2006年。
[13] R.Gens和P.M.Domingos,深度对称网络,神经信息处理系统进展,第2537-2545页,2014年。
[14] 格伦德,乌尔夫,《一般模式理论》,牛津数学专著,xxii+883页(1993),克拉伦登出版社,牛津大学出版社,纽约·Zbl 0827.68098号
[15] 美国格伦纳德。;周,Y。;基南博士。,《生物形态的模式理论研究》(1991),斯普林格·弗拉格:纽约:斯普林格尔·弗拉格·Zbl 0808.68018号
[16] 格伦纳德,乌尔夫;Michael I.Miller,《计算解剖学:一门新兴学科》,Quart。申请。数学。,56, 4, 617-694 (1998) ·Zbl 0952.92016号 ·doi:10.1090/qam/1668732
[17] G.Heitz和D.Koller,《学习空间上下文:用东西寻找事物》,欧洲计算机视觉会议,第30-43页。施普林格,2008年。
[18] J.F.Henriques、P.Martins、R.F.Caseiro和J.Batista,傅里叶域中姿态检测器的快速训练,神经信息处理系统的进展,第3050-30582014页。
[19] J.F.Henriques和A.Vedaldi,《扭曲卷积:空间变换的有效不变性》,arXiv预印本arXiv:1609.04382(2016)。
[20] M.Jaderberg、K.Simonyan、A.Zisserman等人。,空间变压器网络,《神经信息处理系统进展》,第2017-2025页,2015年。
[21] A.Krizhevsky和G.Hinton,《从微小图像中学习多层特征》,2009年。
[22] Y.LeCun、C.Cortes和C.J.C.Burges,《mnist手写数字数据库》,1998年。
[23] D.Laptev、N.Savinov、J.M.Buhmann和M.Pollefeys,Ti-pooling:卷积神经网络中特征学习的变换-变量池,IEEE计算机视觉和模式识别会议论文集,第289-297页,2016年。
[24] H.Larochelle、D.Erhan、A.Courville、J.Bergstra和Y.Bengio,《对具有多种变化因素的问题的深层架构的经验评估》,《第24届机器学习国际会议论文集》,第473-480页。ACM,2007年。
[25] D.Marcos、M.Volpi、N.Komodakis和D.Tuia,《旋转等变向量场网络》,arXiv预印本arXiv:1612.09346(2016)。
[26] 迈克尔·I·米勒。;特鲁夫,阿兰;Younes,Laurent,《计算解剖学测地摄影》,J.Math。成像视觉,24,2209-228(2006)·Zbl 1478.92084号 ·doi:10.1007/s10851-005-3624-0
[27] A.Radford、L.Metz和S.Chintala,深度卷积生成对抗网络的无监督表征学习,arXiv预印本arXiv:1511.06434(2015)。
[28] I.Rocco、R.Arandjelovic和J.Sivic,用于几何匹配的卷积神经网络架构,Proc。CVPR,2017年第2卷。
[29] N.S.Detlefsen、O.Freifeld和S.Hauberg,深度微分变压器网络,IEEE计算机视觉和模式识别会议记录,第4403-4412页,2018年。
[30] K.Sohn和H.Lee,通过局部变换学习不变量表示,arXiv预印本arXiv:1206.6418(2012)。
[31] D.Teney和M.Hebert,《学习从卷积神经网络视频中提取运动》,arXiv预印本arXiv:1601.07532(2016)。
[32] N.van Noord和E.Postma,学习深度图像分类的尺度变异和尺度变异特征,模式识别,61:583-5922017。
[33] F.Wu、P.Hu和D.Kong,图像分类用卷积神经网络上的倒转池卷积和分离丢包,arXiv预印本arXiv:1507.08754(2015)。
[34] X.Yang、R.Kwitt、M.Styner和M.Niethammer,《Quicksilver:快速预测图像注册——深度学习方法》,《神经影像》,158:378-3962017年。
[35] Younes,Laurent,《形状和微分形态》,《应用数学科学》171,xviii+434 pp.(2010),柏林斯普林格·弗拉格出版社·Zbl 1205.68355号 ·doi:10.1007/978-3642-12055-8
[36] 周瑜、叶琦、邱琦、焦建杰,面向响应网络,arXiv预印本arXiv:1701.01833(2017)。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。