×

视觉识别任务中使用广义直方图交集核的大尺度高斯过程推理。 (英语) 兹比尔1458.68251

总结:我们提出了在大规模场景中进行快速高斯过程(GP)推理的新方法,包括带标记回归的精确多类分类、超参数优化和不确定性预测。与以前的方法相比,我们使用了一个完全高斯过程模型,没有稀疏近似技术。我们的方法是基于利用广义直方图交集核及其快速核乘法。我们通过数万个例子实证验证了我们的技术在广泛场景中的适用性。虽然在这些设置中,由于内存消耗和计算时间,普通GP模型很难处理,但我们的结果表明,确实可以有效地进行精确推断。因此,我们使高斯过程框架的每一个重要部分——学习、推理、超参数优化、方差估计和在线学习——都能在包含大量数据的实际场景中使用。

MSC公司:

68T45型 机器视觉和场景理解
60G15年 高斯过程
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Ablavsky,V.和Sclaroff,S.(2011年)。在单纯形流形上学习参数化直方图核,用于图像和动作分类。IEEE国际计算机视觉会议(ICCV)第1473-1480页。
[2] Bai,Z.和Golub,G.H.(1997年)。对称正定矩阵的逆矩阵和行列式的迹的界。《数值数学年鉴》,4(1-4),29-38·Zbl 0883.15013号
[3] Barla,A.、Odone,F.和Verri,A.(2003)。用于图像分类的直方图交集核。IEEE图像处理国际会议(ICIP),第513-516页。
[4] Berg,A.C.、Deng,J.和Fei-Fei,L.(2010年)。大规模视觉识别挑战。http://www.imagenet.org/challenges/LSVRC/2010/。
[5] Bo,L.和Sminchisescu,C.(2008)。大规模高斯过程回归的贪婪块坐标下降。人工智能中的不确定性(UAI)。
[6] Bo,L.和Sminchisescu,C.(2010年)。结构化预测的双高斯过程。国际计算机视觉杂志(IJCV),87(1-2),28-52·doi:10.1007/s11263-008-0204-y
[7] Bo,L.和Sminchisescu,C.(2012年)。大规模高斯过程回归的贪婪块坐标下降。Computing Research Repository(CoRR)abs/1206.3238,之前出版于《人工智能不确定性》(UAI)。
[8] Bonilla,E.V.、Chai,K.M.A.和Williams,C.K.I.(2008年)。多任务高斯过程预测。《神经信息处理系统进展》(NIPS)(第153-160页)。剑桥:麻省理工学院出版社。
[9] Bottou,L.、Chapelle,O.、DeCoster,D.和Weston,J.(编辑)。(2007). 大型内核机器。剑桥:麻省理工学院出版社。
[10] Boughorbel,S.、Tarel,J.P.和Boujemaa,N.(2005年)。用于图像识别的广义直方图交集核。IEEE图像处理国际会议(ICIP),第161-164页。
[11] Chang,C.C.和Lin,C.J.(2011)。Libsvm:一个支持向量机库。ACM智能系统与技术汇刊(TIST),2,1-27·数字对象标识代码:10.1145/1961189.1961199
[12] Deng,J.、Berg,A.、Li,K.和Fei-Fei,L.(2010)。对10000多个图像类别进行分类告诉了我们什么?在欧洲计算机视觉会议(ECCV)上,第71-84页。
[13] Donahue,J.、Jia,Y.、Vinyals,O.、Hoffman,J.,Zhang,N.、Tzeng,E.和Darrell,T.(2013)。Decaf:用于一般视觉识别的深度卷积激活功能。arXiv预打印arXiv:1310.1531。
[14] Ebert,S.、Fritz,M.和Schiele,B.(2012年)。Ralf:用于对象类识别的强化主动学习公式。在IEEE计算机视觉和模式识别(CVPR)会议上,第3626-3633页。
[15] Fan,R.E.,Chang,K.W.,Hsieh,C.J.,Wang,X.R.,&Lin,C.J.(2008)。Liblinear:大型线性分类库。机器学习研究杂志(JMLR),91871-1874·Zbl 1225.68175号
[16] Freytag,A.、Fröhlich,B.、Rodner,E.和Denzler,J.(2012a)。使用高斯过程和直方图相交核进行有效的语义分割。在模式识别国际会议(ICPR)上,第3313-3316页。
[17] Freytag,A.、Rodner,E.、Bodesheim,P.和Denzler,J.(2012b)。使用高斯过程和直方图相交核快速计算不确定性。摘自:亚洲计算机视觉会议(ACCV),第511-524页。
[18] Freytag,A.、Rodner,E.、Bodesheim,P.和Denzler,J.(2013)。标注重要示例:基于相关性的高斯过程主动学习。在德国模式识别会议(GCPR)上,第282-291页。
[19] Freytag,A.、Rodner,E.和Denzler,J.(2014a)。选择有影响力的例子:积极学习,预期模型输出发生变化。参加:欧洲计算机视觉会议(ECCV)。
[20] Freytag,A.、Rühle,J.、Bodesheim,P.、Rodner,E.和Denzler,J.(2014b)。看穿视觉眼镜:理解特征提取方法中的量化效果。In:模式识别国际会议(ICPR)-FEAST研讨会。
[21] Grauman,K.和Darrell,T.(2007年)。金字塔匹配内核:利用一组特征进行高效学习。机器学习研究杂志(JMLR),8(4月),725-760·Zbl 1222.68206号
[22] He,H.,&Siu,W.C.(2011)。使用高斯过程回归的单图像超分辨率。IEEE计算机视觉和模式识别会议(CVPR),第449-456页。
[23] Hestenes,M.R.和Stiefel,E.(1952年)。求解线性系统的共轭梯度法。国家标准局研究期刊,49(6),409-436·Zbl 0048.09901号 ·doi:10.6028/jres.049.044
[24] Käding,C.、Freytag,A.、Rodner,E.、Bodesheim,P.和Denzler,J.(2015)。在存在无法描述的实例时主动学习和发现对象类别。在IEEE计算机视觉和模式识别(CVPR)会议上,第4343-4352页。
[25] Kapoor,A.、Grauman,K.、Urtasun,R.和Darrell,T.(2010年)。对象分类的高斯过程。国际计算机视觉杂志(IJCV),88(2),169-188·Zbl 1477.68384号 ·doi:10.1007/s11263-009-0268-3
[26] Kemmler,M.、Rodner,E.和Denzler,J.(2010年)。高斯过程的一类分类。摘自:亚洲计算机视觉会议,第2卷,第489-500页。
[27] Krizhevsky,A.、Sutskever,I.和Hinton,G.E.(2012)。基于深度卷积神经网络的Imagenet分类。神经信息处理系统(NIPS)进展。
[28] Lazebnik,S.、Schmid,C.和Ponce,J.(2006)。除了一袋袋的特征:用于识别自然场景类别的空间金字塔匹配。在IEEE计算机视觉和模式识别(CVPR)会议上,第2169-2178页。
[29] Maji,S.、Berg,A.C.和Malik,J.(2008)。使用交叉核支持向量机进行分类是有效的。在IEEE计算机视觉和模式识别(CVPR)会议上,第1-8页。
[30] Maji,S.、Berg,A.C.和Malik,J.(2013)。加性核支持向量机的有效分类。IEEE模式分析和机器智能汇刊(TPAMI),35(1),66-77·doi:10.1109/TPAMI.2012.62
[31] Nelder,J.A.和Mead,R.(1965年)。函数最小化的单纯形方法。《计算机杂志》,7(4),308-313·Zbl 0229.65053号 ·doi:10.1093/comjnl/7.4.308
[32] Nickisch,H.和Rasmussen,C.E.(2008)。二元高斯过程分类的近似。机器学习研究杂志,9(10),2035-2078·Zbl 1225.62087号
[33] Nocedal,J.和Wright,S.J.(2006年)。共轭梯度法。纽约:斯普林格。
[34] Perronnin,F.、Akata,Z.、Harchaoui,Z.和Schmid,C.(2012)。面向图像分类大规模学习的良好实践。在IEEE计算机视觉和模式识别(CVPR)会议上,第3482-3489页。
[35] Pillonetto,G.、Dinuzzo,F.和Nicolao,G.D.(2010年)。高斯过程的贝叶斯在线多任务学习。IEEE模式分析和机器智能汇刊(TPAMI),32(2),193-205·doi:10.1109/TPAMI.2008.297
[36] Quattoni,A.和Torralba,A.(2009年)。识别室内场景。摘自:IEEE计算机视觉和模式识别会议(CVPR),第413-420页。
[37] Quiñonero Candela,J.和Rasmussen,C.E.(2005)。稀疏近似高斯过程回归的统一观点。机器学习研究杂志(JMLR),1939-1959年6月·Zbl 1222.68282号
[38] Rasmussen,C.E.和Williams,C.K.I.(2006)。机器学习的高斯过程。自适应计算和机器学习。剑桥:麻省理工学院出版社·Zbl 1177.68165号
[39] Rodner,E.(2011)。从几个例子中学习视觉识别问题。Hut Verlag München,http://herakles.inf-cv.uni-jena.de/biborb/bibs/cv/papers/Rodner11:Diss.pdf。
[40] Rodner,E.、Hegazy,D.和Denzler,J.(2010年)。飞行时间图像中通用三维物体识别的多核高斯过程分类。摘自:新西兰图像和视觉计算国际会议(IVCNZ),第1-8页。
[41] Rodner,E.、Freytag,A.、Bodesheim,P.和Denzler,J.(2012)。具有灵活自适应直方图核的大规模高斯过程分类。欧洲计算机视觉会议,第4卷,第85-98页。
[42] Russakovsky,O.、Deng,J.、Su,H.、Krause,J.,Satheesh,S.、Ma,S.等人(2015)。ImageNet大规模视觉识别挑战。国际计算机视觉杂志(IJCV),115,1-42·doi:10.1007/s11263-015-0816-y
[43] Schölkopf,B.和Smola,A.J.(2001)。使用内核学习:支持向量机、正则化、优化及其他。剑桥:麻省理工学院出版社。
[44] Snoek,J.、Larochelle,H.和Adams,R.P.(2012)。机器学习算法的实用贝叶斯优化。《神经信息处理系统进展》,第2951-2959页。
[45] Sun,J.和Ponce,J.(2013)。学习用于图像分类和共分割的判别部分检测器。在IEEE国际计算机视觉会议(ICCV)上。
[46] Tong,S.和Koller,D.(2001)。支持向量机主动学习,并应用于文本分类。机器学习研究杂志(JMLR),2(11月),45-66·Zbl 1009.68131号
[47] Urtasun,R.和Darrell,T.(2008)。用于与活动无关的人体姿势推断的稀疏概率回归。摘自:IEEE计算机视觉和模式识别会议(CVPR),第1-8页。
[48] Vapnik,V.(1998)。统计学习理论(第2卷)。纽约:Wiley·Zbl 0935.62007号
[49] Vázquez,D.、Marin,J.、Lopez,A.M.、Geronimo,D.和Ponsa,D.(2014)。用于行人检测的虚拟和现实世界自适应。IEEE模式分析和机器智能汇刊(TPAMI),36(4),797-809·doi:10.1109/TPAMI.2013.163
[50] Vedaldi,A.和Zisserman,A.(2010年)。通过显式特征映射实现高效的加性核。摘自:IEEE计算机视觉和模式识别会议(CVPR),第3539-3546页。
[51] Vedaldi,A.、Gulshan,V.、Varma,M.和Zisserman,A.(2009年)。用于对象检测的多个内核。IEEE计算机视觉国际会议(ICCV),第606-613页。
[52] Wang,G.、Hoiem,D.和Forsyth,D.(2012年)。使用快速内核机器从flickr组学习图像相似性。IEEE模式分析和机器智能汇刊(TPAMI),34(11),2177-2188·doi:10.1109/TPAMI.2012.29
[53] Williams,C.K.I.和Seeger,M.(2000)。输入密度分布对基于核分类器的影响。摘自:国际机器学习会议(ICML),第1159-1166页。
[54] Wu,J.(2010)。一种快速的hik-svm对偶学习方法。摘自:欧洲计算机视觉会议,第552-565页。
[55] Wu,J.(2012)。高效的hik-svm学习用于图像分类。IEEE图像处理学报(TIP),21(10),4442-4453·Zbl 1381.62196号 ·doi:10.1109/TIP.2012.2207392
[56] Yuan,Q.、Thangali,A.、Ablavsky,V.和Sclaroff,S.(2008)。乘法内核:对象检测、分割和姿态估计。计算机视觉和模式识别(CVPR),IEEE,第1-8页。
[57] Yuster,R.(2008)。通过嵌套分割进行秩和行列式计算的矩阵稀疏化。摘自:IEEE计算机科学基础研讨会(FOCS),第137-145页。
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。