埃里克·罗德纳;亚历山大·弗雷塔格;保罗·博德斯海姆;比约恩·弗里奇;乔阿希姆·登茨勒 视觉识别任务中使用广义直方图交集核的大尺度高斯过程推理。 (英语) 兹比尔1458.68251 国际期刊计算。视觉。 121,第2期,253-280(2017). 总结:我们提出了在大规模场景中进行快速高斯过程(GP)推理的新方法,包括带标记回归的精确多类分类、超参数优化和不确定性预测。与以前的方法相比,我们使用了一个完全高斯过程模型,没有稀疏近似技术。我们的方法是基于利用广义直方图交集核及其快速核乘法。我们通过数万个例子实证验证了我们的技术在广泛场景中的适用性。虽然在这些设置中,由于内存消耗和计算时间,普通GP模型很难处理,但我们的结果表明,确实可以有效地进行精确推断。因此,我们使高斯过程框架的每一个重要部分——学习、推理、超参数优化、方差估计和在线学习——都能在包含大量数据的实际场景中使用。 引用于1文件 MSC公司: 68T45型 机器视觉和场景理解 60G15年 高斯过程 68T05型 人工智能中的学习和自适应系统 关键词:大规模学习;高斯过程;超参数优化;视觉识别 软件:伦敦银行支持向量机;LIBLINEAR银行;脱咖啡因咖啡;AlexNet公司;ImageNet公司;青蒿素;RALF公司 PDF格式BibTeX公司 XML格式引用 \textit{E.Rodner}等人,《国际计算杂志》。视觉。121,第2号,253--280(2017;Zbl 1458.68251) 全文: 内政部 参考文献: [1] Ablavsky,V.和Sclaroff,S.(2011年)。在单纯形流形上学习参数化直方图核,用于图像和动作分类。IEEE国际计算机视觉会议(ICCV)第1473-1480页。 [2] Bai,Z.和Golub,G.H.(1997年)。对称正定矩阵的逆矩阵和行列式的迹的界。《数值数学年鉴》,4(1-4),29-38·Zbl 0883.15013号 [3] Barla,A.、Odone,F.和Verri,A.(2003)。用于图像分类的直方图交集核。IEEE图像处理国际会议(ICIP),第513-516页。 [4] Berg,A.C.、Deng,J.和Fei-Fei,L.(2010年)。大规模视觉识别挑战。http://www.imagenet.org/challenges/LSVRC/2010/。 [5] Bo,L.和Sminchisescu,C.(2008)。大规模高斯过程回归的贪婪块坐标下降。人工智能中的不确定性(UAI)。 [6] Bo,L.和Sminchisescu,C.(2010年)。结构化预测的双高斯过程。国际计算机视觉杂志(IJCV),87(1-2),28-52·doi:10.1007/s11263-008-0204-y [7] Bo,L.和Sminchisescu,C.(2012年)。大规模高斯过程回归的贪婪块坐标下降。Computing Research Repository(CoRR)abs/1206.3238,之前出版于《人工智能不确定性》(UAI)。 [8] Bonilla,E.V.、Chai,K.M.A.和Williams,C.K.I.(2008年)。多任务高斯过程预测。《神经信息处理系统进展》(NIPS)(第153-160页)。剑桥:麻省理工学院出版社。 [9] Bottou,L.、Chapelle,O.、DeCoster,D.和Weston,J.(编辑)。(2007). 大型内核机器。剑桥:麻省理工学院出版社。 [10] Boughorbel,S.、Tarel,J.P.和Boujemaa,N.(2005年)。用于图像识别的广义直方图交集核。IEEE图像处理国际会议(ICIP),第161-164页。 [11] Chang,C.C.和Lin,C.J.(2011)。Libsvm:一个支持向量机库。ACM智能系统与技术汇刊(TIST),2,1-27·数字对象标识代码:10.1145/1961189.1961199 [12] Deng,J.、Berg,A.、Li,K.和Fei-Fei,L.(2010)。对10000多个图像类别进行分类告诉了我们什么?在欧洲计算机视觉会议(ECCV)上,第71-84页。 [13] Donahue,J.、Jia,Y.、Vinyals,O.、Hoffman,J.,Zhang,N.、Tzeng,E.和Darrell,T.(2013)。Decaf:用于一般视觉识别的深度卷积激活功能。arXiv预打印arXiv:1310.1531。 [14] Ebert,S.、Fritz,M.和Schiele,B.(2012年)。Ralf:用于对象类识别的强化主动学习公式。在IEEE计算机视觉和模式识别(CVPR)会议上,第3626-3633页。 [15] Fan,R.E.,Chang,K.W.,Hsieh,C.J.,Wang,X.R.,&Lin,C.J.(2008)。Liblinear:大型线性分类库。机器学习研究杂志(JMLR),91871-1874·Zbl 1225.68175号 [16] Freytag,A.、Fröhlich,B.、Rodner,E.和Denzler,J.(2012a)。使用高斯过程和直方图相交核进行有效的语义分割。在模式识别国际会议(ICPR)上,第3313-3316页。 [17] Freytag,A.、Rodner,E.、Bodesheim,P.和Denzler,J.(2012b)。使用高斯过程和直方图相交核快速计算不确定性。摘自:亚洲计算机视觉会议(ACCV),第511-524页。 [18] Freytag,A.、Rodner,E.、Bodesheim,P.和Denzler,J.(2013)。标注重要示例:基于相关性的高斯过程主动学习。在德国模式识别会议(GCPR)上,第282-291页。 [19] Freytag,A.、Rodner,E.和Denzler,J.(2014a)。选择有影响力的例子:积极学习,预期模型输出发生变化。参加:欧洲计算机视觉会议(ECCV)。 [20] Freytag,A.、Rühle,J.、Bodesheim,P.、Rodner,E.和Denzler,J.(2014b)。看穿视觉眼镜:理解特征提取方法中的量化效果。In:模式识别国际会议(ICPR)-FEAST研讨会。 [21] Grauman,K.和Darrell,T.(2007年)。金字塔匹配内核:利用一组特征进行高效学习。机器学习研究杂志(JMLR),8(4月),725-760·Zbl 1222.68206号 [22] He,H.,&Siu,W.C.(2011)。使用高斯过程回归的单图像超分辨率。IEEE计算机视觉和模式识别会议(CVPR),第449-456页。 [23] Hestenes,M.R.和Stiefel,E.(1952年)。求解线性系统的共轭梯度法。国家标准局研究期刊,49(6),409-436·Zbl 0048.09901号 ·doi:10.6028/jres.049.044 [24] Käding,C.、Freytag,A.、Rodner,E.、Bodesheim,P.和Denzler,J.(2015)。在存在无法描述的实例时主动学习和发现对象类别。在IEEE计算机视觉和模式识别(CVPR)会议上,第4343-4352页。 [25] Kapoor,A.、Grauman,K.、Urtasun,R.和Darrell,T.(2010年)。对象分类的高斯过程。国际计算机视觉杂志(IJCV),88(2),169-188·Zbl 1477.68384号 ·doi:10.1007/s11263-009-0268-3 [26] Kemmler,M.、Rodner,E.和Denzler,J.(2010年)。高斯过程的一类分类。摘自:亚洲计算机视觉会议,第2卷,第489-500页。 [27] Krizhevsky,A.、Sutskever,I.和Hinton,G.E.(2012)。基于深度卷积神经网络的Imagenet分类。神经信息处理系统(NIPS)进展。 [28] Lazebnik,S.、Schmid,C.和Ponce,J.(2006)。除了一袋袋的特征:用于识别自然场景类别的空间金字塔匹配。在IEEE计算机视觉和模式识别(CVPR)会议上,第2169-2178页。 [29] Maji,S.、Berg,A.C.和Malik,J.(2008)。使用交叉核支持向量机进行分类是有效的。在IEEE计算机视觉和模式识别(CVPR)会议上,第1-8页。 [30] Maji,S.、Berg,A.C.和Malik,J.(2013)。加性核支持向量机的有效分类。IEEE模式分析和机器智能汇刊(TPAMI),35(1),66-77·doi:10.1109/TPAMI.2012.62 [31] Nelder,J.A.和Mead,R.(1965年)。函数最小化的单纯形方法。《计算机杂志》,7(4),308-313·Zbl 0229.65053号 ·doi:10.1093/comjnl/7.4.308 [32] Nickisch,H.和Rasmussen,C.E.(2008)。二元高斯过程分类的近似。机器学习研究杂志,9(10),2035-2078·Zbl 1225.62087号 [33] Nocedal,J.和Wright,S.J.(2006年)。共轭梯度法。纽约:斯普林格。 [34] Perronnin,F.、Akata,Z.、Harchaoui,Z.和Schmid,C.(2012)。面向图像分类大规模学习的良好实践。在IEEE计算机视觉和模式识别(CVPR)会议上,第3482-3489页。 [35] Pillonetto,G.、Dinuzzo,F.和Nicolao,G.D.(2010年)。高斯过程的贝叶斯在线多任务学习。IEEE模式分析和机器智能汇刊(TPAMI),32(2),193-205·doi:10.1109/TPAMI.2008.297 [36] Quattoni,A.和Torralba,A.(2009年)。识别室内场景。摘自:IEEE计算机视觉和模式识别会议(CVPR),第413-420页。 [37] Quiñonero Candela,J.和Rasmussen,C.E.(2005)。稀疏近似高斯过程回归的统一观点。机器学习研究杂志(JMLR),1939-1959年6月·Zbl 1222.68282号 [38] Rasmussen,C.E.和Williams,C.K.I.(2006)。机器学习的高斯过程。自适应计算和机器学习。剑桥:麻省理工学院出版社·Zbl 1177.68165号 [39] Rodner,E.(2011)。从几个例子中学习视觉识别问题。Hut Verlag München,http://herakles.inf-cv.uni-jena.de/biborb/bibs/cv/papers/Rodner11:Diss.pdf。 [40] Rodner,E.、Hegazy,D.和Denzler,J.(2010年)。飞行时间图像中通用三维物体识别的多核高斯过程分类。摘自:新西兰图像和视觉计算国际会议(IVCNZ),第1-8页。 [41] Rodner,E.、Freytag,A.、Bodesheim,P.和Denzler,J.(2012)。具有灵活自适应直方图核的大规模高斯过程分类。欧洲计算机视觉会议,第4卷,第85-98页。 [42] Russakovsky,O.、Deng,J.、Su,H.、Krause,J.,Satheesh,S.、Ma,S.等人(2015)。ImageNet大规模视觉识别挑战。国际计算机视觉杂志(IJCV),115,1-42·doi:10.1007/s11263-015-0816-y [43] Schölkopf,B.和Smola,A.J.(2001)。使用内核学习:支持向量机、正则化、优化及其他。剑桥:麻省理工学院出版社。 [44] Snoek,J.、Larochelle,H.和Adams,R.P.(2012)。机器学习算法的实用贝叶斯优化。《神经信息处理系统进展》,第2951-2959页。 [45] Sun,J.和Ponce,J.(2013)。学习用于图像分类和共分割的判别部分检测器。在IEEE国际计算机视觉会议(ICCV)上。 [46] Tong,S.和Koller,D.(2001)。支持向量机主动学习,并应用于文本分类。机器学习研究杂志(JMLR),2(11月),45-66·Zbl 1009.68131号 [47] Urtasun,R.和Darrell,T.(2008)。用于与活动无关的人体姿势推断的稀疏概率回归。摘自:IEEE计算机视觉和模式识别会议(CVPR),第1-8页。 [48] Vapnik,V.(1998)。统计学习理论(第2卷)。纽约:Wiley·Zbl 0935.62007号 [49] Vázquez,D.、Marin,J.、Lopez,A.M.、Geronimo,D.和Ponsa,D.(2014)。用于行人检测的虚拟和现实世界自适应。IEEE模式分析和机器智能汇刊(TPAMI),36(4),797-809·doi:10.1109/TPAMI.2013.163 [50] Vedaldi,A.和Zisserman,A.(2010年)。通过显式特征映射实现高效的加性核。摘自:IEEE计算机视觉和模式识别会议(CVPR),第3539-3546页。 [51] Vedaldi,A.、Gulshan,V.、Varma,M.和Zisserman,A.(2009年)。用于对象检测的多个内核。IEEE计算机视觉国际会议(ICCV),第606-613页。 [52] Wang,G.、Hoiem,D.和Forsyth,D.(2012年)。使用快速内核机器从flickr组学习图像相似性。IEEE模式分析和机器智能汇刊(TPAMI),34(11),2177-2188·doi:10.1109/TPAMI.2012.29 [53] Williams,C.K.I.和Seeger,M.(2000)。输入密度分布对基于核分类器的影响。摘自:国际机器学习会议(ICML),第1159-1166页。 [54] Wu,J.(2010)。一种快速的hik-svm对偶学习方法。摘自:欧洲计算机视觉会议,第552-565页。 [55] Wu,J.(2012)。高效的hik-svm学习用于图像分类。IEEE图像处理学报(TIP),21(10),4442-4453·Zbl 1381.62196号 ·doi:10.1109/TIP.2012.2207392 [56] Yuan,Q.、Thangali,A.、Ablavsky,V.和Sclaroff,S.(2008)。乘法内核:对象检测、分割和姿态估计。计算机视觉和模式识别(CVPR),IEEE,第1-8页。 [57] Yuster,R.(2008)。通过嵌套分割进行秩和行列式计算的矩阵稀疏化。摘自:IEEE计算机科学基础研讨会(FOCS),第137-145页。 此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。