阿什什·施里瓦斯塔瓦;维沙尔·帕特尔(Vishal M.Patel)。;Jaishanker K·皮莱。;拉马切拉普帕 用于多实例学习的通用词典。 (英语) Zbl 1398.68459号 国际期刊计算。视觉。 114,编号2-3,288-305(2015). 摘要:我们提出了一种使用字典学习框架的多类多实例学习(MIL)算法,其中数据以包的形式给出。每个包包含多个样本,称为实例,其中至少一个属于包的类。我们提出了一个噪声-OR模型和一个广义的基于均值的优化框架,用于在特征空间中学习字典。该方法可以看作是一种广义字典学习算法,因为当每个包中只有一个实例时,它可以简化为一种新的判别字典学习框架。使用流行的视觉相关MIL数据集以及UNBC-McMaster疼痛肩部档案数据库进行的各种实验表明,该方法的性能明显优于现有方法。 引用于三文件 MSC公司: 68T05型 人工智能中的学习和自适应系统 68吨10 模式识别、语音识别 68T45型 机器视觉和场景理解 关键词:稀疏编码;多实例学习;字典学习;物体识别;疼痛检测 PDF格式BibTeX公司 XML格式引用 \textit{A.Shrivastava}等人,《国际计算杂志》。视觉。114,编号2--3,288--305(2015;Zbl 1398.68459) 全文: 内政部 参考文献: [1] M·亚哈龙;Elad,M;Bruckstein,A,K-SVD:一种用于设计稀疏表示的过完备字典的算法,IEEE信号处理汇刊,5414311-4322,(2006)·Zbl 1375.94040号 ·doi:10.1109/TSP.2006.881199 [2] Amores,J,《多实例分类:综述、分类和比较研究》,人工智能,201,81-105,(2013)·兹比尔1334.68176 ·doi:10.1016/j.artint.2013.06.003 [3] 安德鲁斯;Tsochantaridis,Ⅰ;霍夫曼,T;Thrun,S(编辑);Obermayer,K(ed.),《支持向量机用于多实例学习》(2003),剑桥 [4] 阿什拉夫,AB;露西,S;科恩,JF;陈,T;安巴达,Z;普克钦,KM;Solomon,PE,使用主动外观模型进行痛苦的面部表情识别,图像和视觉计算,271788-1796,(2009)·doi:10.1016/j.imavis.2009.05.007 [5] Babenko,B.(2009年)。多实例学习:算法和应用。报告。 [6] Babenko,B.、Yang,M.H.和Belongie,S.(2009年)。通过在线多实例学习进行视觉跟踪。在IEEE计算机视觉和模式识别会议北京:IEEE出版社。 [7] Bunescu,R.和Mooney,R.(2007年)。稀疏正包的多实例学习。在第24届国际机器学习年会会议记录纽约:ACM。 [8] Cao,L.,Liu,Z.,&Huang,T.(2010)。跨数据集操作检测。在IEEE计算机视觉和模式识别会议普罗维登斯:IEEE出版社。 [9] 陈,Y;王建忠,基于区域学习和推理的图像分类,机器学习研究杂志,5,913-939,(2004) [10] 陈,Y;毕,J;Wang,JZ,MILES:通过嵌入式实例选择进行多实例学习,IEEE模式分析和机器智能汇刊,281931-1947,(2006)·doi:10.1109/TPAMI.2006.248 [11] Csurka,G.、Dance,C.R.、Fan,L.、Willamowski,J.和Bray,C.(2004)。用一袋袋的关键点进行视觉分类。在计算机视觉中的统计学习讲习班布拉格:ECCV。 [12] Dieterich,甘油三酯;Lathrop,RH,用轴平行矩形解决多重实体问题,人工智能,89,31-71,(1997)·Zbl 1042.68650号 ·doi:10.1016/S0004-3702(96)00034-3 [13] Elad,M.(2010年)。稀疏和冗余表示——从理论到信号和图像处理应用纽约:Springer·兹比尔1211.94001 [14] Galleguillos,C.、Babenko,B.、Rabinovich,A.和Belongie,S.(2008年)。具有稳定分割的弱监督目标定位。在第十届欧洲计算机视觉会议记录纽约:Springer。 [15] Gao,S.,Tsang,I.W.,&Chia,L.T.(2010年)。用于图像分类和人脸识别的核稀疏表示。在第十一届欧洲计算机视觉会议记录纽约:Springer。 [16] Gehler,P.V.和Chapelle,O.(2007年)。多因素学习的确定性退火。在第十一届国际人工智能与统计会议记录纽约:Springer。 [17] Harandi,M.、Sanderson,C.、Hartley,R.和Lovell,B.(2012年)。对称正定矩阵的稀疏编码和字典学习:一种核方法。在第十二届欧洲计算机视觉会议记录纽约:Springer。 [18] Hull,JJ,手写文本识别研究数据库,IEEE模式分析和机器智能汇刊,16,550-554,(1994)·数字对象标识代码:10.1109/34.291440 [19] 霍J.、高Y.、Yang,W.和Yin,H.(2012)。通过多实例字典学习进行异常事件检测。在智能数据工程和自动学习国际会议,纳塔尔。 [20] Jiang,Z.、Lin,Z.&Davis,L.S.(2011)。通过标签一致K-SVD学习稀疏编码的判别字典。在IEEE计算机视觉和模式识别会议普罗维登斯:IEEE出版社。 [21] Kokiopoulou,E;Frossard,P,通过监督降维实现语义编码,IEEE多媒体交易,10806-818,(2008)·doi:10.1109/TMM.2008.922806 [22] Laptev,I.、Marszalek,M.、Schmid,C.和Rozenfeld,B.(2008)。从电影中学习真实的人类行为。在IEEE计算机视觉和模式识别会议纽约:IEEE出版社。 [23] Leistner,C.、Safari,A.和Bischof,H.(2010年)。MIForests:随机树的多实例学习。在第十一届欧洲计算机视觉会议记录纽约:Springer。 [24] Leung,T.、Song,Y.和Zhang,J.(2011)。通过多实例学习处理视频分类中的标签噪声。在IEEE计算机视觉国际会议纽约:IEEE出版社。 [25] Lucey,P.、Howlett,J.、Cohn,J.F.、Lucey,S.、Sridharan,S.和Ambadar,Z.(2008)。通过更好地利用时间信息来改进疼痛识别。在视听语音处理国际会议。纽约:ACM出版社。 [26] Lucey,P.、Cohn,J.、Prkachin,K.、Solomon,P.和Matthews,I.(2011年)。痛苦数据:UNBC-McMaster肩部疼痛表情存档数据库。在自动面部手势识别国际会议和研讨会,洛斯阿拉米托斯. [27] Mairal,J.、Bach,F.、Ponce,J.和Sapiro,G.(2009年)。稀疏编码的在线词典学习。在第26届机器学习国际年会论文集纽约:ACM出版社·Zbl 1242.62087号 [28] 迈拉尔,J;巴赫,F;Ponce,J,任务驱动字典学习,IEEE模式分析和机器智能汇刊,34791-804,(2012)·doi:10.1109/TPAMI.2011.156 [29] Maron,O.和Pérez,T.(1998年)。多元学习框架。在神经信息处理系统研究进展剑桥:麻省理工学院出版社。 [30] 莫汉,A;帕帕乔治奥,C;Poggio,T,通过组件对图像中基于示例的对象检测,IEEE模式分析和机器智能汇刊,23349-361,(2001)·doi:10.1109/34.917571 [31] Nguyen,H.V.、Patel,V.M.、Nasrabadi,N.M.和Chellappa,R.(2012a)。核心字典学习。在I中EEE声学、语音和信号处理国际会议京都:IEEE出版社。 [32] Nguyen,H.V.、Patel,V.M.、Nasrabadi,N.M.和Chellappa,R.(2012b)。稀疏嵌入:一个用于稀疏性促进维度缩减的框架。在第十二届欧洲计算机视觉会议记录纽约:Springer。 [33] Nguyen,HV;帕特尔,VM;纳斯拉巴迪,新墨西哥州;Chellappa,R,《对象识别非线性内核词典的设计》,IEEE图像处理学报,22,5123-5135,(2013)·兹比尔1373.68328 ·doi:10.1109/TIP.2013.2282078 [34] 奥沙森,BA;Fieldt,DJ,具有过完备基集的稀疏编码:v1采用的策略,视觉研究,373311-3325,(1997)·doi:10.1016/S0042-6989(97)00169-7 [35] Patel,V.M.和Chellappa,R.(2011年)。稀疏表示、压缩传感和模式识别词典。在亚洲模式识别会议纽约:IEEE出版社。 [36] Patel,V.M.和Chellappa,R.(2013)。图像和视觉的稀疏表示和压缩传感海德堡:施普林格·Zbl 1262.94002号 ·doi:10.1007/978-1-4614-6381-8 [37] Phillips,P,用于人脸识别的匹配追踪滤波器,IEEE图像处理汇刊,71150-1164,(1998)·数字对象标识代码:10.1109/83.704308 [38] 邱,Q;帕特尔,VM;Chellappa,R,《图像分类的信息论词典学习》,IEEE模式分析与机器智能汇刊,362173-2184,(2014)·doi:10.1109/TPAMI.2014.2316824 [39] Ray,S.和Craven,M.(2005)。监督学习与多实例学习:实证比较。在第22届国际机器学习年会论文集纽约:ACM出版社。 [40] Rodriguez,F.和Sapiro,G.(2007年)。图像分类的稀疏表示:学习区分性和重构性非参数字典。明尼苏达大学技术报告。 [41] 鲁宾斯坦,R;AM布鲁克斯坦;Elad,M,《稀疏表示建模词典》,IEEE学报,98,1045-1057,(2010)·doi:10.1109/JPROC.2010.2040551 [42] Schmidt,M.、Fung,G.和Rosales,R.(2007)。l1正则化的快速优化方法:比较研究和两种新方法。在第18届欧洲机器学习会议记录纽约:Springer。 [43] Schmidt,M.、Fung,G.和Rosales,R.(2009年)。l1-正则化的优化方法。UBC技术报告TR-2009-19。 [44] Scholkopf,B.和Smola,A.J.(2001)。使用内核学习:支持向量机、正则化、优化等纽约:麻省理工学院出版社。 [45] Shrivastava,A.、Nguyen,H.V.、Patel,V.M.和Chellappa,R.(2012)。用于图像分类的非线性判别字典的设计。在第十一届亚洲计算机视觉会议纽约:Springer。 [46] 施里瓦斯塔瓦,A;帕特尔,VM;Chellappa,R,稀疏表示分类的多核学习,IEEE图像处理学报,233013-3024,(2014)·Zbl 1381.62194号 ·doi:10.1109/TIP.2014.2324290 [47] Shrivastava,A.、Pillai,J.K.、Patel,V.M.和Chellappa,R.(2014b)。基于词典的多实例学习。在IEEE图像处理国际会议奥兰多:IEEE出版社·Zbl 1398.68459号 [48] Sikka,K.、Dhall,A.和Bartlett,M.(2013年)。使用多实例学习进行弱监督疼痛定位。在IEEE自动人脸和手势识别国际会议和研讨会. [49] Song,H.O.、Zickler,S.、Althoff,T.、Girshick,R.、Fritz,M.、Geyer,C.、Felzenszwalb,P.和Darrell,T.(2012年)。高效多类对象检测的稀疏模型。在第十二届欧洲计算机视觉会议记录纽约:Springer。 [50] Viola,P.A.、Platt,J.C.和Zhang,C.(2005)。用于对象检测的多实例增强。在神经信息处理系统研究进展剑桥:麻省理工学院出版社。 [51] Wang,H.Y.、Yang,Q.和Zha,H.(2008)。用于多实例学习的自适应p-后验混合模型核。在第25届国际机器学习年会论文集纽约:ACM出版社。 [52] Wang,X.,Wang,B.,Bai,X.、Liu,W.和Tu,Z.(2013)。最大边距多实例字典学习。在第30届机器学习国际年会论文集纽约:ACM出版社。 [53] 赖特,J;马,Y;梅拉尔,J;萨皮罗,G;黄,T;Yan,S,计算机视觉和模式识别的稀疏表示,美国电气与电子工程师协会论文集,981031-1044,(2010)·doi:10.1109/JPROC.2010.2044470 [54] Yang,M.,Zhang,L.,Feng,X.,&Zhang的D.(2011)。稀疏表示的Fisher判别字典学习。在I中EEE计算机视觉和模式识别会议纽约:IEEE出版社·兹比尔1328.68189 [55] 张,L;周,WD;PC Chang;刘,J;严,Z;王,T;Li,FZ,基于核稀疏表示的分类器,IEEE Transactions on Signal Processing,601684-1695,(2012)·Zbl 1393.94733号 ·doi:10.1109/TSP.2011.2179539 [56] Zhang,Q.和Goldman,S.A.(2001年)。EM-DD:一种改进的多位置学习技术。在神经信息处理系统研究进展剑桥:麻省理工学院出版社。 [57] Zhang,Q.,&Li,B.(2010)。人脸识别中字典学习的判别K-SVD。在IEEE计算机视觉和模式识别会议旧金山:IEEE出版社。 [58] 周振华(2004)。多实例学习:一项调查。南京大学技术报告。 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。