×

用于多实例学习的通用词典。 (英语) Zbl 1398.68459号

摘要:我们提出了一种使用字典学习框架的多类多实例学习(MIL)算法,其中数据以包的形式给出。每个包包含多个样本,称为实例,其中至少一个属于包的类。我们提出了一个噪声-OR模型和一个广义的基于均值的优化框架,用于在特征空间中学习字典。该方法可以看作是一种广义字典学习算法,因为当每个包中只有一个实例时,它可以简化为一种新的判别字典学习框架。使用流行的视觉相关MIL数据集以及UNBC-McMaster疼痛肩部档案数据库进行的各种实验表明,该方法的性能明显优于现有方法。

MSC公司:

68T05型 人工智能中的学习和自适应系统
68吨10 模式识别、语音识别
68T45型 机器视觉和场景理解
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] M·亚哈龙;Elad,M;Bruckstein,A,K-SVD:一种用于设计稀疏表示的过完备字典的算法,IEEE信号处理汇刊,5414311-4322,(2006)·Zbl 1375.94040号 ·doi:10.1109/TSP.2006.881199
[2] Amores,J,《多实例分类:综述、分类和比较研究》,人工智能,201,81-105,(2013)·兹比尔1334.68176 ·doi:10.1016/j.artint.2013.06.003
[3] 安德鲁斯;Tsochantaridis,Ⅰ;霍夫曼,T;Thrun,S(编辑);Obermayer,K(ed.),《支持向量机用于多实例学习》(2003),剑桥
[4] 阿什拉夫,AB;露西,S;科恩,JF;陈,T;安巴达,Z;普克钦,KM;Solomon,PE,使用主动外观模型进行痛苦的面部表情识别,图像和视觉计算,271788-1796,(2009)·doi:10.1016/j.imavis.2009.05.007
[5] Babenko,B.(2009年)。多实例学习:算法和应用。报告。
[6] Babenko,B.、Yang,M.H.和Belongie,S.(2009年)。通过在线多实例学习进行视觉跟踪。IEEE计算机视觉和模式识别会议北京:IEEE出版社。
[7] Bunescu,R.和Mooney,R.(2007年)。稀疏正包的多实例学习。第24届国际机器学习年会会议记录纽约:ACM。
[8] Cao,L.,Liu,Z.,&Huang,T.(2010)。跨数据集操作检测。IEEE计算机视觉和模式识别会议普罗维登斯:IEEE出版社。
[9] 陈,Y;王建忠,基于区域学习和推理的图像分类,机器学习研究杂志,5,913-939,(2004)
[10] 陈,Y;毕,J;Wang,JZ,MILES:通过嵌入式实例选择进行多实例学习,IEEE模式分析和机器智能汇刊,281931-1947,(2006)·doi:10.1109/TPAMI.2006.248
[11] Csurka,G.、Dance,C.R.、Fan,L.、Willamowski,J.和Bray,C.(2004)。用一袋袋的关键点进行视觉分类。计算机视觉中的统计学习讲习班布拉格:ECCV。
[12] Dieterich,甘油三酯;Lathrop,RH,用轴平行矩形解决多重实体问题,人工智能,89,31-71,(1997)·Zbl 1042.68650号 ·doi:10.1016/S0004-3702(96)00034-3
[13] Elad,M.(2010年)。稀疏和冗余表示——从理论到信号和图像处理应用纽约:Springer·兹比尔1211.94001
[14] Galleguillos,C.、Babenko,B.、Rabinovich,A.和Belongie,S.(2008年)。具有稳定分割的弱监督目标定位。第十届欧洲计算机视觉会议记录纽约:Springer。
[15] Gao,S.,Tsang,I.W.,&Chia,L.T.(2010年)。用于图像分类和人脸识别的核稀疏表示。第十一届欧洲计算机视觉会议记录纽约:Springer。
[16] Gehler,P.V.和Chapelle,O.(2007年)。多因素学习的确定性退火。第十一届国际人工智能与统计会议记录纽约:Springer。
[17] Harandi,M.、Sanderson,C.、Hartley,R.和Lovell,B.(2012年)。对称正定矩阵的稀疏编码和字典学习:一种核方法。第十二届欧洲计算机视觉会议记录纽约:Springer。
[18] Hull,JJ,手写文本识别研究数据库,IEEE模式分析和机器智能汇刊,16,550-554,(1994)·数字对象标识代码:10.1109/34.291440
[19] 霍J.、高Y.、Yang,W.和Yin,H.(2012)。通过多实例字典学习进行异常事件检测。智能数据工程和自动学习国际会议,纳塔尔。
[20] Jiang,Z.、Lin,Z.&Davis,L.S.(2011)。通过标签一致K-SVD学习稀疏编码的判别字典。IEEE计算机视觉和模式识别会议普罗维登斯:IEEE出版社。
[21] Kokiopoulou,E;Frossard,P,通过监督降维实现语义编码,IEEE多媒体交易,10806-818,(2008)·doi:10.1109/TMM.2008.922806
[22] Laptev,I.、Marszalek,M.、Schmid,C.和Rozenfeld,B.(2008)。从电影中学习真实的人类行为。IEEE计算机视觉和模式识别会议纽约:IEEE出版社。
[23] Leistner,C.、Safari,A.和Bischof,H.(2010年)。MIForests:随机树的多实例学习。第十一届欧洲计算机视觉会议记录纽约:Springer。
[24] Leung,T.、Song,Y.和Zhang,J.(2011)。通过多实例学习处理视频分类中的标签噪声。IEEE计算机视觉国际会议纽约:IEEE出版社。
[25] Lucey,P.、Howlett,J.、Cohn,J.F.、Lucey,S.、Sridharan,S.和Ambadar,Z.(2008)。通过更好地利用时间信息来改进疼痛识别。视听语音处理国际会议。纽约:ACM出版社。
[26] Lucey,P.、Cohn,J.、Prkachin,K.、Solomon,P.和Matthews,I.(2011年)。痛苦数据:UNBC-McMaster肩部疼痛表情存档数据库。自动面部手势识别国际会议和研讨会,洛斯阿拉米托斯.
[27] Mairal,J.、Bach,F.、Ponce,J.和Sapiro,G.(2009年)。稀疏编码的在线词典学习。第26届机器学习国际年会论文集纽约:ACM出版社·Zbl 1242.62087号
[28] 迈拉尔,J;巴赫,F;Ponce,J,任务驱动字典学习,IEEE模式分析和机器智能汇刊,34791-804,(2012)·doi:10.1109/TPAMI.2011.156
[29] Maron,O.和Pérez,T.(1998年)。多元学习框架。神经信息处理系统研究进展剑桥:麻省理工学院出版社。
[30] 莫汉,A;帕帕乔治奥,C;Poggio,T,通过组件对图像中基于示例的对象检测,IEEE模式分析和机器智能汇刊,23349-361,(2001)·doi:10.1109/34.917571
[31] Nguyen,H.V.、Patel,V.M.、Nasrabadi,N.M.和Chellappa,R.(2012a)。核心字典学习。在I中EEE声学、语音和信号处理国际会议京都:IEEE出版社。
[32] Nguyen,H.V.、Patel,V.M.、Nasrabadi,N.M.和Chellappa,R.(2012b)。稀疏嵌入:一个用于稀疏性促进维度缩减的框架。第十二届欧洲计算机视觉会议记录纽约:Springer。
[33] Nguyen,HV;帕特尔,VM;纳斯拉巴迪,新墨西哥州;Chellappa,R,《对象识别非线性内核词典的设计》,IEEE图像处理学报,22,5123-5135,(2013)·兹比尔1373.68328 ·doi:10.1109/TIP.2013.2282078
[34] 奥沙森,BA;Fieldt,DJ,具有过完备基集的稀疏编码:v1采用的策略,视觉研究,373311-3325,(1997)·doi:10.1016/S0042-6989(97)00169-7
[35] Patel,V.M.和Chellappa,R.(2011年)。稀疏表示、压缩传感和模式识别词典。亚洲模式识别会议纽约:IEEE出版社。
[36] Patel,V.M.和Chellappa,R.(2013)。图像和视觉的稀疏表示和压缩传感海德堡:施普林格·Zbl 1262.94002号 ·doi:10.1007/978-1-4614-6381-8
[37] Phillips,P,用于人脸识别的匹配追踪滤波器,IEEE图像处理汇刊,71150-1164,(1998)·数字对象标识代码:10.1109/83.704308
[38] 邱,Q;帕特尔,VM;Chellappa,R,《图像分类的信息论词典学习》,IEEE模式分析与机器智能汇刊,362173-2184,(2014)·doi:10.1109/TPAMI.2014.2316824
[39] Ray,S.和Craven,M.(2005)。监督学习与多实例学习:实证比较。第22届国际机器学习年会论文集纽约:ACM出版社。
[40] Rodriguez,F.和Sapiro,G.(2007年)。图像分类的稀疏表示:学习区分性和重构性非参数字典。明尼苏达大学技术报告。
[41] 鲁宾斯坦,R;AM布鲁克斯坦;Elad,M,《稀疏表示建模词典》,IEEE学报,98,1045-1057,(2010)·doi:10.1109/JPROC.2010.2040551
[42] Schmidt,M.、Fung,G.和Rosales,R.(2007)。l1正则化的快速优化方法:比较研究和两种新方法。第18届欧洲机器学习会议记录纽约:Springer。
[43] Schmidt,M.、Fung,G.和Rosales,R.(2009年)。l1-正则化的优化方法。UBC技术报告TR-2009-19。
[44] Scholkopf,B.和Smola,A.J.(2001)。使用内核学习:支持向量机、正则化、优化等纽约:麻省理工学院出版社。
[45] Shrivastava,A.、Nguyen,H.V.、Patel,V.M.和Chellappa,R.(2012)。用于图像分类的非线性判别字典的设计。第十一届亚洲计算机视觉会议纽约:Springer。
[46] 施里瓦斯塔瓦,A;帕特尔,VM;Chellappa,R,稀疏表示分类的多核学习,IEEE图像处理学报,233013-3024,(2014)·Zbl 1381.62194号 ·doi:10.1109/TIP.2014.2324290
[47] Shrivastava,A.、Pillai,J.K.、Patel,V.M.和Chellappa,R.(2014b)。基于词典的多实例学习。IEEE图像处理国际会议奥兰多:IEEE出版社·Zbl 1398.68459号
[48] Sikka,K.、Dhall,A.和Bartlett,M.(2013年)。使用多实例学习进行弱监督疼痛定位。IEEE自动人脸和手势识别国际会议和研讨会.
[49] Song,H.O.、Zickler,S.、Althoff,T.、Girshick,R.、Fritz,M.、Geyer,C.、Felzenszwalb,P.和Darrell,T.(2012年)。高效多类对象检测的稀疏模型。第十二届欧洲计算机视觉会议记录纽约:Springer。
[50] Viola,P.A.、Platt,J.C.和Zhang,C.(2005)。用于对象检测的多实例增强。神经信息处理系统研究进展剑桥:麻省理工学院出版社。
[51] Wang,H.Y.、Yang,Q.和Zha,H.(2008)。用于多实例学习的自适应p-后验混合模型核。第25届国际机器学习年会论文集纽约:ACM出版社。
[52] Wang,X.,Wang,B.,Bai,X.、Liu,W.和Tu,Z.(2013)。最大边距多实例字典学习。第30届机器学习国际年会论文集纽约:ACM出版社。
[53] 赖特,J;马,Y;梅拉尔,J;萨皮罗,G;黄,T;Yan,S,计算机视觉和模式识别的稀疏表示,美国电气与电子工程师协会论文集,981031-1044,(2010)·doi:10.1109/JPROC.2010.2044470
[54] Yang,M.,Zhang,L.,Feng,X.,&Zhang的D.(2011)。稀疏表示的Fisher判别字典学习。在I中EEE计算机视觉和模式识别会议纽约:IEEE出版社·兹比尔1328.68189
[55] 张,L;周,WD;PC Chang;刘,J;严,Z;王,T;Li,FZ,基于核稀疏表示的分类器,IEEE Transactions on Signal Processing,601684-1695,(2012)·Zbl 1393.94733号 ·doi:10.1109/TSP.2011.2179539
[56] Zhang,Q.和Goldman,S.A.(2001年)。EM-DD:一种改进的多位置学习技术。神经信息处理系统研究进展剑桥:麻省理工学院出版社。
[57] Zhang,Q.,&Li,B.(2010)。人脸识别中字典学习的判别K-SVD。IEEE计算机视觉和模式识别会议旧金山:IEEE出版社。
[58] 周振华(2004)。多实例学习:一项调查。南京大学技术报告。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。