文件Zbl 1398.68459-zbMATH Open

阿什什·施里瓦斯塔瓦；维沙尔·帕特尔（Vishal M.Patel）。；Jaishanker K·皮莱。；拉马切拉普帕

用于多实例学习的通用词典。（英语） Zbl 1398.68459号

国际期刊计算。视觉。 114，编号2-3，288-305（2015）.

摘要：我们提出了一种使用字典学习框架的多类多实例学习（MIL）算法，其中数据以包的形式给出。每个包包含多个样本，称为实例，其中至少一个属于包的类。我们提出了一个噪声-OR模型和一个广义的基于均值的优化框架，用于在特征空间中学习字典。该方法可以看作是一种广义字典学习算法，因为当每个包中只有一个实例时，它可以简化为一种新的判别字典学习框架。使用流行的视觉相关MIL数据集以及UNBC-McMaster疼痛肩部档案数据库进行的各种实验表明，该方法的性能明显优于现有方法。

引用于三文件

MSC公司：

68T05型	人工智能中的学习和自适应系统
68吨10	模式识别、语音识别
68T45型	机器视觉和场景理解

关键词：

稀疏编码；多实例学习；字典学习；物体识别；疼痛检测

PDF格式 BibTeX公司 XML格式引用

全文：内政部

参考文献：

[1]	M·亚哈龙；Elad，M；Bruckstein，A，K-SVD:一种用于设计稀疏表示的过完备字典的算法，IEEE信号处理汇刊，5414311-4322，（2006）·Zbl 1375.94040号 ·doi:10.1109/TSP.2006.881199
[2]	Amores，J，《多实例分类：综述、分类和比较研究》，人工智能，201，81-105，（2013）·兹比尔1334.68176 ·doi:10.1016/j.artint.2013.06.003
[3]	安德鲁斯；Tsochantaridis，Ⅰ；霍夫曼，T；Thrun，S（编辑）；Obermayer，K（ed.），《支持向量机用于多实例学习》（2003），剑桥
[4]	阿什拉夫，AB；露西，S；科恩，JF；陈，T；安巴达，Z；普克钦，KM；Solomon，PE，使用主动外观模型进行痛苦的面部表情识别，图像和视觉计算，271788-1796，（2009）·doi:10.1016/j.imavis.2009.05.007
[5]	Babenko，B.（2009年）。多实例学习：算法和应用。报告。
[6]	Babenko，B.、Yang，M.H.和Belongie，S.（2009年）。通过在线多实例学习进行视觉跟踪。在IEEE计算机视觉和模式识别会议北京：IEEE出版社。
[7]	Bunescu，R.和Mooney，R.（2007年）。稀疏正包的多实例学习。在第24届国际机器学习年会会议记录纽约：ACM。
[8]	Cao，L.，Liu，Z.，&Huang，T.（2010）。跨数据集操作检测。在IEEE计算机视觉和模式识别会议普罗维登斯：IEEE出版社。
[9]	陈，Y；王建忠，基于区域学习和推理的图像分类，机器学习研究杂志，5，913-939，（2004）
[10]	陈，Y；毕，J；Wang，JZ，MILES:通过嵌入式实例选择进行多实例学习，IEEE模式分析和机器智能汇刊，281931-1947，（2006）·doi:10.1109/TPAMI.2006.248
[11]	Csurka，G.、Dance，C.R.、Fan，L.、Willamowski，J.和Bray，C.（2004）。用一袋袋的关键点进行视觉分类。在计算机视觉中的统计学习讲习班布拉格：ECCV。
[12]	Dieterich，甘油三酯；Lathrop，RH，用轴平行矩形解决多重实体问题，人工智能，89，31-71，（1997）·Zbl 1042.68650号 ·doi:10.1016/S0004-3702（96）00034-3
[13]	Elad，M.（2010年）。稀疏和冗余表示——从理论到信号和图像处理应用纽约：Springer·兹比尔1211.94001
[14]	Galleguillos，C.、Babenko，B.、Rabinovich，A.和Belongie，S.（2008年）。具有稳定分割的弱监督目标定位。在第十届欧洲计算机视觉会议记录纽约：Springer。
[15]	Gao，S.，Tsang，I.W.，&Chia，L.T.（2010年）。用于图像分类和人脸识别的核稀疏表示。在第十一届欧洲计算机视觉会议记录纽约：Springer。
[16]	Gehler，P.V.和Chapelle，O.（2007年）。多因素学习的确定性退火。在第十一届国际人工智能与统计会议记录纽约：Springer。
[17]	Harandi，M.、Sanderson，C.、Hartley，R.和Lovell，B.（2012年）。对称正定矩阵的稀疏编码和字典学习：一种核方法。在第十二届欧洲计算机视觉会议记录纽约：Springer。
[18]	Hull，JJ，手写文本识别研究数据库，IEEE模式分析和机器智能汇刊，16，550-554，（1994）·数字对象标识代码：10.1109/34.291440
[19]	霍J.、高Y.、Yang，W.和Yin，H.（2012）。通过多实例字典学习进行异常事件检测。在智能数据工程和自动学习国际会议，纳塔尔。
[20]	Jiang，Z.、Lin，Z.&Davis，L.S.（2011）。通过标签一致K-SVD学习稀疏编码的判别字典。在IEEE计算机视觉和模式识别会议普罗维登斯：IEEE出版社。
[21]	Kokiopoulou，E；Frossard，P，通过监督降维实现语义编码，IEEE多媒体交易，10806-818，（2008）·doi:10.1109/TMM.2008.922806
[22]	Laptev，I.、Marszalek，M.、Schmid，C.和Rozenfeld，B.（2008）。从电影中学习真实的人类行为。在IEEE计算机视觉和模式识别会议纽约：IEEE出版社。
[23]	Leistner，C.、Safari，A.和Bischof，H.（2010年）。MIForests：随机树的多实例学习。在第十一届欧洲计算机视觉会议记录纽约：Springer。
[24]	Leung，T.、Song，Y.和Zhang，J.（2011）。通过多实例学习处理视频分类中的标签噪声。在IEEE计算机视觉国际会议纽约：IEEE出版社。
[25]	Lucey，P.、Howlett，J.、Cohn，J.F.、Lucey，S.、Sridharan，S.和Ambadar，Z.（2008）。通过更好地利用时间信息来改进疼痛识别。在视听语音处理国际会议。纽约：ACM出版社。
[26]	Lucey，P.、Cohn，J.、Prkachin，K.、Solomon，P.和Matthews，I.（2011年）。痛苦数据：UNBC-McMaster肩部疼痛表情存档数据库。在自动面部手势识别国际会议和研讨会，洛斯阿拉米托斯.
[27]	Mairal，J.、Bach，F.、Ponce，J.和Sapiro，G.（2009年）。稀疏编码的在线词典学习。在第26届机器学习国际年会论文集纽约：ACM出版社·Zbl 1242.62087号
[28]	迈拉尔，J；巴赫，F；Ponce，J，任务驱动字典学习，IEEE模式分析和机器智能汇刊，34791-804，（2012）·doi:10.1109/TPAMI.2011.156
[29]	Maron，O.和Pérez，T.（1998年）。多元学习框架。在神经信息处理系统研究进展剑桥：麻省理工学院出版社。
[30]	莫汉，A；帕帕乔治奥，C；Poggio，T，通过组件对图像中基于示例的对象检测，IEEE模式分析和机器智能汇刊，23349-361，（2001）·doi:10.1109/34.917571
[31]	Nguyen，H.V.、Patel，V.M.、Nasrabadi，N.M.和Chellappa，R.（2012a）。核心字典学习。在I中EEE声学、语音和信号处理国际会议京都：IEEE出版社。
[32]	Nguyen，H.V.、Patel，V.M.、Nasrabadi，N.M.和Chellappa，R.（2012b）。稀疏嵌入：一个用于稀疏性促进维度缩减的框架。在第十二届欧洲计算机视觉会议记录纽约：Springer。
[33]	Nguyen，HV；帕特尔，VM；纳斯拉巴迪，新墨西哥州；Chellappa，R，《对象识别非线性内核词典的设计》，IEEE图像处理学报，22，5123-5135，（2013）·兹比尔1373.68328 ·doi:10.1109/TIP.2013.2282078
[34]	奥沙森，BA；Fieldt，DJ，具有过完备基集的稀疏编码：v1采用的策略，视觉研究，373311-3325，（1997）·doi:10.1016/S0042-6989（97）00169-7
[35]	Patel，V.M.和Chellappa，R.（2011年）。稀疏表示、压缩传感和模式识别词典。在亚洲模式识别会议纽约：IEEE出版社。
[36]	Patel，V.M.和Chellappa，R.（2013）。图像和视觉的稀疏表示和压缩传感海德堡：施普林格·Zbl 1262.94002号 ·doi:10.1007/978-1-4614-6381-8
[37]	Phillips，P，用于人脸识别的匹配追踪滤波器，IEEE图像处理汇刊，71150-1164，（1998）·数字对象标识代码：10.1109/83.704308
[38]	邱，Q；帕特尔，VM；Chellappa，R，《图像分类的信息论词典学习》，IEEE模式分析与机器智能汇刊，362173-2184，（2014）·doi:10.1109/TPAMI.2014.2316824
[39]	Ray，S.和Craven，M.（2005）。监督学习与多实例学习：实证比较。在第22届国际机器学习年会论文集纽约：ACM出版社。
[40]	Rodriguez，F.和Sapiro，G.（2007年）。图像分类的稀疏表示：学习区分性和重构性非参数字典。明尼苏达大学技术报告。
[41]	鲁宾斯坦，R；AM布鲁克斯坦；Elad，M，《稀疏表示建模词典》，IEEE学报，98，1045-1057，（2010）·doi:10.1109/JPROC.2010.2040551
[42]	Schmidt，M.、Fung，G.和Rosales，R.（2007）。l1正则化的快速优化方法：比较研究和两种新方法。在第18届欧洲机器学习会议记录纽约：Springer。
[43]	Schmidt，M.、Fung，G.和Rosales，R.（2009年）。l1-正则化的优化方法。UBC技术报告TR-2009-19。
[44]	Scholkopf，B.和Smola，A.J.（2001）。使用内核学习：支持向量机、正则化、优化等纽约：麻省理工学院出版社。
[45]	Shrivastava，A.、Nguyen，H.V.、Patel，V.M.和Chellappa，R.（2012）。用于图像分类的非线性判别字典的设计。在第十一届亚洲计算机视觉会议纽约：Springer。
[46]	施里瓦斯塔瓦，A；帕特尔，VM；Chellappa，R，稀疏表示分类的多核学习，IEEE图像处理学报，233013-3024，（2014）·Zbl 1381.62194号 ·doi:10.1109/TIP.2014.2324290
[47]	Shrivastava，A.、Pillai，J.K.、Patel，V.M.和Chellappa，R.（2014b）。基于词典的多实例学习。在IEEE图像处理国际会议奥兰多：IEEE出版社·Zbl 1398.68459号
[48]	Sikka，K.、Dhall，A.和Bartlett，M.（2013年）。使用多实例学习进行弱监督疼痛定位。在IEEE自动人脸和手势识别国际会议和研讨会.
[49]	Song，H.O.、Zickler，S.、Althoff，T.、Girshick，R.、Fritz，M.、Geyer，C.、Felzenszwalb，P.和Darrell，T.（2012年）。高效多类对象检测的稀疏模型。在第十二届欧洲计算机视觉会议记录纽约：Springer。
[50]	Viola，P.A.、Platt，J.C.和Zhang，C.（2005）。用于对象检测的多实例增强。在神经信息处理系统研究进展剑桥：麻省理工学院出版社。
[51]	Wang，H.Y.、Yang，Q.和Zha，H.（2008）。用于多实例学习的自适应p-后验混合模型核。在第25届国际机器学习年会论文集纽约：ACM出版社。
[52]	Wang，X.，Wang，B.，Bai，X.、Liu，W.和Tu，Z.（2013）。最大边距多实例字典学习。在第30届机器学习国际年会论文集纽约：ACM出版社。
[53]	赖特，J；马，Y；梅拉尔，J；萨皮罗，G；黄，T；Yan，S，计算机视觉和模式识别的稀疏表示，美国电气与电子工程师协会论文集，981031-1044，（2010）·doi:10.1109/JPROC.2010.2044470
[54]	Yang，M.，Zhang，L.，Feng，X.，&Zhang的D.（2011）。稀疏表示的Fisher判别字典学习。在I中EEE计算机视觉和模式识别会议纽约：IEEE出版社·兹比尔1328.68189
[55]	张，L；周，WD；PC Chang；刘，J；严，Z；王，T；Li，FZ，基于核稀疏表示的分类器，IEEE Transactions on Signal Processing，601684-1695，（2012）·Zbl 1393.94733号 ·doi:10.1109/TSP.2011.2179539
[56]	Zhang，Q.和Goldman，S.A.（2001年）。EM-DD：一种改进的多位置学习技术。在神经信息处理系统研究进展剑桥：麻省理工学院出版社。
[57]	Zhang，Q.，&Li，B.（2010）。人脸识别中字典学习的判别K-SVD。在IEEE计算机视觉和模式识别会议旧金山：IEEE出版社。
[58]	周振华（2004）。多实例学习：一项调查。南京大学技术报告。

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

用于多实例学习的通用词典。（英语） Zbl 1398.68459号

MSC公司：

关键词：

参考文献：

示例

领域

操作员

用于多实例学习的通用词典。 （英语） Zbl 1398.68459号

MSC公司：

关键词：

参考文献：

用于多实例学习的通用词典。（英语） Zbl 1398.68459号