×

基于图形-地面合成的概率关节图像分割和标记。 (英语) Zbl 1328.68273号

摘要:我们提出了一个分层统计模型,用于图像分割和标记,该模型通过组合独立提取的、可能重叠的图形地面(FG)分割集获得。构造一致图像分割的过程称为平铺,它是对从连接所有非重叠图形圆段假设的图中采样的最大团集的优化。团上的势函数结合了一元、基于格式塔的图形质量和空间相邻片段之间的成对兼容性,并受到实际场景的T连接和边界界面统计的约束。在分割层的基础上,我们进一步推导了一个联合图像分割和标记模型(JSL),该模型在给定一组FG的情况下,在由这些片段组成的兼容图像解释(平铺)上,以及在将其标记为类别上,构造了联合概率分布。从联合分布图中提取样本的过程可以解释为第一次采样瓷砖,然后根据特定瓷砖的选择进行采样标签。我们通过一种新的估计过程,即增量鞍点近似,基于最大似然,联合学习分割和标记参数。在学习过程中,通过包括被候选模型评为可能的不正确配置,对tilings和labelings的配分函数越来越精确地近似。Berkeley、Stanford和Pascal VOC数据集上报告了最新的结果,其中仅分割任务(平铺)改进了28%,语义标记VOC12测试集(JSL)的准确率为47.8%。

MSC公司:

68单位10 图像处理的计算方法
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Arbelaez,P.、Maire,M.、Fowlkes,C.和;Malik,J.(2009)。从轮廓到区域:实证评估。参加:IEEE计算机视觉和模式识别国际会议。
[2] Arbelaez,P.、Hariharan,B.、Gu,C.、Gupta,S.、Boudev,L.D.和;Malik,J.(2012)。使用区域和部分进行语义分割。参加:IEEE计算机视觉和模式识别国际会议。
[3] Bagon,S.、Boiman,O.和;Irani,M.(2008年)。什么是好的图像片段?一种统一的分段提取方法。参加:欧洲计算机视觉会议。
[4] A.巴布;朱S.C.(2005)。将swendsen-wang推广到随机后验概率抽样。IEEE模式分析和机器智能汇刊,27(8),1239–1253·Zbl 05112025号 ·doi:10.1109/TPAMI.2005.161
[5] Barnard,K.、Duygulu,P.、Forsyth,D.、de Freitas,N.、Blei,D.M.和;Jordan,M.(2003)。匹配单词和图片。机器学习研究杂志,31107-1135·Zbl 1061.68174号
[6] Bomze,I.、Budinich,M.、Pardalos,P.和;Pellillo,M.(1999)。组合优化手册(第1–74页)。多德雷赫特:克鲁沃学院。
[7] Bomze,I.、Pellillo,M.和;Stix,V.(2000)。使用复制器动力学近似最大重量团。IEEE神经网络汇刊,11(6),1228–1241·数字对象标识代码:10.1109/72.883403
[8] 布伦德尔,W.,&;Todorovic,S.(2010年)。分割为最大权重独立集。主题:神经信息处理系统进展。
[9] Carreira,J.和;Sminchisescu,C.(2012年)。Cpmc:使用受约束的参数化最小割进行自动对象分割。IEEE模式分析和机器智能汇刊,34(7),1312-1328。
[10] Carreira,J.、Caseiro,R.、Batista,J.&Sminchisescu,C.(2012a)。二阶池的语义分割。参加:欧洲计算机视觉会议。
[11] Carreira,J.、Li,F.和;Sminchisescu,C.(2012年b)。通过连续图形地面排名进行物体识别。国际计算机视觉杂志,98(3),243-262。
[12] 科马尼丘·D·;Meer,P.(2002)。均值偏移:一种稳健的特征空间分析方法。IEEE模式分析和机器智能汇刊,24(5),603-619·doi:10.1109/34.1000236
[13] Cour,T.、Gogin,N.和;Shi,J.(2005)。学习频谱图分割。在:人工智能和统计。
[14] Csurka,G.和;Perronnin,F.(2010年)。一种有效的语义分割方法。国际计算机视觉杂志,88,1-15·Zbl 06023083号 ·doi:10.1007/s11263-009-0288-z
[15] Dann,C.、Gehler,P.V.、Roth,S.和;Nowozin,S.(2012年)。Pottics–用于语义图像分割的potts主题模型。摘自:DAGM/OAGM研讨会论文集。
[16] Endres,I.和;Hoiem,D.(2010年)。独立于类别的对象建议。参加:欧洲计算机视觉会议。
[17] Everingham,M.、Van Gool,L.、Williams,C.K.I.、Winn,J.和;Zisserman,A.(2010年)。pascal可视对象类(voc)挑战。国际计算机视觉杂志,88(2),303–338·Zbl 06023097号 ·doi:10.1007/s11263-009-0275-4
[18] Everingham,M.、Van Gool,L.、Williams,C.K.I.、Winn,J.&Zisserman,A.(2012)。PASCAL可视对象类挑战(VOC)结果。http://www.pascal-network.org/challenges/VOC/ .
[19] Farabet,C.、Couprie,C.、Najman,L.和;LeCun,Y.(2013)。学习场景标签的层次特征。IEEE模式分析和机器智能汇刊,351915–1929·doi:10.1109/TPAMI.2012.231
[20] Felzenszwalb,P.和;Huttenlocher,D.(2004)。高效的基于图形的图像分割。国际计算机视觉杂志,59(2),167-181·doi:10.1023/B:VISI.0000022288.19776.77
[21] Felzenszwalb,P.F.、Girshick,R.B.、McAllester,D.和;Ramanan,D.(2010年)。使用经过区分训练的基于零件的模型进行目标检测。IEEE模式分析和机器智能汇刊,32(9),1627-1645·doi:10.1109/TPAMI.2009.167
[22] B.Fulkerson、A.Vedaldi和;Soatto,S.(2009)。使用超像素邻域进行类分割和对象定位。摘自:IEEE计算机视觉国际会议。
[23] Ghose,T.和;Palmer,S.(2005年)。表面凸度和深度极值边缘以及图形-背景感知。《视觉杂志》,5(8),970-970·doi:10.1167/5.8.970
[24] Gonfaus,J.M.、Boix,X.、van de Weijer,J.、Bagdanov,A.D.、Serrat,J.和;Gonzalez,J.(2010)。联合分类和分割的和谐潜力。参加:IEEE计算机视觉和模式识别国际会议·Zbl 1235.68246号
[25] Gould,S.、Rodgers,J.、Cohen,D.、Elidan,G.和;Koller,D.(2008)。具有相对位置优先的多类分割。国际计算机视觉杂志,80(3),300-316·Zbl 05671835号 ·doi:10.1007/s11263-008-0140-x
[26] Gould,S.、Fulton,R.和;Koller,D.(2009年a)。将场景分解为几何和语义一致的区域。摘自:IEEE计算机视觉国际会议。
[27] Gould,S.、Gao,T.和;Koller,D.(2009b)。基于区域的分割和对象检测。主题:神经信息处理系统进展。
[28] He,X.,Zemel,R.S.和;Carreira-Perpina,M.(2004)。用于图像标记的多尺度条件随机域。参加:IEEE计算机视觉和模式识别国际会议。
[29] Hinton,G.E.(2002年)。通过最小化对比差异来培训专家产品。神经计算,14(8),1771-1800·Zbl 1010.68111号 ·网址:10.1162/089976602760128018
[30] Hoiem,D.,Efros,A.和;Hebert,M.(2007)。从图像恢复曲面布局。国际计算机视觉杂志,75(1),151-172·Zbl 1235.68268号 ·doi:10.1007/s11263-006-0031-y
[31] Huggins,P.、Chen,H.、Belhumeur,P.&Zucker,S.(2001)。发现褶皱:关于遮挡的外观和识别。参加:IEEE计算机视觉和模式识别国际会议。
[32] Ion,A.、Carreira,J.和;Sminchisescu,C.(2011年a)。通过图形-背景合成到最大团的图像分割。摘自:IEEE计算机视觉国际会议·Zbl 1328.68273号
[33] Ion,A.、Carreira,J.和;Sminchisescu,C.(2011年b)。概率联合图像分割和标记。主题:神经信息处理系统进展·Zbl 1328.68273号
[34] Kohli,P.、Ladicky,L.和;Torr,P.(2008)。增强标签一致性的强大高阶潜力。参加:IEEE计算机视觉和模式识别国际会议。
[35] Kolmogorov,V.(2006年)。收敛树重加权消息传递以实现能量最小化。IEEE模式分析和机器智能汇刊,28(10),1568-1583·Zbl 05340984号 ·doi:10.1109/TPAMI.2006.200
[36] Kumar,M.P.和;Koller,D.(2010年)。高效地选择用于场景理解的区域。在:IEEE国际计算机视觉和模式识别会议。
[37] Kumar,S.、August,J.和;Hebert,M.(2005)。在判别域中利用推理进行近似参数学习:一项实证研究。In:计算机视觉和模式识别中的能量最小化方法。
[38] Ladicky,L.、Russell,C.、Kohli,P.和;Torr,P.H.S.(2009)。用于对象类图像分割的关联层次crf。摘自:IEEE计算机视觉国际会议。
[39] Ladicky,L.、Sturgess,P.、Alaharia,K.、Russel,C.和;Torr,P.(2010)。什么,在哪里&;有多少?结合目标检测器和crf。参加:欧洲计算机视觉会议。
[40] 莱希特,I.&Lindenbaum,M.(2009年)。边界所有权提升至2.1天。摘自:IEEE计算机视觉国际会议。
[41] Li,F.,Ionescu,C.和;Sminchisescu,C.(2010年)。倾斜乘法直方图核的随机傅里叶近似。摘自:DAGM研讨会论文集。
[42] Lim,J.、Arbelaez,P.、Gu,C.和;Malik,J.(2009)。按地区血统划分的上下文。摘自:IEEE计算机视觉国际会议。
[43] Lowe,D.G.(2004)。具有与比例不变关键点不同的图像特征。国际计算机视觉杂志,60(2),91–110·Zbl 02244065号 ·doi:10.1023/B:VISI.0000029664.99615.94
[44] Malisiewicz,T.和;Efros,A.(2007)。通过多重分割提高对象的空间支持。在:英国机器视觉会议。
[45] Martin,D.、Fowlkes,C.、Tal,D.和;Malik,J.(2001)。人类分割自然图像数据库及其在评估分割算法和测量生态统计中的应用。摘自:IEEE计算机视觉国际会议。
[46] Nowozin,S.、Gehler,P.和;Lampert,C.(2010年)。基于crf的对象类图像分割方法中的参数学习。在:欧洲计算机视觉会议。
[47] Pantofaru,C.、Schmid,C.和;Hebert,M.(2008)。通过集成多个图像分割进行目标识别。参加:欧洲计算机视觉会议。
[48] Rahimi,A.和;Recht,B.(2007年)。大型内核机的随机特性。主题:神经信息处理系统进展。
[49] Ren,X.和;Malik,J.(2003)。学习用于分割的分类模型。摘自:IEEE计算机视觉国际会议。
[50] Ren,X.、Fowlkes,C.和;Malik,J.(2006)。自然图像中的图形/地面指定。参加:欧洲计算机视觉会议。
[51] van de Sande,K.E.A.、Gevers,T.和;Snoek,C.G.M.(2010年)。评估对象和场景识别的颜色描述符。IEEE模式分析和机器智能汇刊,32(9),1582-1596·doi:10.1109/TPAMI.2009.154
[52] Sarawagi,S.和;Cohen,W.W.(2004)。信息提取的半马尔科夫条件随机场。主题:神经信息处理系统进展。
[53] Sharon,E.、Galun,M.、Sharon,D.、Basri,R.和;Brandt,A.(2006)。视觉场景分割的层次性和自适应性。《自然》,442(7104),719-846·doi:10.1038/nature04977
[54] Shi,J.和;Malik,J.(2000年)。标准化切割和图像分割。IEEE模式分析和机器智能汇刊,22(8),888-905·Zbl 05111961号 ·数字对象标识代码:10.1109/34.868688
[55] Shotton,J.、Winn,J.和Rother,C;克里米尼西,A.(2009)。用于图像理解的Textonboost:通过联合建模纹理、布局和上下文来识别和分割多类对象。国际计算机视觉杂志,81,2–23。
[56] Tu,Z.,Chen,X.,Yuille,A.,&朱S.C.(2003)。图像解析:统一分割、检测和识别。摘自:IEEE计算机视觉国际会议。
[57] Xia,W.,Song,Z.,Feng,J.,Cheong,L.F.&Yan,S.(2012)。通过耦合的全局和局部稀疏表示进行分割。参加:欧洲计算机视觉会议。
[58] Yang,Y.、Hallman,S.、Ramanan,D.和;Fowlkes,C.C.(2012)。图像分割的分层对象模型。IEEE模式分析和机器智能汇刊,34(9),1731-1743·doi:10.1109/TPAMI.2011.208
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。