唐,孟;德米特里·马林;伊斯梅尔·本·艾伊德;尤里·博伊科夫 内核切割:核聚类和谱聚类满足正则化。 (英语) Zbl 1464.62331号 国际期刊计算。视觉。 127,第5号,477-511(2019). 总结:这项工作弥补了两种流行的数据分区方法之间的差距:核聚类和正规化-基于分割。在解决密切相关的实际问题时,根据文献中的涵盖方式,这些通用方法可能看起来非常不同。差异可能表现在动机、公式和优化方面,例如光谱松弛与最大流。我们解释了正则化和内核聚类如何协同工作,以及为什么这很有用。我们的联合能量结合了标准正则化(如MRF势)和核聚类标准(如归一化切割)。使用我们的边界优化在许多应用中证明了这些术语的互补性内核切割联合能量算法(代码公开)。在详细介绍组合动作制作时,我们主要关注的是新的线性内核和光谱核聚类准则的界允许它们与任何正则化目标与现有离散或连续解算器集成。 MSC公司: 62H30型 分类和区分;聚类分析(统计方面) 62M15型 随机过程和谱分析的推断 关键词:分段;马尔可夫随机场;光谱聚类;内核方法;界优化 软件:纽约大学深度;AlexNet公司;内核切割;BSDS公司;ImageNet公司;格拉克勒斯;抓斗切割;PRMLT公司 PDF格式BibTeX公司 XML格式引用 \textit{M.Tang}等人,《国际计算杂志》。视觉。127,第5号,477--511(2019;Zbl 1464.62331) 全文: 内政部 参考文献: [1] Achanta,R.、Shaji,A.、Smith,K.、Lucchi,A.,Fua,P.和Ssstrunk,S.(2012年)。Slic超像素与最先进的超像素方法相比。IEEE模式分析和机器智能汇刊,34(11),2274-2282。 [2] Adams,A.、Baek,J.和Davis,M.A.(2010年)。使用置换自面体晶格的快速高维滤波。计算机图形论坛,29(2),753-762。 [3] Aggarwal,C.C.和Reddy,C.K.(编辑)(2014年)。数据聚类:算法和应用。伦敦:查普曼和霍尔/CRC·Zbl 1331.62026号 [4] Arbelaez,P.、Maire,M.、Fowlkes,C.和Malik,J.(2011年)。轮廓检测和分层图像分割。IEEE模式分析和机器智能汇刊,33(5),898-916。 [5] 巴赫,F.和乔丹,M.(2003)。学习谱聚类。神经信息处理系统进展,16,305-312。 [6] Bazaraa,M.S.、Sherali,H.D.和Shetty,C.M.(2006)。非线性规划:理论和算法。霍博肯:威利·Zbl 1140.90040号 [7] Belkin,M.和Niyogi,P.(2003)。用于降维和数据表示的拉普拉斯特征映射。神经计算,15(6),1373-1396·Zbl 1085.68119号 [8] Belongie,S.和Malik,J.(1998年)。在自然图像中寻找边界:一种使用点描述符和面积补全的新方法。欧洲计算机视觉会议(ECCV)论文集。 [9] Ben Ayed,I.、Gorelick,L.和Boykov,Y.(2013年)。一般高阶泛函类的辅助割。IEEE计算机视觉和模式识别会议(CVPR)(第1304-1311页)。俄勒冈州波特兰。网址:http://www.csd.uwo.ca/yuri/Abstracts/cvpr13-auxcut-abs.shtml。 [10] Ben Ayed,I.、Mitiche,A.和Belhadj,Z.(2005)。合成孔径雷达图像的多区域级集合划分。IEEE模式分析和机器智能汇刊(PAMI),27(5),793-800。 [11] Bishop,C.M.(2006年)。模式识别和机器学习。柏林:斯普林格·Zbl 1107.68072号 [12] Boyd,S.和Vandenberghe,L.(2004)。凸优化。剑桥:剑桥大学出版社·Zbl 1058.90049号 [13] Boykov,Y.和Jolly,M.P.(2001年)。交互式图形切割,用于N-D图像中对象的最佳边界和区域分割。ICCV(第一卷,第105-112页)。 [14] Boykov,Y.和Kolmogorov,V.(2003年)。通过图形切割计算测地线和最小曲面。计算机视觉国际会议(第一卷,第26-33页)。 [15] Boykov,Y.和Funka-Lea,G.(2006年)。图形切割和高效的N-D图像分割。国际计算机视觉杂志(IJCV),70(2),109-131。 [16] Boykov,Y.、Veksler,O.和Zabih,R.(2001)。通过图形切割实现快速近似能量最小化。IEEE模式分析和机器智能汇刊,23(11),1222-1239。 [17] Boykov,Y.、Veksler,O.和Zabih,R.(2001)。通过图形切割实现快速近似能量最小化。IEEE模式分析和机器智能汇刊,23(11),1222-1239。 [18] Breiman,L.(1996)。技术说明:分割标准的一些属性。机器学习,24(1),41-47·Zbl 0849.68095号 [19] Brox,T.和Malik,J.(2010年)。通过点轨迹的长期分析进行对象分割。《计算机视觉—ECCV 2010》(第282-295页)。斯普林格。 [20] Brox,T.和Malik,J.(2011年)。大位移光流:变分运动估计中的描述符匹配。IEEE模式分析和机器智能汇刊,33(3),500-513。 [21] Carreira-Perpina,M.A.和Wang,W.(2013年)。聚类的K-modes算法。arXiv:1304.6478v1[cs.LG] [22] Caselles,V.、Kimmel,R.和Sapiro,G.(1997年)。测地活动轮廓。国际计算机视觉杂志,22(1),61-79·Zbl 0894.68131号 [23] Chambolle,A.(2004)。全变差最小化算法及其应用。数学成像与视觉杂志,20(1-2),89-97·Zbl 1366.94048号 [24] Chambolle,A.和Pock,T.(2011年)。凸问题的一阶原对偶算法及其在成像中的应用。数学成像与视觉杂志,40(1),120-145·Zbl 1255.68217号 [25] Chan,T.和Vese,L.(2001)。无边的活动轮廓。IEEE图像处理汇刊,10(2),266-277·Zbl 1039.68779号 [26] Chew,S.E.和Cahill,N.D.(2015年)。用于图像分割的半监督归一化切割。在IEEE国际计算机视觉会议(ICCV)上。 [27] Chitta,R.、Jin,R.,Havens,T.和Jain,A.(2011年)。可扩展内核集群:近似内核k均值。KDD(第895-903页)。 [28] Collins,M.D.,Liu,J.,Xu,J..,Mukherjee,L.,&Singh,V.(2014)。在数百万张图像上使用凸正则化器进行光谱聚类。2014年《计算机视觉》(Computer Vision-ECCV)(第282-298页)。斯普林格。 [29] Comaniciu,D.和Meer,P.(2002年)。均值偏移:一种稳健的特征空间分析方法。IEEE模式分析和机器智能汇刊(PAMI),24(5),603-619。 [30] Cox,I.、Rao,S.和Zhong,Y.(1996)。“比率区域”:一种图像分割技术。在模式识别国际会议(ICPR)上(第557-564页)。 [31] Cox,T.和Cox,M.(2000)。多维缩放。博卡拉顿:CRC出版社·Zbl 0853.62047号 [32] Cremers,D.、Rousson,M.和Deriche,R.(2007年)。水平集分割的统计方法综述:整合颜色、纹理、运动和形状。国际计算机视觉杂志,72(2),195-215。 [33] Delong,A.、Osokin,A.、Isack,H.和Boykov,Y.(2012年)。具有标签成本的快速近似能量最小化。国际计算机视觉杂志(IJCV),96(1),1-27·Zbl 1235.68257号 [34] Deng,Z.、Todorovic,S.和Latecki,L.J.(2015)。具有互斥约束的RGBD图像的语义分割。在国际计算机视觉会议(ICCV)上。智利圣地亚哥。 [35] Dhillon,I.、Guan,Y.和Kulis,B.(2004)。核k均值、谱聚类和归一化切割。在KDD中。 [36] Dhillon,I.、Guan,Y.和Kulis,B.(2007年)。无特征向量的加权图割:多级方法。IEEE模式分析和机器学习汇刊(PAMI),29(11),1944-1957。 [37] Dou,M.、Taylor,J.、Fuchs,H.、Fitzgibbon,A.和Izadi,S.(2015)。使用单个RGBD传感器对可变形物体进行三维扫描。IEEE计算机视觉和模式识别会议记录(第493-501页)。 [38] Duda,R.、Hart,P.和Stork,D.(2001年)。模式分类。霍博肯:威利·Zbl 0968.68140号 [39] Duda,R.O.、Hart,P.E.和Stork,D.G.(2001)。模式分类。霍博肯:威利·Zbl 0968.68140号 [40] Eriksson,A.、Olsson,C.和Kahl,F.(2011年)。重新访问规范化切割:使用线性分组约束重新制定分割。数学成像与视觉杂志,39(1),45-61·Zbl 1255.68171号 [41] Geman,S.和Geman,D.(1984)。随机松弛、吉布斯分布和图像的贝叶斯恢复。IEEE模式分析和机器智能汇刊,6721-741·兹比尔0573.62030 [42] Girolma,M.(2002)。特征空间中基于Mercer核的聚类。IEEE神经网络汇刊,13(3),780-784。 [43] Golub,G.H.和Van Loan,C.F.(2012年)。矩阵计算(第3卷)。巴尔的摩:JHU出版社·Zbl 1268.65037号 [44] Gottfried,J.M.、Fehr,J.和Garbe,C.S.(2011年)。从多模态运动学数据计算距离流。《视觉计算进展》(第758-767页)。斯普林格。 [45] Gulshan,V.、Lempitsky,V.和Zisserman,A.(2011年)。人性化抓取:学习使用运动学分割人类。计算机视觉研讨会(ICCV研讨会),2011年IEEE国际会议(第1127-1133页)。电气与电子工程师协会。 [46] Hein,M.、Lal,T.N.和Bousquet,O.(2004)。概率测度的Hilbertian度量及其在SVM中的应用。模式识别LNCS,3175270-277。 [47] Hochbaum,D.S.(2010年)。比率区域的多项式时间算法和归一化切割的变体。IEEE模式分析和机器智能汇刊,32(5),889-898。 [48] Hofmann,T.和Buhmann,J.(1997)。通过确定性退火进行成对数据聚类。IEEE模式分析和机器智能汇刊(PAMI),19(1),1-14。 [49] 石川浩(2003)。凸先验马尔可夫随机场的精确优化。IEEE模式分析和机器智能汇刊,25(10),1333-1336。 [50] Jayasumana,S.、Hartley,R.、Salzmann,M.、Li,H.和Harandi,M.(2015)。高斯RBF核黎曼流形上的核方法。IEEE模式分析和机器智能汇刊,372464-2477。 [51] Jermyn,I.和Ishikawa,H.(2001)。作为最小比率权重循环的全局最优区域和边界。IEEE模式分析和机器智能汇刊(PAMI),23(10),1075-1088。 [52] Kappes,J.H.、Andres,B.、Hamprecht,F.A.、Schnörr,C.、Nowozin,S.、Batra,D.等人(2015)。结构化离散能量最小化问题的现代推理技术的比较研究。国际计算机视觉杂志,115(2),155-184。 [53] Kearns,M.、Mansour,Y.和Ng,A.(1997年)。在人工智能不确定性会议(UAI)上,对聚类的硬分配方法和软分配方法进行了信息理论分析。 [54] Kohli,P.、Torr,P.H.等人(2009年)。增强标签一致性的强大高阶潜力。国际计算机视觉杂志,82(3),302-324。 [55] Kolmogorov,V.、Boykov,Y.和Rother,C.(2007年)。参数最大流在计算机视觉中的应用。在IEEE国际计算机视觉会议(ICCV)上。 [56] Kolmogorov,V.(2006)。收敛树重加权消息传递以实现能量最小化。IEEE模式分析和机器智能汇刊,28(10),1568-1583。 [57] Kolmogorov,V.(2006)。收敛树重加权消息传递以实现能量最小化。IEEE模式分析和机器智能汇刊,28(10),1568-1583。 [58] Krahenbuhl,P.和Koltun,V.(2011年)。高斯边缘势全连通CRF的有效推理。以NIPS为单位。 [59] Krizhevsky,A.、Sutskever,I.和Hinton,G.E.(2012年)。使用深度卷积神经网络进行图像网络分类。《神经信息处理系统进展》(第1097-1105页)。 [60] Kulis,B.、Basu,S.、Dhillon,I.和Mooney,R.(2009年)。半监督图聚类:一种核方法。机器学习,74(1),1-22·Zbl 1472.68144号 [61] Lange,K.、Hunter,D.R.和Yang,I.(2000)。使用替代目标函数优化传输。计算与图形统计杂志,9(1),1-20。 [62] Lempitsky,V.、Blake,A.和Rother,C.(2008)。通过分支和最小切割进行图像分割。在ECCV中。 [63] Lempitsky,V.、Kohli,P.、Rother,C.和Sharp,T.(2009年)。图像分割之前使用边界框。计算机视觉国际会议(ICCV)(第277-284页)。 [64] Li,T.、Ma,S.和Ogihara,M.(2004)。基于熵的分类聚类标准。in:国际会议移动学习。 [65] Li,S.(2009)。图像分析中的马尔可夫随机场建模(第三版)。柏林:斯普林格·Zbl 1183.68691号 [66] Louppe,G.、Wehenkel,L.、Sutera,A.和Geurts,P.(2013)。了解随机树木森林中的变量重要性。在NIPS中(第431-439页)。 [67] 麦凯·D·J(2003)。信息理论、推理和学习算法。剑桥:剑桥大学出版社·Zbl 1055.94001号 [68] Malik,J.、Belongie,S.、Leung,T.和Shi,J.(2001)。用于图像分割的轮廓和纹理分析。国际计算机视觉杂志,43(1),7-27·Zbl 0972.68604号 [69] Marin,D.、Tang,M.、Ayed,I.B.和Boykov,Y.(2018)。核心集群:密度偏差和解决方案。https://doi.org/10.1109/TPAMI.2017.2780166。 [70] Martin,D.、Fowlkes,C.、Tal,D.和Malik,J.(2001)。人类分割自然图像数据库及其在评估分割算法和测量生态统计中的应用。《计算机视觉》,2001年。ICCV 2001。诉讼程序。第八届IEEE国际会议(第2卷,第416-423页)。电气与电子工程师协会。 [71] McGuinness,K.和Oconnor,N.E.(2010年)。交互式分割算法的比较评估。模式识别,43(2),434-444·Zbl 1186.68417号 [72] Menze,M.和Geiger,A.(2015)。自动车辆的对象场景流。在计算机视觉和模式识别会议(CVPR)上。 [73] Mitiche,A.和Ayed,I.B.(2010年)。图像分割中的变分和水平集方法。柏林:斯普林格·Zbl 1371.94035号 [74] Muller,K.、Mika,S.、Ratsch,G.、Tsuda,K.和Scholkopf,B.(2001年)。基于内核的学习算法简介。IEEE神经网络汇刊,12(2),181-201。 [75] Müller,K.R.、Mika,S.、Rätsch,G.、Tsuda,K.和Schölkopf,B.(2001年)。基于内核的学习算法简介。IEEE神经网络汇刊,12(2),181-201。 [76] Mumford,D.和Shah,J.(1989年)。分段光滑函数和相关变分问题的最佳逼近。纯粹数学与应用数学交流,42577-685·Zbl 0691.49036号 [77] Narasimhan,M.和Bilmes,J.A.(2005年)。一个用于区分结构学习的子模块-超模块过程。UAI(第404-412页)。 [78] Newcombe,R.A.、Izadi,S.、Hilliges,O.、Molyneaux,D.、Kim,D.、Davison,A.J.、Kohi,P.、Shotton,J.、Hodges,S.和Fitzgibbon,A.(2011年)。Kinectfusion:实时密集曲面映射和跟踪。在混合增强现实(ISMAR)中,2011年IEEE第十届国际研讨会(第127-136页)。电气与电子工程师协会。 [79] Ng,A.、Jordan,M.和Weiss,Y.(2002年)。关于谱聚类:分析和算法。《神经信息处理系统进展》(NIPS)(第2卷,第849-856页)。 [80] Nieuwenhuis,C.和Cremers,D.(2013年)。交互式多标签分割的空间变化颜色分布。IEEE模式分析和机器智能汇刊,35(5),1234-1247。 [81] Ochs,P.和Brox,T.(2011年)。视频中的对象分割:将点轨迹转换为稠密区域的分层变分方法。计算机视觉(ICCV),2011年IEEE国际会议(第1583-1590页)。电气与电子工程师协会。 [82] Oliva,A.和Torralba,A.(2001)。场景形状建模:空间包络线的整体表示。国际计算机视觉杂志,42(3),145-175·Zbl 0990.68601号 [83] Paris,S.和Durand,F.(2006年)。使用信号处理方法快速逼近双边滤波器。《计算机视觉—ECCV 2006》(第568-580页)。斯普林格。 [84] Park,K.和Gould,S.(2012年)。关于学习多类像素标记的高阶一致性势。在ECCV中。 [85] Pock,T.、Chambolle,A.、Cremers,D.和Bischof,H.(2009年)。计算最小划分的凸松弛方法。在IEEE计算机视觉和模式识别(CVPR)会议上。 [86] Ren,X.、Bo,L.和Fox,D.(2012年)。Rgb-(d)场景标记:特性和算法。计算机视觉和模式识别(CVPR),2012年IEEE会议,第2759-2766页。IEEE标准。 [87] Rose,K.(1998)。用于聚类、压缩、分类、回归和相关优化问题的确定性退火。IEEE会议录,86(11),2210-2239。 [88] Rother,C.、Kolmogorov,V.和Blake,A.(2004)。抓取:使用迭代图形切割的交互式前景提取。在ACM图形事务(SIGGRAPH)中。 [89] Roth,V.、Laub,J.、Kawanabe,M.和Buhmann,J.(2003)。非度量邻近数据的最优保簇嵌入。IEEE模式分析和机器智能汇刊,25(12),1540-1551。 [90] Rousson,M.和Deriche,R.(2002年)。向量值图像主动自适应分割的变分框架。在运动和视频计算研讨会上。 [91] Salah,M.B.、Mitiche,A.和Ayed,I.B.(2010年)。使用核诱导数据项进行有效的水平集图像分割。IEEE图像处理汇刊,19(1),220-232·Zbl 1371.68284号 [92] Shawe-Tayler,J.和Cristianini,N.(2004)。模式分析的核心方法。剑桥:剑桥大学出版社。 [93] Shi,J.和Malik,J.(2000)。标准化切割和图像分割。IEEE模式分析和机器智能汇刊,22888-905。 [94] Silberman,N.、Hoiem,D.、Kohli,P.和Fergus,R.(2012)。室内分割和支持从rgbd图像推断。在ECCV中。 [95] Sung,K.K.和Poggio,T.(1995年)。基于示例的学习用于基于视图的人脸检测。IEEE模式分析和机器智能汇刊(TPAMI),20,39-51。 [96] Tang,M.、Ayed,I.B.和Boykov,Y.(2014)。二进制能量的伪边界优化。欧洲计算机视觉会议(ECCV)(第691-707页)。 [97] Tang,M.、Ayed,I.B.、Marin,D.和Boykov,Y.(2015)。抓取和内核k-means的秘密。在国际计算机视觉会议(ICCV)上。智利圣地亚哥。 [98] Tang,M.、Gorelick,L.、Veksler,O.和Boykov,Y.(2013)。一次切入抓取。在国际计算机视觉会议(ICCV)上。澳大利亚悉尼。 [99] Tang,M.、Marin,D.、Ayed,I.B.和Boykov,Y.(2016)。内核切割:MRF满足内核和光谱聚类。在arXiv:150.07439 [100] Tang,M.、Marin,D.、Ayed,I.B.和Boykov,Y.(2016)。正火切割符合MRF。在欧洲计算机视觉会议(ECCV)上。荷兰阿姆斯特丹。 [101] Vapnik,V.(1998)。统计学习理论。霍博肯:威利·Zbl 0935.62007号 [102] Varma,M.和Zisserman,A.(2005年)。从单个图像进行纹理分类的统计方法。国际计算机视觉杂志,62(1-2),61-81。 [103] Veksler,O.(2018)。具有量化边缘的全CRF的高效图割优化。IEEE模式分析和机器智能汇刊。arXiv:1809.04995。 [104] Vicente,S.、Kolmogorov,V.和Rother,C.(2009年)。分割和外观模型的联合优化。在国际计算机视觉会议(ICCV)上。 [105] Von Luxburg,U.(2007年)。《光谱聚类教程》,《统计学与计算》,17(4),395-416。 [106] Wang,S.和Siskind,J.M.(2003)。利用比率切割进行图像分割。IEEE模式分析和机器智能学报(PAMI),25(6),675-690。 [107] 沃纳,T.(2007)。最大和问题的线性规划方法:综述。IEEE模式分析和机器智能汇刊,29(7),1165-1179。 [108] Xu,L.,Li,W.,&Schuurmans,D.(2009)。具有线性约束的快速规范化切割。IEEE计算机视觉和模式识别会议(CVPR)(第2866-2873页)。 [109] Yedidia,J.S.、Freeman,W.T.和Weiss,Y.(2005)。构造自由能量近似和广义置信传播算法。IEEE信息理论汇刊,51(7),2282-2312·Zbl 1283.94023号 [110] Yu,S.和Shi,J.(2003)。多类光谱聚类。国际计算机视觉会议(ICCV)。 [111] Yu,Y.,Fang,C.,&Liao,Z.(2015)。用于图像分割的分段平面嵌入。《IEEE计算机视觉国际会议论文集》(第1368-1376页)。 [112] 于胜星,&石杰(2004)。给定部分分组约束的分段。IEEE模式分析和机器智能汇刊(PAMI),26(2),173-183。 [113] Zelnik-Manor,L.和Perona,P.(2004)。自校正光谱聚类。《NIPS进展》(第1601-1608页)。 [114] Zhu,S.C.和Yuille,A.(1996)。区域竞争:统一蛇、区域生长和Bayes/MDL用于多波段图像分割。IEEE模式分析和机器智能汇刊,18(9),884-900。 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。