拉赫迪普·加德;雷诺·马莱;Paragios、Nikos 学习用于特定于体系结构的外观解析的语法。 (英语) Zbl 1398.68579号 国际期刊计算。视觉。 117、3号、290-316(2016). 摘要:解析立面图像需要针对给定类别的建筑使用最佳的手工语法。这样的手工语法通常是由专家手工设计的。在本文中,我们提出了一个新的框架,用于从一组基础图像中学习紧凑语法。为此,使用一种简单、通用的语法运行现有的推理算法,获得地面实况注释图像的解析树。从这些解析树中,可以找到重复的子树并将其合并在一起,以共享派生,并生成具有较少规则的语法。此外,对这些规则进行无监督聚类,以便将对应于同一复杂模式的规则组合在一起,形成丰富的紧凑语法。在四个不同的数据集上与最新的基于语法的方法进行的实验验证和比较表明,与手工语法以及其他方法学习的语法相比,学习的语法有助于更快地收敛,同时产生相等或更准确的解析结果。此外,我们按照Art-deco风格发布了一个新的立面图像数据集,并证明了该框架的普遍适用性和极大潜力。 MSC公司: 68T45型 机器视觉和场景理解 68问题32 计算学习理论 第68季度第42季度 语法和重写系统 关键词:语法学习;外观解析;子树同构;群集 软件:剪影;达尔文;ap集群;A群集 PDF格式BibTeX公司 XML格式引用 \textit{R.Gadde}等人,《国际计算杂志》。视觉。117、3号、290--316(2016;Zbl 1398.68579) 全文: 内政部 哈尔 参考文献: [1] 阿坎塔,R;沙吉,A;史密斯,K;卢奇,A;福阿,P;Susstrunk,S,SLIC超像素与最先进的超像素方法的比较,IEEE模式分析和机器智能汇刊,342274-2282,(2012)·doi:10.1109/TPAMI.2012.120 [2] Alegre,F.和Dellaert,F.(2004)。建筑立面语义解释的概率方法。在CIPA视觉技术应用于城市中心改造国际研讨会(第25-27页)。 [3] Benz,F.和Kötzing,T.(2013)。针对最小语法问题的有效启发式。在第十五届遗传和进化计算年会论文集(第487-494页)。ACM公司。 [4] Berg,A.C.、Grabler,F.和Malik,J.(2007)。解析建筑场景的图像。在2007年IEEE第11届计算机视觉国际会议(ICCV 2007)(第1-8页)。电气与电子工程师协会 [5] Bod,R.(2003)。新DOP模型的有效实现。在计算语言学协会欧洲分会第十届会议(EACL 2003)(第1卷,第19-26页)。 [6] Bod,R.(2006)。无监督解析的全子树方法。在第21届国际计算语言学会议和计算语言学协会第44届年会(ACL 2006)(第865-872页)。计算语言学协会。 [7] RC卡拉斯科;Oncina,J;Calera-Rubio,J,正则树语言的随机推理,机器学习,44185-197,(2001)·兹伯利0983.68106 ·doi:10.1023/A:1010836331703 [8] Charikar,M.、Lehman,E.、Liu,D.、Panigrahy,R.、Prabhakaran,M.,Rasala,A.和Sahai,A.等人(2002年)。近似最小语法:自然模型中的Kolmogorov复杂性。在第三十届ACM计算理论学术研讨会论文集(第792-801页)。ACM公司·Zbl 1192.68397号 [9] 查里卡尔,M;雷曼兄弟,E;刘,D;帕尼格拉希,R;Prabhakaran,M;萨海,A;谢拉特,A,最小的语法问题,IEEE信息理论汇刊,51,2554-2576,(2005)·Zbl 1296.68086号 ·doi:10.1109/TIT.2005.850116 [10] Chi,Y;Muntz,RR;Nijssen,S;Kok,JN,《频繁子树挖掘-概述》,《基础信息》,66,161-198,(2005)·Zbl 1096.68044号 [11] Clark,A.(2010年)。在最低限度的教师指导下,对一些无语境语言进行分布式学习。在语法推理:理论结果与应用(第24-37页)。斯普林格·Zbl 1291.68188号 [12] Cohen,A.、Schwing,A.G.和Pollefeys,M.(2014)。使用动态编程对外观进行有效的结构化解析。在2014 IEEE计算机视觉和模式识别会议(CVPR)IEEE标准。 [13] 科恩,SB;Stratos,K;柯林斯,M;福斯特,DP;Ungar,L,潜在变量pcfgs的谱学习:算法和样本复杂性,机器学习研究杂志,15,2399-2449,(2014)·Zbl 1319.62111号 [14] Cohen,S.B.、Stratos,K.、Collins,M.、Foster,D.P.和Ungar,L.H.(2013)。潜在变量PCFG的光谱学习实验。在人类语言技术:计算语言学协会北美分会会议(HLT-NAACL 2013)(第148-157页)·Zbl 1319.62111号 [15] 科恩,T;Blunsom,P;Goldwater,S,《诱导树替换文法》,《机器学习研究杂志》,11,3053-3096,(2010)·Zbl 1242.68216号 [16] 科马尼丘,D;Meer,P,Mean shift:一种稳健的特征空间分析方法,IEEE模式分析和机器智能汇刊,24,603-619,(2002)·doi:10.1109/34.1000236 [17] Dai,D.、Prasad,M.、Schmitt,G.和Van Gool,L.(2012年)。学习幕墙标签的领域知识。在计算机愿景-ECCV 2012(第710-723页)。斯普林格。 [18] 戴维斯,DL;Bouldin,DW,A cluster separation measure,IEEE Transactions on Pattern Analysis and Machine Intelligence,1,224-227,(1979年)·doi:10.10109/TPAMI.1979.4766909 [19] Higuera,C,《语法推理的书目研究》,模式识别,38,1332-1348,(2005)·doi:10.1016/j.patcog.2005.01.003 [20] D'Ulizia,A;费里,F;Grifoni,P,《自然语言学习语法推理方法的调查》,《人工智能评论》,36,1-27,(2011)·doi:10.1007/s10462-010-9199-1 [21] Dunn,JC,Well-sparated clusters and optimal fuzzy partitions,《控制论杂志》,495-104,(1974)·Zbl 0304.68093号 ·网址:10.1080/01969727408546059 [22] Flajolet,P.、Sipala,P.和Steyaert,J.M.(1990年)。常见子表达式问题的分析变体。在第17届国际自动机、语言和编程学术讨论会论文集(第220-234页)。斯普林格·Zbl 0765.68048号 [23] BJ弗雷;Dueck,D,通过在数据点之间传递消息进行聚类,《科学》,315972-976,(2007)·Zbl 1226.94027号 ·doi:10.1212/科学1136800 [24] Gould,S,DARWIN:机器学习和计算机视觉研究与开发的框架,《机器学习研究杂志》,13,3533-3537,(2012) [25] Grünwald,P.(1996)。语法推理的最小描述长度方法。在自然语言处理学习的连接主义、统计和符号方法(第203-216页)。斯普林格。 [26] De la Higuera,C.(2010年)。语法推理:学习自动机和语法纽约:剑桥大学出版社·Zbl 1227.68112号 ·doi:10.1017/CBO9781139194655 [27] Jampani,V.、Gadde,R.和Gehler,P.V.(2015)。使用自动控制进行有效的立面分割。在2015 IEEE计算机视觉应用冬季会议(WACV)(第1038-1045页)。电气与电子工程师协会。 [28] Johnson,M.、Griffiths,T.和Goldwater,S.(2007年)。基于马尔可夫链蒙特卡罗的PCFG贝叶斯推断。在2007年人类语言技术:计算语言学协会北美分会会议(第139-146页)。 [29] 卡斯,M;维特金,A;Terzopoulos,D,《蛇:活动轮廓模型》,《国际计算机视觉杂志》,1321-331,(1988)·doi:10.1007/BF00133570 [30] 科尔莫戈罗夫,V;Zabin,R,哪些能量函数可以通过图形切割最小化?,IEEE模式分析和机器智能汇刊,26,147-159,(2004)·doi:10.1109/TPAMI.2004.1262177 [31] Komodakis,N.、Paragios,N.和Tziritas,G.(2009年)。通过基于lp的稳定性进行聚类。在神经信息处理系统研究进展(第21卷,第865-872页)。 [32] Korć,F.和Förstner,W.(2009年)。eTRIMS图像数据库,用于解释人造场景的图像。波恩大学摄影测量系技术代表TR-IGG-P-2009-01。http://www.ipb.uni-bonn.de/projects/etrims_db/ [33] Koutsourakis,P.、Simon,L.、Teboul,O.、Tziritas,G.和Paragios,N.(2009年)。城市环境中使用形状文法的单视图重建。在2009年IEEE第12届计算机视觉国际会议(第1795-1802页)。电气与电子工程师协会。 [34] Koziñski,M.、Gadde,R.、Zagoruyko S.、Marlet,R.和Obozinski,G.(2015)。用遮挡进行立面解析之前的MRF形状。在2015年IEEE计算机视觉和模式识别会议(CVPR). [35] Koziñski,M.和Marlet,R.(2014)。用图文法和马尔可夫随机场进行图像分析。在计算机视觉应用冬季会议(WACV 2014). [36] Koziñski,M.、Obozinski,G.和Marlet,R.(2014)。超越过程外观解析:通过线性编程进行双向对齐。在第十二届亚洲计算机视觉会议(ACCV 2014). [37] Lehman,E.和Shelat,A.(2002年)。基于语法的压缩的近似算法。在第十三届ACM-SIAM离散算法年度研讨会论文集(第205-212页)。工业和应用数学学会·Zbl 1093.68593号 [38] Mäkinen,E,关于有序树的子树同构问题,信息处理快报,32,271-273,(1989)·Zbl 0679.05024号 ·doi:10.1016/0020-0190(89)90056-2 [39] 曼宁,C.D.(2011)。97中的词性标注 [40] Martinović,A.、Mathias,M.、Weissenberg,J.和Van Gool,L.(2012年)。facade解析的三层方法。在ECCV 2012计算机愿景(第416-429页)。斯普林格。 [41] Martinovic,A.和Van Gool,L.(2013)。逆向过程建模的贝叶斯语法学习。在2013年IEEE计算机视觉和模式识别会议(CVPR)(第201-208页)。电气与电子工程师协会。 [42] Martinović,A.和Van Gool,L.(2013)。二维随机上下文无关文法的Earley解析。技术代表KUL/ESAT/PSI/1301,KU Leuven。 [43] Matsuzaki,T.、Miyao,Y.和Tsujii,J.(2005)。具有潜在注释的概率CFG。在计算语言学协会第43届年会(ACL 2005)(第75-82页)。 [44] Miller,P.(1999年)。强大的生产能力斯坦福:CSLI出版物·Zbl 0959.68121号 [45] Müller,P.、Wonka,P.,Haegler,S.、Ulmer,A.和Van Gool,L.(2006年)。建筑物的程序建模。在ACM SIGGRAPH 2006/ACM图形事务(第614-623页)。 [46] Nevill-Manning,C.G.和Witten,I.H.(1997)。识别序列中的层次结构:线性时间算法。人工智能研究杂志67-82 ·Zbl 0894.68072号 [47] 尼夫尔,J;霍尔,J;尼尔森,J;Chanev,A;埃尔伊吉特,G;库布勒,S;Marinov,S;Marsi,E,Malt解析器:用于数据驱动依赖解析的独立于语言的系统,自然语言工程,1395-135,(2007) [48] Ok,D.、Kozinski,M.、Marlet,R.和Paragios,N.(2012年)。用于立面图像自上而下解析的高级自下而上提示。在:关于3D成像、建模、处理、可视化和传输(3DIMPVT)的第二届3DIM/3DPVT联合会议. [49] Osher,S.和Paragios,N.(2003年)。成像、视觉和图形中的几何水平集方法纽约:Springer·Zbl 1027.68137号 [50] Parisot,S.、Duffau,H.、Chemouny,S.和Paragios,N.(2011年)。低级别胶质瘤的基于图形的空间位置映射。在医学图像计算和计算机辅助干预-MICCAI 2011(第508-515页)。施普林格 [51] Parisot,S.、Duffau,H.、Chemouny,S.和Paragios,N.(2012年)。基于图形的脑肿瘤检测、分割和表征。在2012年IEEE计算机视觉和模式识别会议(CVPR)(第988-995页)。电气与电子工程师协会。 [52] Petrov,S.和Klein,D.(2007年)。改进了非中毒分析的推理。在2007年人类语言技术:计算语言学协会北美分会会议(第404-411页)。计算语言学协会。 [53] Riemenschneider,H.、Krispel,U.、Thaller,W.、Donoser,M.、Havemann,S.、Fellner,D.和Bischof,H.(2012)。用于复杂形状语法外观解析的不规则格。在2012年IEEE计算机视觉和模式识别会议(CVPR)(第1640-1647页)。电气与电子工程师协会。 [54] Ripperda,N.和Brenner,C.(2006年)。使用正式语法和RJMCMC重建立面结构。在模式识别(第750-759页)。斯普林格。 [55] Rousseeuw,PJ,Silhouettes:聚类分析解释和验证的图形辅助,计算与应用数学杂志,20,53-65,(1987)·Zbl 0636.62059号 ·doi:10.1016/0377-0427(87)90125-7 [56] Sakakibara,Y.和Kondo,M.(1999)。基于GA的使用表格表示的上下文无关文法学习。在ICML公司(第99卷,第354-360页)。 [57] Si,Z;Zhu,SC,对象识别和检测的学习和-or模板,IEEE模式分析和机器智能学报,35,2189-2205,(2013)·doi:10.1109/TPAMI.2013.35 [58] 西蒙,L;特布尔,O;Koutsourakis,P;Paragios,N,建筑单视图3D建模程序空间的随机探索,国际计算机视觉杂志,93253-271,(2011)·Zbl 1235.68288号 ·doi:10.1007/s11263-010-0370-6 [59] Simon,L.、Teboul,O.、Koutsourakis,P.、Van Gool,L.和Paragios,N.(2012年)。基于地面序列的建筑无参数/帕累托驱动程序三维重建。在2012年IEEE计算机视觉和模式识别会议(CVPR)(第518-525页)。电气与电子工程师协会。 [60] Sutton,R.S.和Barto,A.G.(1998年)。强化学习简介马萨诸塞州剑桥:麻省理工学院出版社。 [61] Teboul,O.(2011)。形状语法解析:应用于基于图像的建模。巴黎中央学院博士论文。 [62] Teboul,O.、Kokkinos,I.、Simon,L.、Koutsourakis,P.和Paragios,N.(2011年)。通过强化学习进行形状语法分析。在2011年IEEE计算机视觉和模式识别会议(CVPR)(第2273-2280页)。电气与电子工程师协会。 [63] 特布尔,O;Kokkinos,我;西蒙,L;Koutsourakis,P;Paragios,N,用形状文法和强化学习分析立面,IEEE模式分析和机器智能学报,351744-1756,(2013)·doi:10.1109/TPAMI.2012.252 [64] Teboul,O.、Simon,L.、Koutsourakis,P.和Paragios,N.(2010年)。使用程序形状先验分割建筑立面。在2010年IEEE计算机视觉和模式识别会议(CVPR)(第3105-3112页)。电气与电子工程师协会。 [65] 富田,M;Tomita,M(编辑),《解析二维语言》,第126277-289号,(1991),纽约·doi:10.1007/978-1-4615-3986-5_18 [66] Tu,K.、Pavlovskaia,M.和Zhu,S.C.(2013)。随机和/或语法的无监督结构学习。在神经信息处理系统研究进展(第1322-1330页) [67] Tylecek,R.(2012)。cmp外观数据库。捷克技术大学CTU-CMP-2012-24技术代表。 [68] Valiente,G.(2002)。树和图的算法柏林:施普林格·Zbl 1007.05001号 [69] 王,C;科莫达基斯,N;Paragios,N,《计算机视觉和图像理解中的马尔可夫随机场建模、推理和学习:一项调查》,《计算机视力和图像理解》,1171610-1627,(2013)·doi:10.1016/j.cviu.2013.07.004 [70] Weissenberg,J.、Riemenschneider,H.、Prasad,M.和Van Gool,L.(2013)。架构是否有过程逻辑?在2013年IEEE计算机视觉和模式识别会议(CVPR)(第185-192页)。电气与电子工程师协会。 [71] 旺卡,P;Wimmer,M;Sillion,F;Ribarsky,W,Instant architecture,ACM图形事务(TOG),22669-677,(2003)·doi:10.1145/882262.882324 [72] Zaki,M.J.(2002年)。高效挖掘森林中的常见树木。在第八届ACM SIGKDD知识发现和数据挖掘国际会议记录(第71-80页)。ACM公司。 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。