×

\(\alpha\)ILP:将视觉场景视为可微分逻辑程序。 (英语) 兹伯利07702710

摘要:深度神经学习在视觉对象分类的学习表征方面表现出显著的性能。然而,深层神经网络(如CNN)并不显式编码对象及其之间的关系。这限制了他们在需要对视觉场景进行深入逻辑理解的任务上的成功,例如康定斯基模式和邦加德问题。为了克服这些局限性,我们引入了一种新的可微分归纳逻辑编程框架(alpha{ILP}),它学习将场景表示为逻辑程序——直观地说,逻辑原子对应于对象、属性和关系,子句编码高级场景信息\(alpha)ILP具有来自视觉输入的端到端推理架构。使用它,ILP在复杂的视觉场景上执行可微归纳逻辑编程,即通过梯度下降学习逻辑规则。我们对康定斯基图案CLEVR-手动基准测试证明了(alpha{ILP})在学习复杂的视觉逻辑概念时的准确性和效率。

MSC公司:

68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Amizadeh,S.、Palangi,H.、Polozov,A.、Huang,Y.和Koishida,K.(2020年)。神经符号视觉推理:将视觉从推理中分离出来。第37届机器学习国际会议论文集(第119卷,第279-290页)。
[2] Antol,S.、Agrawal,A.、Lu,J.、Mitchell,M.、Batra,D.、Zitnick,C.L.和Parikh,D.(2015)。Vqa:可视化问答。IEEE计算机视觉国际会议(ICCV)论文集。
[3] Badreddine,S。;d'Avila Garcez,A。;塞拉菲尼,L。;Spranger,M.,逻辑张量网络,人工智能,303103649(2022)·Zbl 07482899号 ·doi:10.1016/j.artint.2021.103649
[4] 贝洛迪,E。;Riguzzi,F.,通过搜索子句空间进行概率逻辑程序的结构学习,《逻辑编程的理论与实践》,15,2,169-212(2015)·Zbl 1379.68269号 ·doi:10.1017/S1471068413000689
[5] Besold,T.R.、d'Avila Garcez,A.S.、Bader,S.、Bowman,H.、Domingos,P.M.、Hitzler,P.、Kühnberger,K.、Lamb,L.C.、Lowd,d.、Lima,P.M.V.、de Penning,L.、Pinkas,G.、Poon,H.和Zaverucha,G.(2017年)。神经符号学习和推理:调查和解释。在CoRRarXiv:1711.03902中。
[6] Bongard,MM;霍金斯,JK,模式识别(1970),纽约:斯巴达图书公司,纽约·Zbl 0205.21201号
[7] Bošnjak,M.、Rocktäschel,T.、Naradowsky,J.和Riedel,S.(2017年)。用可微forth解释器编程。第34届国际机器学习会议(ICML)论文集(第70卷,第547-556页)。
[8] Burgess,C.P.、Matthey,L.、Watters,N.、Kabra,R.、Higgins,I.、Botvinick,M.M.和Lerchner,A.(2019年)。莫奈:无监督的场景分解和表示。CoRR arXiv:1901.11390。
[9] Cropper,A.和Muggleton,S.H.(2016)。Metagol系统。https://github.com/metagol/metagol。
[10] 作物,A。;Dumancic,S。;埃文斯,R。;麻格尔顿,SH,《30岁的归纳逻辑编程》,机器学习,111,1,147-172(2022)·Zbl 07510309号 ·doi:10.1007/s10994-021-06089-1
[11] Cropper,A。;Morel,R.,《从失败中学习的学习程序》,机器学习,110,4,801-856(2021)·Zbl 07432822号 ·doi:10.1007/s10994-020-05934-z
[12] Cropper,A。;莫雷尔,R。;Muggleton,S.,《学习高阶逻辑程序》,机器学习,1091289-1322(2019)·Zbl 1518.68037号 ·doi:10.1007/s10994-019-05862-7
[13] Cuturi,M.和Blondel,M.(2017年)。Soft-DTW:时间序列的可微损失函数。第34届国际机器学习会议(ICML)论文集(第70卷,第894-903页)。
[14] Dai,W.-Z.、Xu,Q.、Yu,Y.和Zhou,Z.-H.(2019)。通过溯因学习将机器学习和逻辑推理联系起来。神经信息处理系统进展论文集(NeurIPS)(第32卷)。
[15] d'Avila Garcez,A.和Lamb,L.C.(2020年)。神经符号人工智能:第三波。CoRRarXiv中:2012.05876。
[16] De Raedt,L.、Frasconi,P.、Kersting,K.和Muggleton,S.H.(编辑)(2008年)。概率归纳逻辑编程理论与应用。《计算机科学讲义》(第4911卷)。柏林:斯普林格·Zbl 1132.68007号
[17] De Raedt,L.、Kersting,K.、Natarajan,S.和Poole,D.(2016)。统计关系人工智能:逻辑、概率和计算。人工智能和机器学习综合讲座(第32卷)。加利福尼亚州圣拉斐尔:摩根克莱普尔·Zbl 1352.68005号
[18] Diligenti,M。;戈里,M。;Saccá,C.,用于学习和推理的基于语义的正则化,人工智能,244143-165(2017)·Zbl 1404.68100号 ·doi:10.1016/j.artint.2015.08.011
[19] Dittadi,A.、Papa,S.、De Vita,M.、Schölkopf,B.、Winther,O.和Locatello,F.(2022)。以对象为中心的学习中的泛化和健壮性含义。第39届机器学习国际会议论文集。
[20] Donalello,I.、Serafini,L.和d'Avila Garcez,A.(2017年)。语义图像解释的逻辑张量网络。第26届国际人工智能联合会议(IJCAI)会议记录(第1596-1602页)。
[21] Engelcke,M.、Kosiorek,A.R.、Jones,O.P.和Posner,I.(2020年)。成因:以对象为中心的潜在表征的生成场景推理和采样。第八届国际学习代表大会(ICLR)会议记录。
[22] 埃文斯,R。;Grefenstette,E.,《从噪声数据中学习解释规则》,《人工智能研究杂志》,61,1-64(2018)·Zbl 1426.68235号 ·数字对象标识代码:10.1613/jair.5714
[23] Goyal,K.、Neubig,G.、Dyer,C.和Berg-Kirkpatrick,T.(2018年)。神经序列模型端到端训练的波束搜索的连续松弛。第32届AAAI人工智能会议论文集(第32卷,第1期)。
[24] He,K.,Gkioxari,G.,Dollár,P.,&Girshick,r.B.(2017年)。遮罩r-cnn。IEEE计算机视觉国际会议(ICCV)论文集(第2980-2988页)。
[25] He,K.,Zhang,X.,Ren,S.,&Sun,J.(2016)。用于图像识别的深度残差学习。《IEEE计算机视觉和模式识别会议论文集》(第770-778页)。
[26] Holzinger,A.、Kickmeier-Rust,M.和Müller,H.(2019年)。康定斯基模式作为机器学习的IQ测试。第三届机器学习和知识提取国际跨领域会议(CD-MAKE)论文集(第1-14页)。
[27] Holzinger,A.、Saranti,A.和Müller,H.(2021)。康定斯基模式:用于模式分析和机器智能的实验探索环境。CoRRarXiv公司:2103.00519。
[28] Jiang,Z.和Luo,S.(2019年)。神经逻辑强化学习。在第36届机器学习国际会议论文集(ICML)(第97卷,第3110-3119页)。
[29] Johnson,J.、Hariharan,B.、van der Maaten,L.、Fei-Fei,L.,Zitnick,C.L.和Girshick,R.B.(2017)。Clevr:用于合成语言和基本视觉推理的诊断数据集。《IEEE计算机视觉和模式识别会议论文集》(1988-1997页)。
[30] Kautz,H.,《第三届人工智能夏季:AAAI Robert S.Engelmore纪念讲座》,《人工智能杂志》,第43期,第193-104页(2022年)·doi:10.1609/aimag.v43i1.19122
[31] Kim,J。;里奇,M。;Serre,T.,Not-So-CLEVR:学习相同-不同关系应变前馈神经网络,界面焦点,8,20180011(2018)·doi:10.1098/rsfs.2018.0011
[32] Kingma,D.P.和Ba,J.(2015)。亚当:一种随机优化方法。第三届国际学习代表大会(ICLR)会议记录。
[33] Kowalski,RA,《逻辑编程的早期》,ACM通信,31,1,38-43(1988)·doi:10.1145/35043.35046
[34] Law,M.、Russo,A.和Broda,K.(2014)。答案集程序的归纳学习。E.Fermé,J.Leite(编辑),《人工智能中的逻辑学》,第14届欧洲会议(JELIA)。计算机科学课堂讲稿(第8761卷,第311-325页)·Zbl 1432.68391号
[35] Lee,J.、Lee,Y.、Kim,J.,Kosiorek,A.、Choi,S.和Teh,Y.W.(2019年)。集合变换器:基于注意力的排列变异神经网络框架。第36届国际机器学习会议(ICML)论文集(第97卷,第3744-3753页)。
[36] 劳埃德·J·W(1984)。逻辑编程基础·Zbl 0547.68005号
[37] Locatello,F。;韦森伯恩,D。;Unterthiner,T。;Mahendran,A。;Heigold,G。;Uszkoreit,J。;Dosovitskiy,A。;Kipf,T.,《时隙注意力下的以对象为中心的学习》,《神经信息处理系统进展论文集》(NeurIPS),第33期,第11525-11538页(2020年)
[38] Manhaeve,R.、Dumancic,S.、Kimmig,A.、Demeester,T.和De Raedt,L.(2018年)。Deepproblog:神经概率逻辑编程。神经信息处理系统进展论文集(NeurIPS)(第31卷)·Zbl 1520.68022号
[39] Manhaeve,R。;杜曼奇奇,S。;Kimmig,A。;德米斯特,T。;De Raedt,L.,DeepProbeLog中的神经概率逻辑编程,人工智能,298103504(2021)·Zbl 1520.68022号 ·doi:10.1016/j.artint.2021.103504
[40] Mao,J.、Gan,C.、Kohli,P.、Tenenbaum,J.B.和Wu,J.(2019年)。神经符号概念学习者:解释自然监督下的场景、单词和句子。第七届国际学习代表大会(ICLR)会议记录。
[41] Mensch,A.和Blondel,M.(2018年)。结构化预测和注意力的微分动态规划。第35届国际机器学习会议(ICML)论文集(第80卷,第3462-3471页)。
[42] Minervini,P.、Riedel,S.、Stenetorp,P.,Grefenstette,E.和Rocktäschel,T.(2020年)。在端到端可微证明中学习推理策略。第37届国际机器学习会议(ICML)论文集。
[43] 麻格尔顿,SH,归纳逻辑编程,新一代计算,8,4,295-318(1991)·兹比尔0712.68022 ·doi:10.1007/BF03037089
[44] Muggleton,S.,《逆蕴涵与程序》,新一代计算,归纳逻辑程序设计专刊,13,3-4,245-286(1995)·doi:10.1007/BF03037227
[45] 穆勒,H。;Holzinger,A.,《康定斯基模式,人工智能》,300103546(2021)·Zbl 1520.68133号 ·doi:10.1016/j.artint.2021.103546
[46] Nguembang Fadja,A。;Riguzzi,F.,提升概率逻辑程序的区分学习,机器学习,108,7,1111-1135(2019)·Zbl 1493.68310号 ·doi:10.1007/s10994-018-5750-0
[47] Nienhuys-Cheng,S.-H.,Wolf,R.D.,Siekmann,J.和Carbonell,J.G.(1997年)。归纳逻辑编程基础·Zbl 1293.68014号
[48] 聂,W。;于,Z。;毛,L。;帕特尔,AB;Zhu,Y。;Anandkumar,A.,Bongard-logo:人类水平概念学习和推理的新基准,《神经信息处理系统进展学报》,第33期,第16468-16480页(2020年)
[49] 彼得森,F。;Borgelt,C。;Kuehne,H。;Deussen,O.,《通过持续放松进行算法监督的学习》,《神经信息处理系统(NeurIPS)进展论文集》,3416520-16531(2021)
[50] Pietruszka,M.、Borchmann,L.和Gralinski,F.(2021)。连续减半top-k运算符。在第35届AAAI人工智能会议记录(AAAI)(第35卷,第18期,第15869-15870页)。
[51] Plotkin,G.(1971)。关于归纳推广的进一步说明。机器智能(第6卷)·Zbl 0261.68042号
[52] 昆兰,JR,从关系中学习逻辑定义,机器学习,5239-266(1990)·doi:10.1007/BF00117105
[53] Raedt,L.d.、Dumanć,S.、Manhaeve,R.和Marra,G.(2020年)。从统计关系到神经符号人工智能。第29届国际人工智能联合会议(IJCAI)会议记录(第4943-4950页)。
[54] Ray,O.和Inoue,K.(2007年)。完整子句理论的模态定向逆蕴涵。在第17届国际归纳逻辑编程会议(ILP)的会议记录中。计算机科学讲义(第4894卷,第225-238页)·Zbl 1136.68502号
[55] Redmon,J.、Divvala,S.K.、Girshick,R.B.和Farhadi,A.(2016)。你只看一次:统一的实时对象检测。《IEEE计算机视觉和模式识别会议论文集》(第779-788页)。
[56] Ren,S.、He,K.、Girshick,R.和Sun,J.(2015)。更快的r-cnn:使用区域建议网络实现实时对象检测。神经信息处理系统进展论文集(NeurIPS)(第28卷)。
[57] Rocktäschel,T.和Riedel,S.(2017年)。端到端的可微证明。神经信息处理系统进展论文集(NeurIPS)(第30卷)。
[58] Ross,A.S.、Hughes,M.C.和Doshi-Velez,F.(2017年)。正确的理由:通过限制解释来训练可差异模型。第26届国际人工智能联合会议(IJCAI)会议记录(第2662-2670页)。
[59] Ruder,S.(2016)。梯度下降优化算法概述。CoRRarXiv中:1609.04747。
[60] 罗素,S。;Norvig,P.,《人工智能:现代方法》(2009),新泽西州霍博肯:普伦蒂斯·霍尔出版社
[61] Santoro,A.、Faulkner,R.、Raposo,D.、Rae,J.、Chrzanowski,M.、Weber,T.、Wierstra,D.、Vinyals,O.、Pascanu,R.和Lillicrap,T.(2018年)。关系递归神经网络。收录:神经信息处理系统进展论文集(NeurIPS)(第31卷)。
[62] Sen,P.、Carvalho,B.W.S.R.D.、Riegel,R.和Gray,A.(2022年)。使用逻辑神经网络的神经符号归纳逻辑编程。《AAAI人工智能会议论文集》(第36卷,第8期,第8212-8219页)。
[63] 夏皮罗,安永,算法程序调试(1983),剑桥:麻省理工学院出版社,剑桥
[64] Shindo,H.、Nishino,M.和Yamamoto,A.(2021)。结构化示例的微分归纳逻辑编程。在第35届AAAI人工智能会议记录中(第5034-5041页)。
[65] Si,X.、Raghothaman,M.、Heo,K.和Naik,M.(2019)。使用数值松弛法合成数据记录程序。第28届国际人工智能联合会议(IJCAI)会议记录(第6117-6124页)。
[66] Solar-Lezama,A.(2008)。通过草图进行程序合成。博士论文。
[67] Sourek,G.、Svatos,M.、Zelezní,F.、Schockaert,S.和Kuzelka,O.(2017年)。提升关系神经网络的堆叠结构学习。N.Lachiche,C.Vrain(Eds.),第27届归纳逻辑编程国际会议论文集。计算机科学课堂讲稿(第10759卷,第140-151页)·Zbl 1455.68183号
[68] Sourek,G。;Aschenbrenner,V。;泽列兹尼,F。;肖克尔特,S。;Kuzelka,O.,《提升的关系神经网络:潜在关系结构的有效学习》,《人工智能研究杂志》,62,69-100(2018)·Zbl 1444.68163号 ·doi:10.1613/jair.1.11203
[69] Stammer,W.、Schramowski,P.和Kersting,K.(2021)。正确概念的权利:通过与解释互动修改神经符号概念。《IEEE计算机视觉和模式识别会议论文集》(第3619-3629页)。
[70] Tsamoura,E.、Hospedales,T.M.和Michael,L.(2021)。神经-符号整合:合成视角。第35届AAAI人工智能会议(AAAI)会议记录(第5051-5060页)。
[71] van Krieken,E。;Acar,E。;van Harmelen,F.,分析可微模糊逻辑算子,人工智能,302,103602(2022)·Zbl 1490.68233号 ·doi:10.1016/j.artint.2021.103602
[72] 韦丹塔姆·R、斯拉姆·A、尼科尔·M、莫科斯·A和莱克·B·M(2021年)。居里:不确定性下生产性概念学习的基准。第38届国际机器学习会议(ICML)论文集(第139卷,第10519-10529页)。
[73] 谢毅。;戴,H。;陈,M。;戴,B。;Zhao,T。;查,H。;魏,W。;Pfister,T.,具有最优传输的可微top-k,《神经信息处理系统进展论文集》,第33期,20520-20531页(2020年)
[74] Yang,Z.、Ishay,A.和Lee,J.(2020年)。Neurasp:将神经网络纳入答案集编程。第29届国际人工智能联合会议(IJCAI)会议记录(第1755-1762页)。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。