×

分析可微模糊逻辑算子。 (英语) Zbl 1490.68233号

本文的主要目的是提出一种将机器学习与符号表示的模糊逻辑公式形式的背景知识相结合的方法。为此,作者从可微性的角度分析了一大类模糊逻辑算子(连词、析取、蕴涵和聚合)。如果我们考虑机器学习场景,例如,这些操作符的大部分域上的偏导数等于零,这意味着潜在有用信息的丢失,那么这方面的重要性就显而易见了。
作者介绍可微模糊逻辑语义使用向量嵌入。这意味着域中的对象是实向量。谓词被解释为将这些向量映射到区间\([0,1]\)的真值的函数。基于此语义,考虑了模糊最大可满足性问题。如果所有算子都是可微的,这个问题可以用梯度下降法来解决。
由于很大一部分背景知识是通过含意来表达的,因此特别注意模糊含意。乘积S-蕴涵(也称为Rechenbach蕴涵)(I_mathrm{RC}(a,c)=1-a+a\cdot-c)具有良好的导数;然而,有几个问题,特别是围绕\(a=0=c\)的行为。作者通过引入一类新的蕴涵算子(称为乙状暗示这些是以边界条件保持不变的方式使用sigmoid函数的其他模糊含义的转换。
本文还描述了使用手写数字的MNIST数据集解决半监督学习问题的一系列实验。这些实验的结果可以为在机器学习场景中选择模糊逻辑算子提供指导。对于放弃这些算子的正规对称配置的算子,获得了最佳结果。

MSC公司:

68层37 人工智能背景下的不确定性推理
03B52号 模糊逻辑;模糊逻辑
68T05型 人工智能中的学习和自适应系统
68T27型 人工智能中的逻辑
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Arakelyan,E。;Daza,D。;Minervini,P。;Cochez,M.,带神经链接预测因子的复杂问答,(国际学习表征会议(2021))
[2] Badreddine,S。;d'Avila Garcez,A。;塞拉菲尼,L。;Spranger,M.,逻辑张量网络(2020)
[3] Badreddine,S。;Spranger,M.,使用逻辑张量网络将用于转移学习的先验知识注入强化学习算法(2019),arXiv预印本
[4] 巴尔,H。;Epema,D。;德拉特,C。;van Nieuwpoort,R。;罗梅因,J。;Seinstra,F。;斯诺克,C。;Wijshoff,H.,《用于计算机科学研究的中型分布式系统:长期基础设施》,《计算机》,49,54-63(2016)
[5] Ball,K.,《现代凸几何的初步介绍》,(《几何的味道》,第31卷(1997)),1-58·Zbl 0901.5202号
[6] 贝索尔德,T.R。;公元加尔塞兹。;Bader,S。;鲍曼,H。;多明戈斯,P。;希茨勒,P。;Kuehnberger,K.U。;Lamb,L.C。;Lowd,D。;P.M.V.利马。;德彭宁,L。;平卡斯,G。;Poon,H。;Zaverucha,G.,《神经符号学习与推理:调查与解释》(2017),arXiv预印本
[7] Bishop,C.M.,模式识别和机器学习(2006)·Zbl 1107.68072号
[8] 布罗克,A。;Donahue,J。;Simonyan,K.,《高保真自然图像合成的大规模GAN培训》(2018),arXiv预印本
[9] 布达,M。;Maki,A。;Mazurowski,M.A.,卷积神经网络中类不平衡问题的系统研究,神经网络。,106, 249-259 (2018)
[10] 卡尔沃,T。;Kolesárová,A。;科莫尼科娃,M。;Mesiar,R.,聚合运算符:属性、类和构造方法,(Calvo,T.;Mayor,G.;Mesiar,R.,聚合运算符:新趋势和应用(2002),Physica Verlag HD:Physica Verlag HD Heidelberg),3-104·Zbl 1039.03015号
[11] Cignoli,R。;埃斯特娃,F。;戈多,L。;Montagna,F.,关于一类左连续t-范数,模糊集系统。,131, 283-296 (2002) ·Zbl 1012.03032号
[12] 辛图拉,P。;Hájek,P。;诺古拉,C.,《数学模糊逻辑手册》,第1卷(2011年),学院出版物·Zbl 1283.03001号
[13] Daniele,A。;Serafini,L.,《知识增强型神经网络》,(Nayak,A.C.;Sharma,A.,PRICAI 2019:人工智能趋势(2019),Springer International Publishing:Springer国际出版公司Cham),542-554
[14] Darwiche,A.,《SDD:命题知识库的新规范表示法》,(IJCAI国际人工智能联合会议(2011)),819-826
[15] 大卫·H·A。;Nagaraja,H.N.,《顺序统计》,《统计科学百科全书》(2003年)·Zbl 1053.62060号
[16] 德梅斯特,T。;Rocktäschel,T。;Riedel,S.,关系嵌入的提升规则注入,(2016年自然语言处理经验方法会议论文集(2016),计算语言学协会),1389-1399
[17] Diligenti,M。;戈里,M。;Sacca,C.,用于学习和推理的基于语义的正则化,Artif。智力。,244, 143-165 (2017) ·Zbl 1404.68100号
[18] Diligenti,M。;Roychowdhury,S。;Gori,M.,《将先验知识融入深度学习》,(机器学习与应用(ICMLA),2017年IEEE第16届国际会议(2017年),IEEE),920-923
[19] I.多纳德罗。;塞拉菲尼,L。;Garcez,A.d.,语义图像解释的逻辑张量网络,(IJCAI国际人工智能联合会议(2017)),1596-1602
[20] 埃文斯,R。;Grefenstette,E.,从噪声数据中学习解释规则,J.Artif。智力。Res.,61,65-170(2018)·Zbl 1426.68235号
[21] 甘切夫,K。;Gillenwater,J.,结构化潜在变量模型的后验正则化,J.Mach。学习。2001年至1949年第11号决议(2010年)·Zbl 1242.68223号
[22] 公元加尔塞兹。;布罗达,K.B。;Gabbay,D.M.,《神经符号学习系统:基础与应用》(2012),施普林格科学与商业媒体
[23] 加内洛,M。;阿鲁库马兰,K。;Shanahan,M.,《走向深层符号强化学习》(2016),arXiv预印本
[24] 盖托,L。;Taskar,B.,《统计关系学习导论》,第1卷(2007年),麻省理工学院出版社:麻省理学院出版社剑桥·兹比尔1141.68054
[25] 古德费罗,我。;Y.本吉奥。;科尔维尔,A。;Bengio,Y.,《深度学习》,第1卷(2016),麻省理工学院出版社:麻省理学院出版社剑桥·Zbl 1373.68009号
[26] 郭,S。;王,Q。;Wang,L。;王,B。;郭,L.,联合嵌入知识图和逻辑规则,(2016年自然语言处理实证方法会议论文集(2016)),192-202
[27] 古普塔,A.K。;Nadarajah,S.,《贝塔分布及其应用手册》(2004),CRC出版社·Zbl 1062.62021号
[28] Hájek,P.,《模糊逻辑的元数学》(1998),Kluwer·Zbl 0937.03030号
[29] Hall,P.,从变量取值在0和1之间的人群中抽取的N大小样本的平均值分布,所有这些值的概率相等,Biometrika,19,240-245(1927)·JFM 53.0518.05号
[30] Harnad,S.,《符号接地问题》,Physica D,42,335-346(1990)
[31] Hempel,C.G.,《确认逻辑研究》(II),《思维》,第54卷,第97-121页(1945年)·Zbl 0060.01910
[32] 胡,Z。;马,X。;刘,Z。;霍维,E。;Xing,E.,利用逻辑规则利用深度神经网络,(计算语言学协会第54届年会论文集(第1卷:长篇论文)(2016),计算语言学协会),2410-2420
[33] Hwang,C.L。;Masud,A.S.M.,《多目标决策方法与应用:现状调查》,第164卷(2012年),施普林格科学与商业媒体
[34] Irwin,J.O.,《关于具有有限矩频率定律的人群样本均值的频率分布,特别是皮尔逊II型,生物统计学,225-239(1927)》·JFM 53.0518.04号
[35] Jang,J.S.R.,ANFIS:基于自适应网络的模糊推理系统,IEEE Trans。系统。人类网络。(1993)
[36] Jang,J.S.R。;Sun,C.T。;Mizutani,E.,《神经模糊和软计算:学习和机器智能的计算方法》(1997)
[37] 贾普科维奇,N。;斯蒂芬,S.,《阶级不平衡问题:系统研究》,《知识分子》。数据分析。,6, 429-449 (2002) ·Zbl 1085.68628号
[38] 贾亚拉姆,B。;Baczynski,M.,《模糊含义》,第231卷(2008),《施普林格:施普林格柏林》,海德堡·Zbl 1147.03012号
[39] Kingma,D.P。;Ba,J.,Adam:随机优化方法(2017)
[40] 克莱门特,E.P。;梅西亚尔,R。;Pap,E.,《三角规范》,第8卷(2013年),施普林格科学与商业媒体
[41] Klir,G。;Yuan,B.,《模糊集与模糊逻辑》,第4卷(1995),普伦蒂斯·霍尔:新泽西普伦蒂斯霍尔·Zbl 0915.03001号
[42] van Krieken,E。;Acar,E。;van Harmelen,F.,《使用可微推理的半监督学习》,IfCoLog J.Log。申请。,6, 633-653 (2019) ·Zbl 1514.68264号
[43] 乐村,Y。;Cortes,C.,MNIST手写数字数据库(2010年)
[44] Lin,C.T。;Lee,G.C.,基于神经网络的模糊逻辑控制和决策系统,IEEE Trans。计算。(1991) ·Zbl 1395.93324号
[45] 刘,Y。;Kerre,E.,《模糊量词概述》。(一) ●●●●。解释,模糊集系统。,95, 1-21 (1998) ·Zbl 0923.03034号
[46] 曼哈芙,R。;杜曼奇奇,S。;Kimmig,A。;德梅斯特,T。;De Raedt,L.,DeepProbLog:神经概率逻辑编程,(Bengio,S.;Wallach,H.M.;Larochelle,H.;Grauman,K.;Cesa-Bianchi,N.;Garnett,R.,《神经信息处理系统进展》31:2018年神经信息处理系统年会。神经信息处理系统进展31:2018年神经信息处理体系年会,2018年12月3日至8日,加拿大蒙特利尔(2018))(2018)
[47] Marcus,G.,《深度学习:批判性评估》(2018),arXiv预印本
[48] 马拉,G。;詹尼尼,F。;Diligenti,M。;Gori,M.,基于约束的视觉生成(2018),arXiv预印本
[49] 马拉,G。;詹尼尼,F。;Diligenti,M。;Gori,M.,《将学习和推理与深层逻辑模型相结合》(2019年),第1-17页
[50] 马拉,G。;詹尼尼,F。;Diligenti,M。;Maggini,M。;Gori,M.,《学习与T规范理论》(2019),arXiv预印本
[51] Mayo,M.,《符号基础及其对人工智能BT的影响》,第二十六届澳大利亚计算机科学会议(ACSC2003)。第二十六届澳大利亚计算机科学会议(ACSC200316(2003)),55-60
[52] Minervini,P。;德梅斯特,T。;Rocktäschel,T。;Riedel,S.,调节神经链接预测因子的对抗集,(人工智能中的不确定性——第33届会议的进程。人工智能的不确定性-第33届大会的进程,UAI 2017(2017))
[53] Minervini等人。;Riedel,S.,《反向调节神经NLI模型以整合逻辑背景知识》(第22届计算自然语言学习会议论文集(2018)),65-74
[54] 麻格尔顿,S。;de Raedt,L.,《归纳逻辑编程:理论和方法》,J.Log。程序。,19-20, 629-679 (1994) ·Zbl 0816.68043号
[55] 墨菲,K.P。;韦斯,Y。;Jordan,M.I.,近似推理的Loopy信念传播:一项实证研究,(第十五届人工智能不确定性会议论文集(2013),摩根考夫曼出版社),467-475
[56] 弗吉尼亚州诺瓦克。;佩菲利耶娃,I。;莫奇科,J.,《模糊逻辑的数学原理》(1999),施普林格:美国施普林格出版社·Zbl 0940.03028号
[57] Páll Jónsson,H.,实逻辑和逻辑张量网络(2018),阿姆斯特丹大学,硕士论文,45
[58] Pearl,J.,《智能系统中的概率推理:合理推理网络》(1988),爱思唯尔出版社
[59] Pearl,J.,《因果革命七大火花对机器学习的理论障碍》(第十一届ACM网络搜索和数据挖掘国际会议(2018年),ACM),3
[60] Pham,T.G。;Turkkan,N.,《具有β分布元件寿命的备用系统的可靠性》,IEEE Trans。Reliab公司。(1994年)
[61] Radford,A。;吴杰。;儿童,R。;Luan博士。;阿莫代伊·D·。;Sutskever,I.,《语言模型是无监督的多任务学习者》(2019年)
[62] Rasmus,A。;Berglund,M。;Honkala,M。;瓦尔波拉,H。;Raiko,T.,梯形网络半监督学习,(神经信息处理系统进展(2015)),3546-3554
[63] Riegel,R。;格雷,A。;卢斯,F。;Khan,N。;北马孔多。;纽约州阿哈尔瓦亚。;钱,H。;费金,R。;巴拉奥纳,F。;美国夏尔马。;伊克巴尔,S。;卡拉南,H。;奈拉姆,S。;Likhyani,A。;Srivastava,S.,逻辑神经网络(2020)
[64] Rocktäschel,T。;Riedel,S.,端到端可微证明(2017)
[65] Rocktäschel,T。;辛格,S。;Riedel,S.,将逻辑背景知识注入到关系提取的嵌入中,(计算语言学协会北美分会2015年会议记录:人类语言技术(2015)),1119-1129
[66] Sen,P。;Namata,G。;Bilgic,医学硕士。;盖托,L。;Galligher,B。;Eliasi-Rad,T.,网络数据中的集体分类,AI Mag.,29,93(2008)
[67] 塞拉菲尼,L。;Garcez,A.D.,《逻辑张量网络:数据和知识的深度学习和逻辑推理》(CEUR研讨会论文集1768(2016))
[68] 西尔弗·D。;Schrittwieser,J。;Simonyan,K。;安东尼奥卢,I。;黄,A。;A.盖兹。;休伯特,T。;贝克,L。;赖,M。;博尔顿,A.,《在没有人类知识的情况下掌握围棋游戏》,《自然》,550,354(2017)
[69] Socher,R。;陈,D。;曼宁,C.D。;Ng,A.Y.,《用神经张量网络推理完成知识库》(NIPS’13(2013)Proc.),1-10
[70] Šourek,G。;Aschenbrenner,V。;elezn,F。;Kuíelka,O.,提升的关系神经网络,(CEUR研讨会论文集(2015))
[71] 苏雷克,G。;Aschenbrenner,V。;elezn,F。;肖克尔特,S。;Kuželka,O.,提升关系神经网络:潜在关系结构的有效学习,J.Artif。智力。决议,62,69-100(2018)·Zbl 1444.68163号
[72] 弗拉纳斯,P.B.,亨佩尔的乌鸦悖论:标准贝叶斯解决方案的缺陷,Br.J.Philos。科学。,55, 545-560 (2004) ·Zbl 1059.03514号
[73] Weisberg,H.,均匀分布中顺序统计线性组合的分布,《数学年鉴》。Stat.,42,704-709(1971)·Zbl 0226.62046号
[74] 徐,J。;张,Z。;弗里德曼,T。;梁,Y。;den Broeck,G.,《利用符号知识进行深度学习的语义损失函数》,(Dy,J.;Krause,A.,《第35届机器学习国际会议论文集》,第35届国际机器学习会议论文集,PMLR,Stockholmsmässan,瑞典斯德哥尔摩(2018)),5502-5511
[75] Yager,R.R.,关于一类模糊连接词,模糊集系统。,4235-242(1980年)·Zbl 0443.04008号
[76] 周振华,弱监督学习简介,自然科学。版次:5,44-53(2017)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。