×

结构化机器学习:未来十年。 (英语) Zbl 1470.68098号

摘要:归纳逻辑编程(ILP)领域自1991年第一次ILP研讨会以来,在理论、实现和应用发展的平衡基础上取得了稳步进展。最近,人们越来越重视概率ILP以及统计关系学习(SRL)和结构化预测的相关领域。本论文的目标是考虑这些新兴趋势,并为未来10年结构化机器学习的更广泛领域制定战略方向和开放问题。

MSC公司:

68T05型 人工智能中的学习和自适应系统
01A67号 数学未来展望
68N17号 逻辑编程
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Amini,A.、Muggleton,S.H.H.L.和Sternberg,M.(2007年)。一种新的基于逻辑的定量毒理学预测方法。化学信息学建模杂志,47(3),998–1006。doi:0.1021/ci600223dS1549-9596(60)00223-4。 ·doi:10.1021/ci600223d
[2] Anzai,Y.和Simon,H.A.(1979年)。在实践中学习的理论。《心理评论》,86,124-140·doi:10.1037/0033-295X.86.2.124
[3] Bakir G.H.、Hofmann T.、Schölkopf B.、Smola A.J.、Taskar B.和Vishwanathan S.V.N.(编辑)(2007年)。预测结构化数据。纽约:麻省理工学院出版社。
[4] Bertsekas,D.(1999)。非线性规划。贝尔蒙特:雅典娜科技·Zbl 1015.90077号
[5] Bhattacharya,I.和Getoor,L.(2004)。用于清理和集成的迭代记录链接。在法国巴黎举行的ACM SIGMOD数据挖掘和知识发现(DMKD)研究问题研讨会上。
[6] Bryant,C.、Muggleton,S.、Oliver,S.,Kell,D.、Reiser,P.和King,R.(2001年)。结合归纳逻辑编程、主动学习和机器人技术来发现基因的功能。人工智能电子交易,5-B1(012),1-36。
[7] Chakrabarti,S.、Dom,B.和Indyk,P.(1998年)。使用超链接增强超文本分类。在国际数据管理会议上(第307-318页)。
[8] Collins,M.(2002)。隐马尔可夫模型的判别训练方法:感知机算法的理论和实验。《自然语言处理经验方法会议论文集》(EMNLP 2002)(第1-8页),美国新泽西州莫里斯敦计算语言学协会。
[9] Collins,M.和Roark,B.(2004年)。使用感知器算法进行增量解析。《计算语言学协会会议录》(ACL-2004)(第111-118页)。计算语言学协会。
[10] Colton,S.和Muggleton,S.(2006年)。归纳逻辑程序设计的数学应用。机器学习,64,25-64。doi:10.1007/s10994-006-8259-x·Zbl 1103.68438号 ·数字对象标识代码:10.1007/s10994-006-8259-x
[11] Costa,V.、Page,D.、Qazi,M.和Cussens,J.(2003)。CLP(BN):概率知识的约束逻辑编程。《第19届人工智能不确定性年会论文集》(UAI-03)(第517-552页),旧金山。圣马特奥:摩根·考夫曼。
[12] Crammer,K.、Dekel,O.、Keshet,J.、Shalev Shwartz,S.和Singer,Y.(2006)。在线被动攻击算法。机器学习研究杂志,7551–585·Zbl 1222.68177号
[13] Culotta,A.、Wick,M.、Hall,R.和McCallum,A.(2007年)。共指消解的一阶概率模型。HLT/NAACL(第81–88页)。
[14] Cussens,J.(1997)。使用Progol进行部分语音标记。在LNAI:第1297卷。程序。第七届归纳逻辑编程国际研讨会(ILP-97)(第93–108页)。柏林:斯普林格。
[15] Cussens,J.(2001)。随机逻辑程序中的参数估计。机器学习,44(3),245–271·Zbl 0986.68010号 ·doi:10.1023/A:1010924021315
[16] DauméIII,H.和Marcu,D.(2005年)。学习作为搜索优化:结构化预测的近似大幅度方法。《第22届机器学习国际会议论文集》(ICML-2005)(第169-176页)。麦迪逊:无所不在。
[17] DauméIII,H.、Langford,J.和Marcu,D.(2007年)。基于搜索的结构化预测(技术报告)。犹他大学计算机科学系。
[18] De Raedt,L.和Kersting,K.(2004)。概率归纳逻辑编程。S.Ben-David、J.Case和A.Maruoka(编辑),计算机科学讲稿:第3244卷。第15届算法学习理论国际会议论文集(第19-36页)。柏林:斯普林格·Zbl 1110.68392号
[19] De Raedt L.、Frasconi P.、Kersting K.和Muggleton S.H.(编辑)(2008年)。计算机科学课堂讲稿。概率归纳逻辑编程。柏林:斯普林格。
[20] DeJong,G.和Mooney,R.(1986年)。基于解释的学习:另一种观点。机器学习,1145–176。
[21] Dietterich,T.G.和Michalski,R.S.(1985年)。发现事件序列中的模式。人工智能,25(2),187-232·doi:10.1016/0004-3702(85)90003-7
[22] DiMaio,F.和Shavlik,J.(2004)。学习归纳逻辑编程子句求值的近似方法。R.Camacho、R.King和A.Srinivasan(编辑),人工智能讲义:第3194卷。第14届归纳逻辑编程国际会议论文集(第80-96页)。柏林:斯普林格·兹比尔1105.68370
[23] Domingos,P.、Kok,S.、Poon,H.、Richardson,M.和Singla,P.(2006)。统一逻辑和统计人工智能。第21届全国人工智能会议论文集(AAAI 2006)(第2-7页)。门罗公园:AAAI出版社·Zbl 1401.68302号
[24] Duchi,J.、Tarlow,D.、Elidan,G.和Koller,D.(2007年)。在最大生产信念传播中使用组合优化。B.Schölkopf、J.Platt和T.Hoffman(编辑),《神经信息处理系统的进展》(第19卷,第369-376页)。剑桥:麻省理工学院出版社。
[25] Dzeroski,S.、De Raedt,L.和Driessens,K.(2001)。关系强化学习。机器学习,43,7-52·Zbl 0988.68088号 ·doi:10.1023/A:1007694015589
[26] Evans,T.G.(1968年)。解决一类几何类比智能测试问题的程序。M.Minsky(编辑),语义信息处理。波士顿:麻省理工学院出版社。
[27] Fern,A.和Givan,R.(2006年)。具有可靠观察结果的序贯推理:学习构建力动力学模型。人工智能,170(14-15),1081-1122·兹比尔1130.68320 ·doi:10.1016/j.artint.2006.08.003
[28] Fern,A.、Yoon,S.和Givan,R.(2006年)。带有策略语言偏差的近似策略迭代:求解关系马尔可夫决策过程。《人工智能研究杂志》,25,75–118·Zbl 1182.68237号
[29] Fikes,R.、Hart,P.和Nilsson,N.(1972年)。学习和执行通用机器人计划。人工智能,3251–288·doi:10.1016/0004-3702(72)90051-3
[30] Finn,P.、Muggleton,S.、Page,D.和Srinivasan,A.(1998年)。使用归纳逻辑编程系统Progol。机器学习,30,241–271·doi:10.1023/A:1007460424845
[31] Friedman,N.、Getoor,L.、Koller,D.和Pfeffer,A.(1999)。学习概率关系模型。《国际人工智能联合会议记录》(第1300-1307页),瑞典斯德哥尔摩。圣马特奥:摩根·考夫曼。
[32] Gärtner,T.(2003)。对结构化数据内核的调查。SIGKDD探索,5(1),49–58·数字对象标识代码:10.1145/959242.959248
[33] Getoor L.和Taskar B.(编辑)(2007年)。统计学关系学习导论。纽约:麻省理工学院出版社·Zbl 1141.68054号
[34] Getoor,L.、Friedman,N.、Koller,D.和Pfeffer,A.(2001a)。学习概率关系模型。S.Díeroski和N.Lavrać(编辑),关系数据挖掘(第307–335页)。多德雷赫特:克鲁沃。
[35] Getoor,L.、Segal,E.、Taskar,B.和Koller,D.(2001b)。用于超文本分类的文本和链接结构的概率模型。在IJCAI文本学习研讨会上:超越监督。
[36] Getoor,L.、Friedman,N.、Koller,D.和Taskar,B.(2002年)。学习链路结构的概率模型。机器学习研究杂志,3679–707·Zbl 1112.68441号 ·doi:10.1162/jmlr.2003.3.4-5.679
[37] Heckerman,D.、Meek,C.和Koller,D.(2004)。关系数据的概率模型(技术报告MSR-TR-04-30)。微软研究。
[38] Hinton,G.E.、Osindero,S.和Teh,Y.-W.(1993)。一种深度信念网的快速学习算法。神经计算,18527-1554·兹比尔1106.68094 ·doi:10.1162/neco.2006.18.7.1527
[39] Jaeger,M.(1997)。关系贝叶斯网络。M.Kaufmann(Ed.),第13届人工智能不确定性年会论文集(第266-273页)。
[40] Kersting,K.、Raedt,L.D.和Kramer,S.(2000年)。解释贝叶斯逻辑程序。《AAAI-2000年从关系数据学习统计模型研讨会论文集》(第29-35页),加拿大阿尔伯塔省班夫。门罗公园:AAAI出版社。
[41] Kersting,K.、Van Otterlo,M.和De Raedt,L.(2004)。贝尔曼走上了关系型。《第二十届第一届机器学习国际会议论文集》(第59-67页),加拿大阿尔伯塔省班夫。门罗公园:AAAI出版社。
[42] King,R.、Whelan,K.、Jones,F.、Reiser,P.、Bryant,C.、Muggleton,S.、Kell,D.和Oliver,S.(2004)。机器人科学家的功能基因组假说生成和实验。《自然》,427,247–252·doi:10.1038/nature02236
[43] Kok,S.和Domingos,P.(2005)。学习马尔可夫逻辑网络的结构。L.De Raedt&S.Wrobel(编辑),第22届国际机器学习年会论文集(ICML-2005)(第441-448页)。麦迪逊:无所不在。
[44] Kok,S.和Domingos,P.(2007年)。统计谓词发明。Z.Ghahramani(Ed.),第24届国际机器学习年会(ICML-2007)会议记录(第433-440页)。麦迪逊:无所不在。
[45] Koller,D.和Pfeffer,A.(1998年)。基于概率框架的系统。第14届人工智能不确定性年会论文集(第580–587页)。
[46] Kubica,J.、Moore,A.、Schneider,J.和Yang,Y.(2002年)。随机链接和组检测。第18届全国人工智能会议论文集(第798-804页)。门罗公园:AAAI出版社。
[47] Lafferty,J.、McCallum,A.和Pereira,F.(2001年)。条件随机场:用于分割和标记序列数据的概率模型。第18届机器学习国际会议论文集(ICML-2001)(第282-289页)。
[48] Lavrać,N.和Díeroski,S.(1994年)。归纳逻辑编程:技术和应用。奇切斯特:埃利斯-霍伍德。
[49] Leathwick,J.、Rowe,D.、Richardson,J.,Elith,J.和Hastie,T.(2005)。使用多元自适应回归样条预测新西兰淡水溯河鱼类的分布。淡水生物学,502034-2052·doi:10.1111/j.1365-2427.2005.01448.x
[50] Liang,P.、Bouchard-Cóté,A.、Klein,D.和Taskar,B.(2006年)。机器翻译的端到端鉴别方法。《21世纪计算语言学国际会议论文集》(COLING/ACL)(第761-768页)。
[51] Liben-Nowell,D.和Kleinberg,J.(2003)。社交网络的链接预测问题。信息和知识管理国际会议(CIKM)(第556-559页)。
[52] Lowd,D.和Domingos,P.(2005)。概率估计的朴素贝叶斯模型。L.De Raedt和S.Wrobel(编辑),第22届国际机器学习年会论文集(ICML-2005)。纽约:Assoc.Comput。机器。
[53] Lowd,D.和Domingos,P.(2007年)。递归随机字段。《国际人工智能联合会议论文集》(第950-955页)。IJCAI公司。
[54] Lu,Q.,&Getoor,L.(2003)。基于链接的分类。第20届机器学习国际会议论文集。
[55] Macskassy,S.和Provost,F.(2007)。网络数据分类:工具包和单变量案例研究。机器学习杂志,8935–983。
[56] Mark,W.和Perrault,R.(2007)。CALO:学习和组织的认知助理(技术报告)。SRI国际。
[57] Mihalkova,L.、Huynh,T.和Mooney,R.(2007)。映射和修改马尔可夫逻辑网络以进行转移学习。第22届全国人工智能会议论文集(第608-614页)。
[58] Milch,B.和Russell,S.(2006年)。一阶概率语言:进入未知。S.M.R.Otero和A.Tamaddoni-Nezhad(编辑),人工智能讲义:第4455卷。第16届归纳逻辑编程国际会议论文集(第10-24页)。柏林:斯普林格·Zbl 1201.68120号
[59] Milch,B.、Marthi,B.和Russell,S.(2004年)。BLOG:使用未知对象进行关系建模。在ICML2004统计关系学习及其与其他领域的联系研讨会上。
[60] Mitchell,T.M.、Keller,R.M.和Kedar-Cabelli,S.T.(1986年)。基于解释的概括:统一的观点。机器学习,1(1),47–80。
[61] Muggleton,S.(1995年)。逆蕴涵和程序。新一代计算,13,245–286·doi:10.1007/BF03037227
[62] Muggleton,S.(1996)。随机逻辑程序。L.de Raedt(Ed.),《归纳逻辑编程进展》(第254-264页)。阿姆斯特丹:IOS出版社。
[63] Muggleton,S.(2005)。系统生物学的机器学习。在LNAI:第3625卷。第十五届归纳逻辑编程国际会议论文集(第416–423页)。柏林:斯普林格。
[64] Muggleton,S.(2006年)。超出人类极限。《自然》,440(7083),409-410·doi:10.1038/440409a
[65] Muggleton,S.和De Raedt,L.(1994)。归纳逻辑程序设计:理论和方法。逻辑编程杂志,19629–679·Zbl 0816.68043号 ·doi:10.1016/0743-1066(94)90035-3
[66] Muggleton,S.和Feng,C.(1990年)。逻辑程序的有效归纳。算法学习理论第一届会议论文集(第368-381页)。柏林:斯普林格。
[67] Neville,J.和Jensen,D.(2000年)。关系数据中的迭代分类。在AAAI统计关系学习研讨会上。
[68] Neville,J.和Jensen,D.(2003年)。用关系依赖网络进行集体分类。第二届多关系数据挖掘研讨会论文集。
[69] Neville,J.和Jensen,D.(2007年)。关系依赖网络。机器学习研究杂志,8653–692·Zbl 1222.68274号
[70] Nocedal,J.和Wright,S.J.(1999)。数值优化。纽约:斯普林格·Zbl 0930.65067号
[71] Paes,A.、Revoredo,K.、Zaverucha,G.和Costa,V.S.(2005年)。实例中的概率一阶理论修正。在S.Kramer和B.Pfahringer(编辑),人工智能讲义:第3625卷。第15届归纳逻辑编程国际会议论文集(第295-311页)。柏林:斯普林格·Zbl 1134.68550号
[72] Parker,C.、Fern,A.和Tadepalli,P.(2006)。用于序列对齐的梯度增强。《第21届全国人工智能会议论文集》(AAAI-2006),波士顿。AAAI出版社:门罗公园。
[73] Parker,C.、Fern,A.和Tadeballi,P.(2007年)。学习如何通过噪声查询高效检索结构化数据。Z.Ghahramani(编辑),《第24届机器学习国际会议论文集》(ICML-2007)(第729-736页)。俄勒冈州。麦迪逊全能女郎:科尔瓦利斯。
[74] Pasula,H.、Marthi,B.、Milch,B.、Russell,S.和Shpitser,I.(2002)。身份不确定性和引文匹配。神经信息处理系统(NIPS)进展,151401-1408。
[75] Pfeffer,A.(2001)。IBAL:一种概率理性编程语言。《国际人工智能联合会议论文集》(第733-740页)。
[76] Plotkin,G.(1969年)。关于归纳概括的注释。B.Meltzer和D.Michie(编辑),《机器智能》(第5卷,第153-163页)。爱丁堡:爱丁堡大学出版社·Zbl 0219.68045号
[77] Poole,D.(1993)。概率角外推和贝叶斯网络。人工智能,64(1),81–129·Zbl 0792.68176号 ·doi:10.1016/0004-3702(93)90061-F
[78] Puech,A.和Muggleton,S.(2003年)。随机逻辑程序和贝叶斯逻辑程序的比较。在IJCAI关于从关系数据学习统计模型的研讨会上。IJCAI公司。
[79] Quinlan,J.(1990)。从关系中学习逻辑定义。机器学习,5239–266。
[80] Reid,M.(2004)。使用多任务学习改进规则评估。R.Camacho、R.King和A.Srinivasan(编辑),人工智能讲义:第3194卷。第14届归纳逻辑编程国际会议论文集(第252-269页)。柏林:斯普林格·兹比尔1105.68392
[81] Richardson,M.和Domingos,P.(2006年)。马尔可夫逻辑网络。机器学习,62(1-2),107–136·Zbl 1470.68221号 ·doi:10.1007/s10994-006-5833-1
[82] Rosenfeld,A.、Hummel,R.和Zucker,S.(1976年)。通过放松操作标记场景。IEEE系统、人与控制论汇刊,SMC-6420-433·Zbl 0335.68070号 ·doi:10.1109/TSMC.1976.4309519
[83] Sanner,S.和Boutilier,C.(2006年)。一阶MDP的实用线性值逼近技术。第22届人工智能不确定性年会论文集·Zbl 1191.68641号
[84] 佐藤(2005)。PRISM中出现故障的生成建模。国际人工智能联合会议(第847-852页)。圣马特奥:摩根·考夫曼。
[85] Sato,T.和Kameya,Y.(1997年)。棱镜:一种符号统计建模语言。第15届国际人工智能联合会议记录(第1330–1335页)。
[86] Shapiro,E.(1983年)。算法程序调试。剑桥:麻省理工学院出版社·Zbl 0589.68003号
[87] Sutton,C.和McCallum,A.(2007年)。有效训练条件随机场的分段伪似然。Z.Ghahramani(Ed.),第24届机器学习国际会议论文集(ICML-2007)(第863-870页)。全能女。
[88] Tadepalli,P.、Givan,B.和Driessens,K.(2004)。关系强化学习:概述。在加拿大班夫举行的ICML关系强化学习研讨会上。
[89] Tamaddoni-Nezhad,A.、Chaleil,R.、Kakas,A.和Muggleton,S.(2006年)。外展ILP在从时间数据学习代谢网络抑制中的应用。机器学习,64,209–230。doi:10.1007/s10994-006-8988-x·Zbl 1103.68443号 ·数字对象标识代码:10.1007/s10994-006-8988-x
[90] Tamaddoni-Nezhad,A.、Chaleil,R.、Kakas,A.、Sternberg,M.、Nicholson,J.和Muggleton,S.(2007年)。模拟毒素在代谢网络中的影响。IEEE医学和生物学工程,26,37–46。doi:10.1109/MEMB.2007.335590。 ·doi:10.10109/MEMB.2007.335590文件
[91] Taskar,B.、Segal,E.和Koller,D.(2001年)。关系数据中的概率分类和聚类。《国际人工智能联合会议论文集》(第870-878页)。
[92] Taskar,B.、Abbeel,P.和Koller,D.(2002年)。关系数据的判别概率模型。第18届人工智能不确定性年会论文集(第485-492页)。
[93] Taskar,B.、Guestrin,C.和Koller,D.(2003b)。最大边际马尔可夫网络。神经信息处理系统进展,16。
[94] Taskar,B.、Wong,M.、Abbeel,P.和Koller,D.(2003a)。关系数据中的链接预测。神经信息处理系统进展,16。
[95] Tsochantaridis,I.、Joachims,T.、Hofmann,T.和Altun,Y.(2005)。结构化和相互依赖输出变量的大幅度方法。机器学习研究杂志,61453-1484·Zbl 1222.68321号
[96] Wang,C.和Khardon,R.(2007)。关系MDP的策略迭代。第23届人工智能不确定性年会论文集。
[97] Wellman,M.、Breese,J.和Goldman,R.(1992年)。从知识库到决策模型。《知识工程评论》,7(1),35-53·doi:10.1017/S0269888900006147
[98] Winston,P.(1975)。从示例中学习结构描述。在P.Winston(Ed.)《计算机视觉心理学》中。纽约:McGraw Hill。
[99] Wrobel,S.(1995)。一阶理论精化。L.D.Raedt(Ed.),《归纳逻辑编程进展》(第14–33页)。阿姆斯特丹:IOS出版社。
[100] Xu,Y.和Fern,A.(2007)。关于学习波束搜索的线性排序函数。在Z.Gahramani(编辑)第24届机器学习国际会议论文集(ICML-2007)(第1047–1054页)。全能女。
[101] Xu,Y.、Fern,A.和Yoon,S.(2007)。用于规划的波束搜索启发式的判别学习。M.M.Veloso(编辑)《国际人工智能联合会议记录》(IJCAI-07)(第2041–2046页)。IJCAI公司。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。