×

教学规模:通用语言的可计算教师和学习者。 (英语) Zbl 1494.68231号

总结:机器教学的理论难度通常是针对一系列概念语言在教学维度的几种变体下进行分析的:教师需要找出最少数量的示例,以便学习者识别概念。然而,对于概念具有结构(因此具有大小)的语言,如图灵完全语言,可以以使用非常大的例子为代价来实现低教学维度,而这些例子很难被学习者处理。在本文中,我们介绍了教学规模这是一种更直观的评估结构化语言教学概念理论可行性的方法。在通用语言的最一般情况下,我们表明,关注见证集的总大小而不是其基数,我们可以教授在固定时间范围内可计算的所有总函数。我们用一系列简单图灵补全语言的实验结果来补充理论结果,展示了教学维度和教学规模在实践中的差异。非常值得注意的是,我们发现见证集通常小于它们识别的程序,这很好地证明了为什么从示例中进行机器教学是有意义的。

MSC公司:

68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 安格鲁因,D。;Kriķis,M.,《向不同老师学习》,机器学习,51,2,137-163(2003)·Zbl 1027.68106号 ·doi:10.1023/A:1022854802097
[2] Balbach,F.J.(2007)。算法教学模型。吕贝克大学博士论文。
[3] Balbach,FJ,《使用教学维度变体测量可教性》,《理论计算机科学》,397,1-3,94-113(2008)·Zbl 1145.68020号 ·doi:10.1016/j.tcs.2008.02.025
[4] Balbach,F.J.和Zeugmann,T.(2009年)。算法教学的最新发展。国际语言与自动机理论与应用会议(第1-18页)。斯普林格·Zbl 1234.68165号
[5] Bengio,Y.、Louradour,J.、Collobert,R.和Weston,J.(2009)。课程学习。第26届机器学习国际年会论文集(第41-48页)。ACM公司。
[6] Biran,O.,&Cotton,C.(2017年)。机器学习中的解释和论证:一项调查。在IJCAI-17可解释人工智能(XAI)研讨会上(第8页)。
[7] Böhm,C.,《关于图灵机家族及其相关编程语言》,国际商会公报,第3期,第3期,第187-194页(1964年)
[8] Elias,P.,通用码字集和整数表示,IEEE信息理论汇刊,21,2194-203(1975)·Zbl 0298.94011号 ·doi:10.1109/TIT.1975.1055349
[9] Freivalds,R.、Kinber,E.B.和Wiehagen,R.(1989)。从好例子中归纳推理。在类比推理和归纳推理国际研讨会上(第1-17页)。斯普林格·Zbl 0821.68110号
[10] Freivalds,R。;金伯,EB;Wiehagen,R.,《从好的例子中归纳推理的力量》,《理论计算机科学》,110,1,131-144(1993)·兹比尔0821.68110 ·doi:10.1016/0304-3975(93)90353-U
[11] Gao,Z.、Ries,C.、Simon,H.U.和Zilles,S.(2016)。基于偏好的教学。关于学习理论的讨论(第971-997页)·Zbl 1433.68184号
[12] Gold,EM,限额内的语言识别,信息与控制,10,5,447-474(1967)·Zbl 0259.68032号 ·doi:10.1016/S0019-9958(67)91165-5
[13] 高盛,SA;MJ Kearns,《论教学的复杂性》,《计算机与系统科学杂志》,50,1,20-31(1995)·Zbl 0939.68770号 ·doi:10.1006/jcss.1995.1003
[14] Goldman,S.A.和Mathias,H.D.(1993年)。教一个聪明的学习者。计算学习理论会议(第67-76页)。
[15] Gulwani,S.、Hernández-Orallo,J.、Kitzelmann,E.、Muggleton,S.H.、Schmid,U.和Zorn,B.(2015)。归纳编程与现实世界相遇。ACM通信,58(11)。
[16] Hernandez-Orallo,J.和Telle,J.A.(2018年)。有限偏向教学与无限概念课。arXiv预印本。arXiv:1804.07121。
[17] Jun,S.W.(2016)。每秒50000000000条指令:256核脑操计算机的设计与实现。麻省理工学院计算机科学与人工智能实验室。
[18] Khan,F.、Mutlu,B.和Zhu,X.(2011年)。人类如何教学:关于课程学习和教学维度。《神经信息处理系统的进展》(第1449-1457页)。
[19] Lake,B.和Baroni,M.(2018年)。没有系统性的泛化:关于序列到序列递归网络的合成技巧。ICML(第2879-2888页)。
[20] 湖泊,BM;Salakhutdinov,R。;Tenenbaum,JB,《通过概率程序归纳法进行人类级概念学习》,《科学》,350,6266,1332-1338(2015)·Zbl 1355.68230号 ·doi:10.1126/science.aab3050
[21] Lázaro-Gredilla,M.、Lin,D.、Guntupalli,J.S.和George,D.(2019年)。超越模仿:通过学习认知程序的概念,在机器人上进行零次任务转移。科学机器人4。
[22] 莱文,洛杉矶,通用搜索问题,信息传输问题,9265-266(1973)
[23] 李,M。;Vitányi,P.,《Kolmogorov复杂性及其应用简介》(2008年),纽约州纽约市:纽约州斯普林格·Zbl 1185.68369号 ·doi:10.1007/978-0-387-49820-1
[24] Lieberman,H.,《你的愿望就是我的命令:示例编程》(2001),加利福尼亚州旧金山:Morgan Kaufmann,加利福尼亚州洛杉矶
[25] Shafto,P。;新泽西州古德曼;格里菲思,TL,《教育推理的理性解释:通过示例教学和从示例中学习》,《认知心理学》,71,55-89(2014)·doi:10.1016/j.cogpsych.2013.12.004
[26] Shinohara,A。;Miyano,S.,《计算学习中的可教性》,新一代计算,8,4,337-347(1991)·Zbl 0712.68084号 ·doi:10.1007/BF03037091
[27] Simard,P.Y.、Amershi,S.、Chickering,D.M.、Pelton,A.E.、Ghorashi,S、Meek,C.、Ramos,G.、Suh,J.、Verwey,J.和Wang,M.等人(2017年)。机器教学:构建机器学习系统的新范式。arXiv预打印arXiv:1707.06742。
[28] 罗蒙诺夫,《归纳推理的形式理论》。第一部分,信息与控制,7,1,1-22(1964)·Zbl 0258.68045号 ·doi:10.1016/S0019-9958(64)90223-2
[29] LG Valiant,《可学习理论》,《ACM通信》,第27、11、1134-1142页(1984年)·Zbl 0587.68077号 ·数字对象标识代码:10.1145/1968.1972
[30] Vapnik,VN;Chervonenkis,AY,关于事件相对频率与其概率的一致收敛,概率论及其应用,16,264-280(1971)·Zbl 0247.60005号 ·数字对象标识代码:10.1137/1116025
[31] 朱旭(2013)。指数族贝叶斯学习者的机器教学。《神经信息处理系统》26,Curran(第1905-1913页)。
[32] 朱旭(2015)。机器教学:与机器学习相反的问题,也是实现最佳教育的途径。AAAI(第4083-4087页)。
[33] Zhu,X.、Singla,A.、Zilles,S.和Rafferty,A.N.(2018年)。机器教学概述。arXiv预打印arXiv:1801.05927。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。