内政部：2006年10月10日/inco.2000.2946
语料库ID:14507723

学习赢得过程控制游戏观看游戏大师

@进行中{案例1998学习TW，title={学习赢得过程控制游戏观看游戏大师}，作者＝{John Case和Matthias Ott以及Arun Sharma和Frank Stephan}，booktitle={信息与计算}，年份={1998年}，网址={https://api.semanticscholar.org/CorpusID:14507723}}

J.案例马提亚斯·奥特 F.斯蒂芬
出版在里面信息与计算 1998年10月8日
计算机科学

研究表明，被选中的大师比武断的大师更有助于学习，在有些情况下，人们可以从大师那里学习赢得策略的程序，但如果需要学习大师策略本身的程序，则无法学习。

通过Publisher查看

10引文

1

分支学习模型中游戏和过程控制的结构度量

马提亚斯·奥特F.斯蒂芬

计算机科学、数学

理论计算机科学

1997

无限游戏的学习策略

马提亚斯·奥特

计算机科学、数学

1998

本文受到了作者与John Case教授和Arun Sharma教授进行的许多有趣讨论的影响，也受到了他数学技巧惊人的速度和无限范围的影响，他对此非常钦佩。

学习分支的复杂性与查询策略

马提亚斯·奥特F.斯蒂芬

计算机科学、数学

算法与…国际研讨会…

1997

找到了一种应用Anguin关于从查询中识别确定性有限自动机的结果的方法，它可以产生正负策略学习结果，并且证明了这类无死角的封闭有限状态博弈是可以从成员和策略查询中有效地学习策略的。

2

IMP游戏：超越$$\Sigma^0_1的可学习性、接近性和对抗性学习$$

M.品牌D.杜威

计算机科学、数学

逻辑与计算杂志

2017

介绍了迭代匹配便士博弈，表明它是研究三个问题的有力框架：对手可学习性、常规（即非对手）可学习性和逼近性。

[PDF]（PDF格式）

迄今为止的进展和今后的发展方向

计算机科学、数学

本文首先简要指出了作者几十年来在可计算性理论（CT），也就是递归函数理论方面工作的主要非标准动机。然后它讨论…

PDF格式

Muchnik学位I内部：不连续性、可学习性和建构主义

Higuchi小次郎高崎木原

数学

纯逻辑与应用逻辑年鉴

2014

一步并行重写理论的存在片段

阿列克西·舒伯特

计算机科学、数学

重写技术国际会议…

2009

结果表明，对于带有***7前缀的公式和左线性重写系统，***p的一阶理论已经是不可判定的。

PDF格式

关于学习协调：随机位帮助、有洞察力的范式和能力同构

J.案例桑杰·贾恩F.蒙塔格纳朱利亚·西米A.索比

计算机科学、数学

计算机与系统科学杂志（印刷版）

2005

拟合/预测数据和机器自我参考的可计算性理论学习程序

计算机科学

2012

超越纯数学的可计算性理论方向

数学、计算机科学

2007

本文首先简要说明了作者数十年来在可计算性理论（CT），即递归函数理论（Recursive Function Theory）方面工作的主要非标准动机。

分支学习模型中游戏和过程控制的结构度量

马提亚斯·奥特F.斯蒂芬

计算机科学、数学

理论计算机科学

1997

学习分支和学习赢得封闭游戏

M.Kummer先生马提亚斯·奥特

计算机科学、数学

计算学习理论年会

1996

引入了归纳推理的两个新概念：学习递归树的无限递归分支和学习封闭递归博弈的获胜策略，这两个概念等价于获胜策略学习。

递归呈现的游戏和策略

D.烤炉J.雷梅尔

数学

1992

29

无限对策中策略的综合

计算机科学

计算机理论专题讨论会…

1995

描述了无限对策的自动机理论设置（由“对策图”给出），有限状态对策中获胜策略的一种新构造，以及在有效呈现的无限图上进行对策时出现的一些问题。

用有限状态策略求解序列条件

J.布奇L.兰德韦伯

计算机科学、数学

1969

一种决定条件是否存在的算法𝕮序列微积分中陈述的（X，Y）允许有限自动机解，如果存在，则产生有限自动机解，并解决[4]中陈述的问题，并包含[6]中保留的情况4的答案。

学习分支的复杂性与查询策略

马提亚斯·奥特F.斯蒂芬

计算机科学、数学

算法与…国际研讨会…

1997

找到了一种应用Anguin关于从查询中识别确定性有限自动机的结果的方法，它可以产生正负策略学习结果，并且证明了这类无死角的封闭有限状态博弈是可以从成员和策略查询中有效地学习策略的。

2

有限图上的无限对策

计算机科学、数学

Ann.纯粹应用。逻辑

1993

强化学习：一项调查

L.Kaelbling先生M.利特曼A.摩尔

计算机科学

人工智能研究杂志

1996

讨论了强化学习的核心问题，包括权衡探索和开发，利用马尔可夫决策理论建立领域基础，从延迟强化中学习，构建加速学习的经验模型，利用泛化和层次结构，以及处理隐藏状态。

8,445

[PDF]（PDF格式）

多元论在程序自动综合中的作用

卡尔·H·史密斯

计算机科学

JACM公司

1982

研究了学习过程中涉及的IIM数量与成功标准的通用性之间的权衡。

使用符号机器学习自动构建反应控制系统

计算机科学、工程

知识工程审查（打印）

1996

本文回顾了机器学习在工业控制问题中的一些应用，从尝试为任务自动构建基于规则的反应系统的角度出发，这些任务如果由人类执行，将需要高度的技能，但通常是在不经过思考的情况下执行的。