文件Zbl 1082.68714-zbMATH Open

将神经网络应用于连续空间中的强化学习。（英语） Zbl 1082.68714号

Wang，Jun（编辑）等人，《神经网络进展——ISNN 2005》。第二届神经网络国际研讨会，中国重庆，2005年5月30日至6月1日。会议记录，第一部分，柏林：施普林格出版社（ISBN 3-540-25912-0/pbk）。计算机科学课堂讲稿3496621-626（2005）。

摘要：本文研究大空间或连续空间中的强化学习问题。函数逼近是解决这类问题的主要方法。本文提出使用神经网络作为函数逼近器。然后我们用三种神经网络在山地车任务中进行了实验，并说明了它们之间的比较。结果表明，CMAC和Fuzzy ARTMAP在函数逼近强化学习（RLFA）中的性能优于BP。
关于整个系列，请参见[Zbl 1073.68013号].

MSC公司：

68T05型	人工智能中的学习和自适应系统
92B20型	生物研究、人工生命和相关主题中的神经网络

PDF格式 BibTeX公司 XML格式引用

全文：内政部

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
拉	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

将神经网络应用于连续空间中的强化学习。（英语） Zbl 1082.68714号

MSC公司：

示例

领域

操作员

将神经网络应用于连续空间中的强化学习。 （英语） Zbl 1082.68714号

MSC公司：

将神经网络应用于连续空间中的强化学习。（英语） Zbl 1082.68714号