×

将神经网络应用于连续空间中的强化学习。 (英语) Zbl 1082.68714号

Wang,Jun(编辑)等人,《神经网络进展——ISNN 2005》。第二届神经网络国际研讨会,中国重庆,2005年5月30日至6月1日。会议记录,第一部分,柏林:施普林格出版社(ISBN 3-540-25912-0/pbk)。计算机科学课堂讲稿3496621-626(2005)。
摘要:本文研究大空间或连续空间中的强化学习问题。函数逼近是解决这类问题的主要方法。本文提出使用神经网络作为函数逼近器。然后我们用三种神经网络在山地车任务中进行了实验,并说明了它们之间的比较。结果表明,CMAC和Fuzzy ARTMAP在函数逼近强化学习(RLFA)中的性能优于BP。
关于整个系列,请参见[Zbl 1073.68013号].

MSC公司:

68T05型 人工智能中的学习和自适应系统
92B20型 生物研究、人工生命和相关主题中的神经网络
PDF格式BibTeX公司 XML格式引用
全文: 内政部