王东丽;高、杨;杨培(Yang,Pei) 将神经网络应用于连续空间中的强化学习。 (英语) Zbl 1082.68714号 Wang,Jun(编辑)等人,《神经网络进展——ISNN 2005》。第二届神经网络国际研讨会,中国重庆,2005年5月30日至6月1日。会议记录,第一部分,柏林:施普林格出版社(ISBN 3-540-25912-0/pbk)。计算机科学课堂讲稿3496621-626(2005)。 摘要:本文研究大空间或连续空间中的强化学习问题。函数逼近是解决这类问题的主要方法。本文提出使用神经网络作为函数逼近器。然后我们用三种神经网络在山地车任务中进行了实验,并说明了它们之间的比较。结果表明,CMAC和Fuzzy ARTMAP在函数逼近强化学习(RLFA)中的性能优于BP。关于整个系列,请参见[Zbl 1073.68013号]. MSC公司: 68T05型 人工智能中的学习和自适应系统 92B20型 生物研究、人工生命和相关主题中的神经网络 PDF格式BibTeX公司 XML格式引用 \textit{D.Wang}等人,Lect。注释计算。科学。3496、621--626(2005;Zbl 1082.68714) 全文: 内政部