×

ISO学习近似于在无监督的行为范式中解决逆控制问题。 (英语) Zbl 1024.68086号

摘要:在“各向同性序列顺序学习”(本期第831-864页)中,我们介绍了一种新的时间序列学习算法(ISO学习)。在这里,我们将该算法嵌入到一个正式的非评估(无教师)环境中,该环境建立了传感器-电机反馈。该系统最初由固定的反射反应引导,其客观缺点是只有在扰动发生后才能做出反应。ISO学习通过用早期的预期行为代替反射-停止反应来消除这一缺点。在本文中,我们通过分析证明了这个过程可以从控制理论的角度来理解,表明系统学习其自身反射的逆控制器。因此,该系统能够学习一种简单形式的前馈电机控制。

MSC公司:

68T05型 人工智能中的学习和自适应系统
68周05 非数值算法

关键词:

ISO学习
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 内政部:10.1016/0001-6918(86)90039-9·doi:10.1016/0001-6918(86)90039-9
[2] 内政部:10.1162/089976601750541778·Zbl 0984.68151号 ·doi:10.1162/089976601750541778
[3] DOI:10.1016/S0893-6080(98)00029-X·doi:10.1016/S0893-6080(98)00029-X
[4] 内政部:10.1038/81497·数字对象标识代码:10.1038/81497
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。