×

各向同性序列顺序学习。 (英语) Zbl 1022.68111号

摘要:我们提出了一种用于时间序列学习的各向同性无监督算法。没有使用特殊的奖励信号,因此所有输入都是完全各向同性的。所有输入信号在汇聚到线性输出神经元之前都经过带通滤波。所有突触权重都根据带通滤波输入与输出导数的相关性而变化。我们在开环和闭环条件下研究算法,后者通过将学习系统嵌入行为反馈回路来定义。在开环条件下,我们发现该算法的线性结构允许解析计算权重变化的形状,这是严格的异突触,并且遵循尖峰时间相关塑性中发现的权重变化曲线的形状。此外,我们还表明,当输入之间不再存在时间差异而无需额外的标准化措施时,突触权重会自动稳定。在本研究的第二部分中,算法被放置在一个导致传感器电机闭环的环境中。为此,机器人被编程为具有预连线收缩反射反应,以响应碰撞。通过各向同性序列顺序(ISO)学习,机器人通过学习其早期测距信号与随后发生的碰撞信号之间的相关性来实现避碰。正如理论预测的那样,突触权重在学习结束时趋于稳定。最后,我们讨论了ISO学习与其他驱动强化模型以及常用的时差学习算法的关系。本研究之后,对本期配套文章《ISO学习近似无监督行为范式中逆控制器问题的解决方案》(第865-884页)中的闭环情况进行了数学分析;请参阅下面的评论)。

MSC公司:

68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] DOI:10.1093/cercor/6.3.406·doi:10.1093/cercor/6.3.406
[2] 文件编号:10.1038/81453·数字对象标识代码:10.1038/81453
[3] Bi G.-q.,《神经科学杂志》。18(24)pp 10464–(1998)
[4] DOI:10.1016/S1364-6613(00)01851-9·doi:10.1016/S1364-6613(00)01851-9
[5] 内政部:10.1038/81504·数字对象标识代码:10.1038/81504
[6] 大研P.,马赫。学习。14(3)第295页–(1994)
[7] Doya K.,神经网络12(1),第219页–(2000)
[8] 数字对象标识码:10.1126/science.1070521·doi:10.1126/science.1070521
[9] 内政部:10.1038/383076a0·数字对象标识代码:10.1038/383076a0
[10] DOI:10.1073/pnas.94.24.12740·doi:10.1073/pnas.94.24.12740
[11] 数字对象标识码:10.1121/1.413512·doi:10.1121/1.413512
[12] DOI:10.1162/jocn.1996.8.3.257·doi:10.1162/jocn.1996.8.3.257
[13] DOI:10.1016/0893-6080(89)90026-9·doi:10.1016/0893-6080(89)90026-9
[14] 郭奎B.,J.Neurosci。18(24)pp 10464–(1998)
[15] 内政部:10.1162/089976601750541778·Zbl 0984.68151号 ·doi:10.1162/089976601750541778
[16] Hauber W.,J.神经科学。20(16)第6282页–(2001)
[17] DOI:10.1101/SQB.1983.048.01.085·doi:10.1101/SQB.1983.048.01.085
[18] 内政部:10.1162/0899766000300015844·doi:10.1162/089976600300015844
[19] Klopf A.H.,《心理生物学》。16(2)第85页–(1988)
[20] 内政部:10.1126/science.275.5297.213·doi:10.1126/science.275.5297.213
[21] DOI:10.1007/BF00275687·Zbl 0488.92012号 ·doi:10.1007/BF00275687
[22] 内政部:10.1162/089976601750541787·兹比尔0982.92006 ·doi:10.1162/089976601750541787
[23] DOI:10.1023/A:1008910918445·Zbl 0955.92009号 ·doi:10.1023/A:1008910918445
[24] 内政部:10.1126/science.275.5306.1593·数字对象标识代码:10.1126/science.275.5306.1593
[25] 内政部:10.1162/089976601300014376·Zbl 1003.92010年 ·doi:10.1162/089976601300014376
[26] DOI:10.1016/S0896-6273(01)00451-2·doi:10.1016/S0896-6273(01)00451-2
[27] 内政部:10.1038/78829·doi:10.1038/78829
[28] Sutton R.,机器学习3(1),第9页–(1988)
[29] 数字对象标识码:10.1037/0033-295X.88.2.135·doi:10.1037/0033-295X.88.2.135
[30] 萨顿·R·贝哈夫。大脑。第4(3)号决议,第221页–(1988年)
[31] DOI:10.1016/S0893-6080(98)00029-X·doi:10.1016/S0893-6080(98)00029-X
[32] Widrow G.,IRE WESCON会议记录4第96页–(1960)
[33] 内政部:10.1038/81497·数字对象标识代码:10.1038/81497
[34] 内政部:10.1038/25665·doi:10.1038/25665
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。