×

在复杂网络中学习灵活的感觉运动映射。 (英语) Zbl 1266.68163号

小结:鉴于大脑的复杂结构,当联想不断变化时,突触可塑性如何解释联想的学习和遗忘?我们通过研究多层网络中的不同强化学习规则来解决这个问题,以便在视觉运动联想任务中再现猴子的行为。如果突触修饰依赖于突触前和突触后活动,并且如果内在随机性水平较低,我们的模型只能重现猴子的学习性能。这种受欢迎的学习规则基于奖励调节的希伯来突触可塑性,并显示了一个有趣的特征,即在网络中添加层时,即使对于复杂的问题,学习性能也不会显著降低。

MSC公司:

68T05年 人工智能中的学习和自适应系统
92B20型 用于/用于生物研究、人工生命和相关主题的神经网络
92C20美元 神经生物学

软件:

达奇
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Amit D,Fusi S(1994)《材料突触的神经网络学习》。神经计算6:957–82·doi:10.1162/neco.1996.65.957
[2] Asaad WF、Rainer G、Miller EK(1998),联想学习期间灵长类前额叶皮层的神经活动。神经元21:1399–407·doi:10.1016/S0896-6273(00)80658-3
[3] Bak P,Chialvo DR(2001),极端动力学和负反馈的适应性学习。物理版E 63(3):031912·doi:10.1103/PhysRevE.63.031912
[4] Barto AG(1985)自利类神经元计算元素的统计合作学习。人类神经生物学4:229–56
[5] Barto AG(1989)《从趋化性到合作性:神经元学习策略中的抽象练习》。摘自:Durbin R、Miall C、Mitchison G(eds)《计算神经元》。Addison-Wesley,阅读
[6] Barto AG,Jordan MI(1989)分层网络中无反向传播的梯度跟随。收录:IEEE第一届神经网络年会论文集,第2卷,圣地亚哥,第629-36页
[7] Bengio Y,LeCun Y(2007),面向人工智能的缩放学习算法。收录:Bottou L,Chapelle O,DeCoste D,Weston J(eds)大型内核机器。麻省理工学院出版社,剑桥
[8] Bethge A,Kuhn R,Horner H(1994)在第一层进行固定预处理的两层感知器的存储容量。《物理与数学杂志》第27期:1929–937·doi:10.1088/0305-4470/27/6/018
[9] Calabretta R,Parisi D(2005)《进化连接主义与大脑/大脑模块化》。In:模块化。了解复杂自然系统的发展和演化。麻省理工学院出版社,剑桥,第309-30页
[10] Calabretta R,Nolfi S,Parisi D,Wagner GP(1998)模块化进化的案例研究:走向进化生物学、人工生命、神经和认知科学之间的桥梁。摘自:第六届人工生命国际会议论文集。麻省理工学院出版社,剑桥,275-84
[11] Chialvo DR,Bak P(1999),从错误中学习。神经科学90(4):1137–148·doi:10.1016/S0306-4522(98)00472-2
[12] 大研P(1990)钢筋比较。收录:Touretzky DS、Elman JL、Sejnowski TJ、Hinton GE(编辑)1990年康涅狄格州模型暑期学校会议记录。Morgan Kaufmann,圣马特奥,第45-1页
[13] Dayan P,Willshaw DJ(1991)优化线性联想记忆中的突触学习规则。生物网络65:253–65·兹比尔0752.92002 ·doi:10.1007/BF000206223
[14] Fahlman SE,Lebiere C(1991)级联相关学习体系结构。收录:Touretzky DS(eds)神经信息处理系统进展,第2卷。圣马特奥摩根·考夫曼
[15] Fiete IR,Seung HS(2006)通过电导的动态扰动在尖峰神经网络中进行梯度学习。物理评论稿97(4):048104·doi:10.1103/PhysRevLett.97.048104
[16] Fusi S,Senn W(2006)通过智能随机选择突触更新来避免遗忘。混沌,第16卷,026112,第1–1页·Zbl 1152.92306号
[17] Fusi S,Drew PJ,Abbott LF(2005),突触存储记忆的级联模型。神经元45:599–11·doi:10.1016/j.neuron.2005.02.001
[18] Fusi S、Asaad WF、Miller EK、Wang X-J(2007)《柔性传感器-运动映射的神经电路模型:多时间尺度上的学习和遗忘》。神经元54:319–33·doi:10.1016/j.neuron.2007.03.017
[19] Hinton GE,Salakhutdinov RR(2006)《利用神经网络降低数据维数》。科学313(5786):504–07·Zbl 1226.68083号 ·doi:10.1126/science.1127647
[20] Hopfield JJ(1984)具有分级响应的神经元具有与二态神经元类似的集体计算特性。国家科学院院刊81:3088–092·Zbl 1371.92015年 ·doi:10.1073/pnas.81.10.3088
[21] LeCun Y,Bottou L,Bengio Y,Haffner P(2001)基于梯度的学习应用于文档识别。In:智能信号处理,第306–51页
[22] Mazzoni P,Andersen RA,Jordan MI(1991)神经网络的一个更具生物学合理性的学习规则。美国国家科学院院刊88:4433–43·doi:10.1073/pnas.88.10.4433
[23] Narendra K,Thathacher M(1989)《学习自动机:导论》。普伦蒂斯·霍尔,恩格尔伍德悬崖
[24] Senn W,Fusi S(2005a)具有二元突触的感知机中随机学习的收敛性。物理版E 71(6):061907·Zbl 1076.92016号 ·doi:10.1103/PhysRevE.71.061907
[25] Senn W,Fusi S(2005b)《只在必要时学习:对有界突触网络中相关模式的更好记忆》。神经计算17:2106–138·Zbl 1076.92016号 ·doi:10.1162/0899766054615644
[26] Soltani A,Lee D,Wang X-J(2006a)基于生物物理的匹配律行为神经模型:随机突触的改善。神经科学杂志26:3731-744·doi:10.1523/JNEUROSCI.5159-05.2006
[27] Soltani A,Lee D,Wang X-J(2006b)竞争博弈中随机行为的神经机制。神经网络19(8):1075–090·Zbl 1103.68819号 ·doi:10.1016/j.neunet.2006.05.044
[28] Sontag ED(1992)使用两层隐藏网络进行反馈稳定。IEEE Trans神经网络3:981–90·doi:10.1109/72.165599
[29] Sutton RS,Barto AG(1998)《强化学习:导论》。麻省理工学院出版社,剑桥
[30] Wang X-J(2002)皮层电路中缓慢混响的概率决策。神经元36:955–68·doi:10.1016/S0896-6273(02)01092-9
[31] Wang X-J(2005)前额叶功能的微电路模型:认知中反射神经动力学的阴阳。收录:Risberg J、Grafman J、Boller F(编辑)《前额叶:发育、功能和病理》。剑桥大学出版社,伦敦
[32] Werfel J,Xie X,Seung SH(2005)线性前馈网络中随机梯度下降的学习曲线。神经计算17:2699–718·Zbl 1087.68625号 ·doi:10.1162/089976605774320539
[33] Williams RJ(1992)连接强化学习的简单统计梯度允许算法。马赫学习8:229–56·Zbl 0772.68076号
[34] Willshaw DJ,Dayan P(1990),矩阵记忆的最佳可塑性:上升的必然下降。神经计算机2:85–3·doi:10.1162/neco.1990.2.1.85
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。