×

生成动态运动原语的深层神经网络训练。 (英语) Zbl 1468.68187号

摘要:动态动作原语(DMP)已被证明是运动技能学习的有效动作表征。本文提出了一种新的深度神经网络训练方法,用于合成动态运动原语。我们的方法的区别在于,它可以利用一个新的损失函数来测量运动轨迹之间的物理距离,而不是测量没有物理意义的DMP参数之间的距离。这是通过推导可用于计算拟议损失函数梯度的微分方程实现的,从而使反向传播的有效应用能够优化底层深层神经网络的参数。虽然所开发的方法适用于任何神经网络结构,基于编码器-解码器网络和卷积神经网络的两种不同结构对其进行了评估。我们的结果表明,与使用更传统的损失函数相比,所提出的损失函数的最小化可以获得更好的结果。

MSC公司:

68T07型 人工神经网络与深度学习
68T40型 机器人人工智能
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Badrinarayan,V。;肯德尔,A。;Cipolla,R.,SegNet:用于图像分割的深度卷积编码器-解码器架构,IEEE模式分析和机器智能汇刊,39,12,2481-2495(2017)
[2] 陈,N。;拜耳,J。;南部城市。;van der Smagt,P.,通过在深度自动编码器中嵌入动态运动原语实现高效运动表示,(2015 IEEE-RAS第15届类人机器人国际会议(Humanoids)(2015)),434-440
[3] 陈,N。;卡尔·M。;van der Smagt,P.,时间相关变分自动编码器潜在空间中的动态运动原语,(2016年IEEE-RAS第16届类人机器人国际会议(Humanoids)(2016)),629-636
[4] 洛杉矶Gatys。;埃克,A.S。;Bethge,M.,使用卷积神经网络的图像风格转移,(IEEE计算机视觉和模式识别会议(2016),IEEE:IEEE拉斯维加斯,内华达州),2414-2423
[5] 加斯帕,T。;Nemec,B。;Morimoto,J。;Ude,A.,弧长动态运动原语的技能学习和动作识别,机器人和自治系统,100225-235(2018)
[6] 古德费罗,I。;Pouget-Abadie,J。;米尔扎,M。;徐,B。;Warde-Farley,D。;Ozair,S.,《生成性对抗网络》,(神经信息处理系统进展(2014)),2672-2680
[7] 古达尔,V。;Buonamano,D.V.,《将感觉和运动模式编码为递归神经网络中的时不变轨迹》,《电子生活》,第7期,第31134页(2018年)
[8] 辛顿,G.E。;Salakhutdinov,R.R.,《用神经网络降低数据的维数》,《科学》,3135786504-507(2006)·Zbl 1226.68083号
[9] Hochreiter,S。;Schmidhuber,J.,《长短期记忆,神经计算》,第9、8、1735-1780页(1997年)
[10] 霍尼克,K。;Stinchcombe,M。;White,H.,多层前馈网络是通用逼近器,神经网络,2,5,359-366(1989)·Zbl 1383.92015年
[11] 艾斯佩特,A.J。;Nakanishi,J。;霍夫曼,H。;Pastor,P。;Schaal,S.,《动态运动原语:运动行为的学习吸引子模型》,神经计算,25,2,328-373(2013)·Zbl 1269.92002号
[12] Kim,W。;Lee,C。;Kim,H.J.,通过从演示中进行分层深度强化学习来学习和概括动态运动原语,(2018 IEEE/RSJ智能机器人和系统国际会议(2018)),3117-3123
[13] Kingma,D.P.和Ba,J.(2015)。亚当:一种随机优化方法。在圣地亚哥举行的第三届国际学习代表大会上。
[14] 科伯,J。;Peters,J.,《模拟和强化学习》,IEEE Robotics&Automation Magazine,17,2,55-62(2010)
[15] Krizhevsky,A。;Sutskever,I。;Hinton,G.E.,用深度卷积神经网络进行Imagenet分类,(神经信息处理系统进展(2012)),1097-1105
[16] LeCun,Y。;Y.本吉奥。;Hinton,G.,《深度学习》,《自然》,521,7553,436-444(2015)
[17] LeCun,Y。;博图,L。;Y.本吉奥。;Haffner,P.,《基于梯度的学习应用于文档识别》,IEEE会议记录,86,11,2278-2324(1998)
[18] LeCun,Y。;科尔特斯,C。;Burges,C.,MNIST手写数字数据库(2019年),http://yann.lecun.com/exdb/mnist/(2019年9月18日访问)
[19] 莱文,S。;芬恩,C。;Darrell,T。;Abbeel,P.,深度视觉运动策略的端到端训练,机器学习研究杂志(JMLR),17,1334-1373(2016)·Zbl 1360.68687号
[20] Pahić,R.、Gams,A.、Ude,A.和Morimoto,J.(2018年)。深度编码器-解码器网络,用于将原始图像映射到动态运动原语。在澳大利亚布里斯班举行的IEEE机器人和自动化国际会议上(第5863-5868页)。
[21] Paszke,A。;毛重,S。;钦塔拉,S。;Chanan,G。;杨,E。;德维托,Z。;林,Z。;Desmaison,A。;安蒂加。;Lerer,A.,《PyTorch中的自动区分》(NIPS 2017 autodiff研讨会:基于梯度的机器学习软件和技术的未来(2017))
[22] A.佩尔韦斯。;Mao,Y。;Lee,D.,《使用卷积神经网络学习深层运动原语》(2017年IEEE-RAS第17届类人机器人(Humanoids)国际会议(2017年)),191-197年
[23] 皮尔森,H.A。;Gashler,M.S.,《机器人深度学习:最新研究综述》,《高级机器人学》,31,16,821-835(2017)
[24] Rumelhart,D.E。;辛顿,G.E。;Williams,R.J.,《通过反向传播错误学习表征》,《自然》,3236088533-536(1986)·Zbl 1369.68284号
[25] Sakoe,H。;Chiba,S.,语音识别的动态编程算法优化,IEEE声学、语音和信号处理汇刊,26,1,43-49(1978)·兹伯利0371.68035
[26] 沙尔,S。;Mohajerian,P。;Ijspeert,A.J.,《动力学系统与最优控制——统一观点》,(计算神经科学:大脑功能的理论见解(2007),爱思唯尔出版社),425-445
[27] Stasse,O.、Flayols,T.、Budhiraja,R.、Giraud-Esclasse,K.、Carpentier,J.和Mirabel,J.等人(2017年)。TALOS:面向工业应用的新型人形研究平台。在英国伯明翰IEEE-RAS第17届类人机器人(Humanoids)国际会议上(第689-695页)。
[28] Sünderhauf,N。;O.布鲁克。;谢尔,W。;哈德塞尔,R。;福克斯博士。;Leitner,J.,《机器人深度学习的局限性和潜力》,《国际机器人研究杂志》,37,4-5,405-420(2018)
[29] 乌德,A。;Gams,A。;Asfour,T。;Morimoto,J.,离散和周期动态运动基元的任务特定泛化,IEEE机器人汇刊,26,5800-815(2010)
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。