×

从未对齐的平行数据中学习基于感知的词义。 (英语) Zbl 1319.68196号

摘要:为了让机器人有效地理解自然语言命令,他们必须能够获得可以映射到外部世界感知特征的意思表示。以前的学习方法接地的意义表示需要在训练时进行详细的注释。在本文中,我们提出了一种扎根语言习得的方法,该方法能够共同学习遵循自然语言命令的策略,例如“拿起轮胎托盘”,以及语言中特定短语与外部世界方面之间的映射;例如,单词“轮胎托盘”和环境中特定对象之间的映射。我们的方法假设策略为参数形式,机器人使用该策略来选择动作,以响应基于语言结构的自然语言命令。我们使用梯度法优化模型参数。我们的评估证明了该模型对未经培训的用户向机器人叉车发出的命令集的有效性。

MSC公司:

68T05年 人工智能中的学习和自适应系统
68T40型 机器人人工智能
68T50型 自然语言处理

软件:

毛坯
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Branavan,S.R.K。;陈,H。;Zettlemoyer,L.S。;Barzilay,R.,《将指令映射到行动的强化学习》,82-90(2009)
[2] Chen,D.L。;Mooney,R.J.,《从观察中学习解释自然语言导航指令》(2011年)
[3] Chernova,S.和Veloso,M.(2009年)。通过基于信任的自治进行交互式政策学习。《人工智能研究杂志》,34(1),1-25·Zbl 1182.68161号
[4] 克拉克,J。;Goldwasser,D。;Chang,M。;Roth,D.,《从世界反应中推动语义分析》,18-27(2010),纽约
[5] 马内夫,M。;麦卡特尼,B。;Manning,C.,从短语结构解析生成类型依赖解析,意大利热那亚
[6] Dzifcak,J。;Scheutz,M。;Baral,C。;Schermerhorn,P.,《做什么和如何做:将自然语言指令转换为用于目标管理和动作执行的时间和动态逻辑表示》,4163-4168(2009)
[7] Ekvall,S.和Kragic,D.(2008)。机器人从演示中学习:一种任务级规划方法。国际先进机器人系统杂志,5(3)。
[8] Xiao,K.、Tellex,S.、Vosoughi,S.,Kubat,R.和Roy,D.(2008)。用于响应机器人中的基础语言的对象模式。连接科学,20(4),253-276·doi:10.1080/09540090802445113
[9] Jackendoff,R.S.(1983年)。语义和认知(第161-187页)。剑桥:麻省理工学院出版社。
[10] 科勒,T。;Tellex,S.公司。;罗伊·D·。;Roy,N.,《走向理解自然语言方向》,259-266(2010)
[11] Kruger,V.、Kragic,D.、Ude,A.和Geib,C.(2007年)。行动的意义:行动识别和映射综述。高级机器人,21(13)。
[12] Kwiatkowski,T。;Zettlemoyer,L。;Goldwater,S。;Steedman,M.,用高阶统一从逻辑形式导出概率ccg文法,1223-1233(2010),纽约
[13] 梁,P。;M.I.乔丹。;Klein,D.,《基于依赖的组合语义学习》(2011)
[14] 麦克马洪,M。;Stankiewicz,B。;Kuipers,B.,《言行一致:在路线指示中连接语言、知识和行动》,1475-1482(2006)
[15] Matuszek,C。;福克斯,D。;Koscher,K.,《使用统计机器翻译遵循指示》,251-258(2010)
[16] Matuszek,C.、FitzGerald,N.、Zettlemoyer,L.、Bo,L.和Fox,D.(2012a)。扎根属性学习的语言和感知联合模型。arXiv:1206.6423。
[17] Matuszek,C。;赫伯斯特,E。;Zettlemoyer,L。;Fox,D.,《学习解析机器人控制系统的自然语言命令》(2012年)
[18] 马夫里迪斯,N。;Roy,D.,《机器人的接地情境模型:单词和感知的交汇处》,4690-4697(2006),纽约
[19] McCallum,A.K.(2002)。MALLET:语言工具包的机器学习。http://mallet.cs.umass.edu。
[20] Piantadosi,S。;古德曼,N。;埃利斯,B。;Tenenbaum,J.,合成语义获取的贝叶斯模型(2008)
[21] 潘,H。;Domingos,P.,《非监督语义分析》,第1期,第1-10页(2009年),纽约
[22] Rybski,P。;Yoon,K。;J·斯托拉尔兹。;Veloso,M.,《通过对话和演示进行交互式机器人任务训练》,56(2007),纽约
[23] Schaal,S.、Ijspeert,A.和Billard,A.(2003)。通过模仿学习运动技能的计算方法。伦敦皇家学会哲学学报。B辑,生物科学,358。
[24] Skubic,M.、Perzanowski,D.、Blisard,S.、Schultz,A.、Adams,W.、Bugajska,M.和Brock,D.(2004)。人机对话的空间语言。IEEE系统、人与控制论汇刊。C部分,应用和审查,34(2),154-167·doi:10.1109/TSMCC.2004.826273
[25] Tellex,S.公司。;科勒,T。;Dickerson,S。;Walter,M。;Banerjee,A。;Teller,S。;Roy,N.,《理解机器人导航和移动操作的自然语言命令》(2011年)
[26] Tellex,S.公司。;Thaker,P。;Deits,R。;科勒,T。;Roy,N.,《走向信息理论人机对话》,澳大利亚悉尼,2012年7月
[27] Thompson,C.A.和Mooney,R.J.(2003)。获取自然语言界面的词汇映射。《人工智能研究杂志》,18,1-44·Zbl 1045.68139号
[28] 沃格尔,A。;Jurafsky,D.,《学习遵循导航指南》,806-814(2010)
[29] Winograd,T.(1971)。在计算机程序中作为数据表示的过程,用于理解自然语言。麻省理工学院博士论文。
[30] Wong,Y。;Mooney,R.,《使用lambda演算学习语义解析的同步语法》,第45期,第960页(2007年)
[31] Zettlemoyer,L.S。;Collins,M.,《学习将句子映射到逻辑形式:概率范畴语法的结构化分类》,658-666(2005)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。