{“状态”:“确定”,“消息类型”:“工作”,“信息版本”:“1.0.0”,“邮件”:{“索引”:{-“日期-部分”:[[2024,6,21]],“日期-时间”:“2024-06-21T23:29:48Z”,“时间戳”:1719012588303},“引用-计数”:0,“发布者”:“人工智能发展协会(AAAI)”,“问题”:“18”,“内容域”:{“域”:[],“交叉标记限制”:false},“short container-title”:[“AAAI”],“抽象”:“手势、面部表情和发声等反应是人类在互动过程中提供的丰富、自然发生的信息渠道。\nAgent可以利用对这种隐含的人类反馈的理解来提高其任务性能,而不需要人类付出任何代价。这种方法与基于演示、评论或其他需要注意和有意提供的指导的常见代理教学方法形成了对比。\在这项工作中,我们展示了一种新的数据驱动框架,用于从人类内隐反馈中学习,即“同情”。这种两阶段的方法包括:(1)将隐含的人类反馈映射到相关的任务统计数据,如奖励、最优性和优势;\nand(2)使用这样的映射来学习任务。\我们实例化所学映射的第一阶段和三个第二阶段评估。为了做到这一点,我们收集了一个人类面部反应的数据集,同时参与者观察到代理对指定的训练任务执行次优策略。\我们根据这些数据训练了一个深度神经网络,并证明了它的能力:(1)根据预先记录的人类面部反应推断训练任务中事件的相对奖励等级;(2) 利用活人面部反应改进agent在训练任务中的策略;(3)转移到一个新的领域,在该领域中评估机器人操作轨迹。在视频中,我们重点演示了EMPATHIC实例化的在线学习能力<\/jats:p>“,”DOI“:”10.1609\/aaai.v35i18.17998“,”type“:”journal-article“,”created“:{”date-parts“:[[2022,9,8]],”date-time“:”2022-09-08T20:41:32Z“,”timestamp“:1662669692000},”page“:“16017-16019”,“source”:“Crossref”,“is-referenced-by-count”:9,“title”:[“从人类内隐反馈中学习任务的EMPATHIC框架演示”],“前缀“:”10.1609“,“卷”:“35”,“作者”:[{“给定”:“于晨”,“家族”:“崔”,“序列”:“第一”,“从属关系”:[]},{“给出”:“奇平”,“家庭”:“张”,“顺序”:“附加”,“隶属关系”:[]}“sequence”:“additional”,“affiliation”:[]},{“given”:Peter“,”family“:”Stone“,”sequence“:”additional“,”affiliation“:[]},”{“given”:“Scott”,“family”:“Niekum”,“sequence”:“additional”,“affiliance”:[]{,”given“:”W.Bradley“,”家庭“:”Knox“,”序列“:”additional“”,“abfiliation”:[]},“member”:“9382”,“published-on-line”:{“date-parts”:[2021,5,18]]}“container-title”:[”AAAI人工智能会议记录“],“original-title”:[],“link”:[{“URL”:“https:\/\/ojs.AAAI.org\/index.php\/AAAI\/aarticle\/download\/17998\/17803”,“content-type”:“application\/pdf”,“content-version”:“vor”,“intended-application”:“text-mining”},{“URL”:“https:\/\/ojs.aaai.org\/index.php\/aaai\/article\/download\/17998\/17803“,”content-type“:”unspecified“,”content-version“:”vor“,”intended-application“:”similarity-checking“}],”deposed“:{”date-parts“:[2022,9,8]],”date-time“:“2022-09-08T20:41:33Z”,”timestamp“:1662669693000},”score“:1,”resource“:”{“primary”:{“URL”:“”https:\/\/ojs.aaai.org\/index.php\/aaai\/article\/view\/17998“}},”副标题“:[],”短标题“:[],”已发布“:{”日期部分“:[[2021,5,18]]},“引用计数”:0,”日志发布“:}”问题“:“18”,”发布在线“:{”日期部分609 \/aaai.v35i18.17998“,”关系“:{},”ISSN“:[”2374-3468“,”2159-5399“],”issn-type“:[{”value“:“2374-3468”,“type”:“electronic”},{”value“:“2159-5399”,“type”:“print”}],“subject”:[],“published”:{”date-parts“:[2021,5,18]]}}}