缩小人工智能规划和强化学习之间的差距(PRL@IJCAI 2023)——IJCAI 2023研讨会
<链接到系列中的其他研讨会
IJCAI’23研讨会
澳门特别行政区
2023年8月20日(全天)
房间:阿拉木图6003
地铁列车时刻表
开始时间(澳门当地时间) |
标题 |
9:00 |
开幕词 |
|
第1部分 |
9:10 |
用逻辑神经网络学习神经符号世界模型 |
9:30 |
通过Deep RL学习计划树搜索 |
9:50 |
学习用于规划注释RL的参数化策略 |
10:10 |
动态失配迁移学习的可学习相似性度量 |
10:30 |
-咖啡休息时间- |
11:00 |
受邀演讲:Siddharth Srivastava 概括规划、学习和强化学习的学习抽象。 |
|
第2部分 |
11:50 |
学习为不确定性下的运动规划创建抽象层次 |
12:10 |
学会跟随:具有去中心化重新规划的终身多代理寻路 |
12:30 |
-午餐- |
14:00 |
受邀演讲:Akhil Bagaria 探索和规划的技能发现 |
|
第3部分 |
14:50 |
基于翻译不变目标的强化学习任务中的学习状态可达性图 |
15:10 |
可变感兴趣量域上零击转移神经策略的对象中心学习 |
15:30 |
-咖啡休息时间- |
|
第4次会议 |
16:00 |
将反向强化学习用于装配任务 |
16:20 |
结束语(和海报设置) |
16:30 |
海报环节 |
17:30 |
–结束– |
受邀会谈
悉达赫·斯里瓦斯塔瓦
概括规划、学习和强化学习的学习摘要
我们能否建立自主的代理来学习可归纳的知识并使用它可靠地完成以前看不到的任务?在这次演讲中,我将介绍我们在神经符号学习方面的最新进展,以解决一系列具有长期视野和稀疏回报的顺序决策问题。利用我们最近的工作成果,我将讨论学习和使用抽象如何不仅减少对人工输入的需要,而且有助于确保正确性,并将所学知识的泛化扩展到培训期间未发现的问题。在整个演讲中,我将用各种顺序决策设置的结果来说明研究进展,包括不确定性下的长期规划、强化学习和机器人规划。
悉达赫·斯里瓦斯塔瓦是亚利桑那州立大学计算与增强智能学院的计算机科学副教授。他在马萨诸塞大学阿默斯特分校获得了计算机科学博士学位,并在加州大学伯克利分校进行了博士后研究。他的研究重点是安全可靠的可任务AI系统、AI评估和AI安全。他获得了国家科学基金会职业奖、国际自动规划与调度会议(ICAPS)最佳论文奖、麻省大学阿默斯特校区杰出论文奖和坎普尔理工学院最佳毕业论文奖。他曾担任2019年ICAPS的会议主持人,目前担任《人工智能研究杂志》的副主编。
Akhil Bagaria公司
探索和规划的技能发现。
为了创建一般功能强大的智能机器,我们必须让我们的代理具有自主获取自己抽象的能力。我的研究使用强化学习和计划中的工具解决了这个问题。在本次演讲中,我将讨论代理发现时间扩展的抽象动作(或选项)的方法。接下来,我将讨论所发现的选项如何产生一种状态抽象形式,可以用于规划。最后,我将讨论如何将抽象状态和行为的发现交织在一个永无止境的循环中,以创建不断提高其在世界上的竞争力的代理。
Akhil Bagaria公司是布朗大学(Brown University)的博士生,与乔治·科尼达利斯(George Konidaris)一起研究RL。在此之前,他曾在苹果(Apple)的多点触控团队工作,开发了在Macbook和iPad上发布的手势识别算法。他在南加州哈维·穆德学院(Harvey Mudd College)读本科,在那里他的研究包括使用自主水下机器人追踪鲨鱼。
已接受论文列表
研讨会的目的和范围
而人工智能规划和强化学习社区关注的是类似的顺序决策问题,这些社区仍有点不了解在具体问题、技术、方法和评估方面相互交流。
本研讨会旨在鼓励人工智能规划和强化学习领域的研究人员进行讨论和合作。我们的目标是弥合两个社区之间的差距,促进对现有技术的差异和相似性的讨论,并鼓励跨领域的合作。我们恳请在规划和强化学习的交叉点,尤其是那些专注于智能决策的学习。这是第六版PRL车间系列开始于ICAPS 2020.
感兴趣的话题
我们邀请提交人工智能规划和强化学习的交叉点。感兴趣的主题包括但不限于以下内容
- 强化学习(基于模型、贝叶斯、深层、分层等)
- 安全RL
- 蒙特卡洛规划
- 用于规划的模型表示和学习
- 使用近似/不确定(学习)模型进行规划
- 用于规划师指导的学习搜索启发式
- 计划和强化学习的理论方面
- 行动政策分析或认证
- 强化学习和计划竞赛
- 多智能体规划和学习
- 强化学习和规划的应用
重要日期
- 论文提交截止日期:
AOE 5月4日 AOE 5月11日 AOE,5月18日
- 纸质验收通知:
6月5日,AOE 6月9日,AOE
提交详细信息
我们征集与上述呼吁相关的研讨会论文,包括以下类型:
- 长篇论文–最多8页+无限参考/附录
- 短篇论文–最多4页+无限参考/附录
- 扩展摘要–最多2页+无限参考/附录
请以AAAI格式提交(请参阅作者工具包). 提交被其他会议拒绝的论文的作者,请确保尽最大努力解决审稿人的评论。请不要向研讨会提交IJCAI主要会议已经接受的论文。
NeurIPS重新提交说明:对于重新向PRL提交NeurIPS提交的作者,请确保他们匿名的。对于这些重新提交的文件,无需重新格式化为AAAI。作者可以保留NeurIPS格式因为我们将允许NeurIPS格式的论文为九页。
一些已被接受的长篇论文将被邀请参加有贡献的会谈。所有被接受的论文(长论文和短论文)和扩展摘要都将在海报上留出一个位置演示会话。扩展摘要是对已经发表的论文、前期工作、立场论文或挑战的简要总结可能有助于缩小差距。
由于本次研讨会的主要目的是吸引讨论,作者请使用他们提交的附录。
应通过以下方式提交论文开放式评审.
组织委员会
- Cameron Allen,美国罗得岛州布朗大学
- Timo P.Gros,德国萨尔大学
- Michael Katz,美国纽约州IBM T.J.Watson研究中心
- Harsha Kokel,德克萨斯大学达拉斯分校,美国德克萨斯州
- Hector Palacios,ServiceNow Research,加拿大蒙特利尔
- Sarath Sreedharan,科罗拉多州立大学,科罗拉多州,美国
请将您的查询发送至prl.theworkshop@gmail.com