第条

纯粹的声明性动作表示被高估了：带模拟器的经典规划

作者:

吉列姆弗朗西斯,

米克尔拉米雷斯,

Nir公司利波维茨基、和

赫克托杰夫那作者信息和声明

IJCAI’17：第26届国际人工智能联合会议记录

2017年8月

页4294-4301

出版:2017年8月19日出版历史

发布者网站

摘要

经典规划涉及的问题是，需要通过采取具有确定性、已知效果的行动，从已知的初始状态达到目标。然而，经典规划师只处理可以用STRIPS或PDDL等声明性规划语言表示的经典问题。这就防止了它们在不容易进行声明性建模或其动力学通过仿真给出的问题上的使用。模拟器不提供动作的声明性表示，而只是返回后续状态。我们在本文中要解决的问题是：一个仅能访问状态和目标结构的规划者，能否接近那些也能访问PDDL中表示的动作结构的规划者的性能。为了回答这个问题，我们开发了完全忽略动作结构的域相关黑盒规划算法，并表明它们与最先进的经典规划师在标准规划基准上的表现相匹配。有效的黑盒算法为建模和表达控制知识开辟了新的可能性，我们也对此进行了说明。

工具书类

[1]

马克·贝勒马尔（Marc Bellemare）、雅瓦·纳达夫（Yavar Naddaf）、乔尔·维内斯（Joel Veness）和迈克尔·鲍林（Michael Bowling）。街机学习环境：通用代理的评估平台。JAIR公司, 47:253-279, 2013.

[2]

Blai Bonet和Hector Geffner。GPT：具有不确定性和部分信息的规划工具。在程序。IJCAI不确定性和部分信息规划研讨会, 2001.

[3]

Blai Bonet和Hector Geffner。规划是启发式搜索。人工智能, 129(1- 2):5-33, 2001.

数字图书馆

[4]

汤姆·拜兰德。STRIPS规划的计算复杂性。人工智能, 69:165-204, 1994.

数字图书馆

[5]

Stefan Edelkamp和Peter Kissmann。具有行动成本和偏好的最优符号规划。在程序。国际JCAI，第1690-1695页，2009年。

数字图书馆

[6]

吉伦·弗兰克斯和赫克托·杰夫纳。规划中的建模和计算：更具表现力的语言具有更好的启发式。在程序。ICAPS公司，第70-78页，2015年。

数字图书馆

[7]

赫克托·杰夫纳和布莱·博内。自动化规划模型和方法的简要介绍摩根&克莱普尔出版社，2013年。

数字图书馆

[8]

托马斯·杰夫纳和赫克托尔·杰夫纳。一般视频游戏的基于宽度的规划。在程序。AIIDE公司，第23-29页，2015年。

[9]

赫克托·杰夫纳。功能STRIPS。编辑J.Minker，基于逻辑的人工智能，第187-205页。Kluwer，2000年。

数字图书馆

[10]

马尔特·赫尔默特。快速向下规划系统。JAIR公司, 26:191-246, 2006.

[11]

Joerg Hoffmann和Bernhard Nebel。FF计划系统：通过启发式搜索快速生成计划。JAIR公司, 14:253-302, 2001.

[12]

Joerg Hoffmann、Julie Porteous和Laura Sebastia。规划中的有序地标。JAIR公司, 22:215-278, 2004.

数字图书馆

[13]

弗兰克·伊万科维奇和帕特里克·哈斯鲁姆。带公理的最优规划。在程序。国际JCAI，第1580-1586页，2015年。

数字图书馆

[14]

Yuu Jinnai和Alex Fukunaga。学习修剪在线黑盒计划中占主导地位的动作序列。在程序。AAAI公司，第839-845页，2017年。

[15]

马修·约翰逊（Matthew Johnson）、卡蒂娅·霍夫曼（Katja Hofmann）、蒂姆·赫顿（Tim Hutton）和大卫·比格内尔（David Bignell）。人工智能实验的Malmo平台。在程序。国际JCAI，第4246-4247页，2016年。

数字图书馆

[16]

迈克尔·卡茨和乔格·霍夫曼。水星计划者：突破部分删除松弛的极限。在程序。第八届国际规划竞赛, 2014.

[17]

亨利·考茨和巴特·塞尔曼。突破极限：规划、命题逻辑和随机搜索。在程序。AAAI公司第1194-1201页，1996年。

数字图书馆

[18]

尼尔·利波维茨基和赫克托·杰夫纳。经典规划问题的宽度和系列化。在程序。ECAI公司，第540-545页，2012年。

数字图书馆

[19]

尼尔·利波维茨基和赫克托·杰夫纳。最佳第一宽度搜索：经典规划中的探索和开发。在程序。AAAI公司, 2017.

[20]

尼尔·利波维茨基（Nir Lipovetzky）、米奎尔·拉米雷斯（Miquel Ramirez）和赫克托·杰夫纳（Hector Geffner）。带模拟器的经典规划：atari视频游戏的结果。在程序。国际JCAI，第1610-1616页，2015年。

数字图书馆

[21]

尼尔·利波维茨基。古典规划中的结构与推理AI Access，2014年。

[22]

德鲁·麦克德莫特。使用回归匹配图控制规划中的搜索。人工智能, 109(1-2):111-159, 1999.

数字图书馆

[23]

德鲁·麦克德莫特。1998年AI规划系统竞赛。人工智能杂志, 21(2):35-56, 2000.

[24]

阿伦·纽厄尔和赫伯特·西蒙。GPS：模拟人类思维的程序。在计算机与思维，第279-293页。麦格劳·希尔，1963年。

数字图书馆

[25]

尼尔斯·尼尔森和理查德·菲克斯。STRIPS：一种将定理证明应用于问题解决的新方法。人工智能, 1:27- 120, 1971.

[26]

尼尔斯·尼尔森。人工智能原理蒂奥加出版社，1980年。

数字图书馆

[27]

开放人工智能。Universe软件平台。https://universe.openai.com/, 2016.

[28]

Diego Perez-Liebana、Spyridon Samothrakis、Julian Togelius、Simon M.Lucas和Tom Schaul。通用视频游戏AI：竞争、挑战和机遇。在程序。AAAI公司, 2016.

数字图书馆

[29]

Silvia Richter和Matthias Westphal。LAMA规划师：用地标指导基于成本的任何时间规划。JAIR公司, 39:122-177, 2010.

数字图书馆

[30]

尤西·林塔南（Jussi Rintanen）。作为可满足性的规划：启发式。人工智能, 193:45-86, 2012.

数字图书馆

[31]

汤姆·绍尔。用于基于模型或交互式学习的视频游戏描述语言。在程序。IEEE-CIG公司，第1-8页，2013年。

[32]

Martin Seligman、Peter Railton、Chandra Sripada和Roy Baumeister。Homo招股说明书牛津大学出版社，2016年。

[33]

亚历山大·什利夫曼（Alexander Shleyfman）、亚历山大·图伊索夫（Alexander Tuisov）和卡梅尔·多姆什拉克（Carmel Domshlak）。重新访问了对类似atari的在线计划的盲目搜索。在程序。国际JCAI，第3251-3257页，2016年。

数字图书馆

[34]

Dennis Soemers、Chiara Sironi、Torsten Schuster和Mark Winands。增强了一般视频游戏中的实时Monte-Carlo树搜索。在程序。IEEE-CIG公司，第436-443页，2016年。

[35]

奥斯汀·泰特。正在生成项目网络。在程序。国际JCAI，第888-8931977页。

数字图书馆

[36]

范谢、马丁·米勒和罗伯特·霍尔特。贾斯珀：贪婪的最佳优先搜索中的探索艺术。在程序。第八届国际规划竞赛, 2014.

引用人

科尔索A莫斯·RKoren M公司李·R科钦德费尔M(2022)网络物理系统黑盒安全验证算法综述人工智能研究杂志10.1613/jair.1.1271672(377-428)在线发布日期：2022年1月4日
https://dl.acm.org/doi/10.1613/jair.1.12716
查里埃TQueffelec A公司桑库尔O施瓦岑特鲁伯F(2019)互联代理的可达性和覆盖规划第28届国际人工智能联合会议记录10.5555/3367032.3367054(144-150)在线发布日期：2019年8月10日
https://dl.acm.org/doi/10.5555/3367032.3367054
博丹F查里埃T奎菲莱克A施瓦岑特鲁伯F(2018)生成协作连接无人机的计划第27届国际人工智能联合会议记录10.5555/3304652.3304864(5811-5813)在线发布日期：2018年7月13日
https://dl.acm.org/doi/10.5555/3304652.3304864
显示更多引用者

建议

基于行动的行动计划
ICTAI’13：2013 IEEE第25届人工智能工具国际会议记录

机器人目标的实现通常需要综合计划和通过物理运动执行计划。机器人任务中的动作成本通常取决于动作。通常有许多基于行动的计划来实现目标，通常。。。
阅读更多信息
行动成本下的答案集规划

最近，基于答案集编程的规划被提出作为实现声明性规划系统的一种方法。在本文中，我们提出了语言κ^c（c），通过操作成本扩展了声明性规划语言κ。κ^c（c）提供。。。
阅读更多信息
制定事故行动计划的时间HTN规划中的任意时间启发式搜索

极端事件挑战了应急管理人员制定统一行动计划以确保多个响应机构有效协调的决策能力。本文提出了一种新颖的HTN规划器XEPlanner，其目标是。。。
阅读更多信息

评论

信息和贡献者

问询处

发布于

封面图片指南会议记录

IJCAI’17：第26届国际人工智能联合会议记录

2017年8月

5253页

国际标准图书编号：9780999241103

编辑：
卡尔斯·塞拉
IIIA-CSIC公司

赞助商

澳大利亚计算机学会
NSF：国家科学基金会
格里菲斯大学
悉尼理工大学
人工智能期刊：人工智能期刊

出版商

AAAI出版社

出版历史

出版：2017年8月19日

限定符

第条

贡献者

其他指标

查看文章指标

文献计量学和引文

文献计量学

文章指标

6
引文总数
查看引文
0
总下载次数

下载量（最近12个月）0
下载次数（最近6周）0

其他指标

查看作者指标

引文

引用人

科尔索A莫斯·R科伦MLee R公司科钦德费尔M(2022)网络物理系统黑盒安全验证算法综述人工智能研究杂志10.1613/jair.1.1271672(377-428)在线发布日期：2022年1月4日
https://dl.acm.org/doi/10.1613/jair.1.12716
查里埃TQueffelec A公司桑库尔O施瓦岑特鲁伯F(2019)连接代理的可达性和覆盖范围规划第28届国际人工智能联合会议记录10.5555/3367032.3367054(144-150)在线发布日期：2019年8月10日
https://dl.acm.org/doi/10.5555/3367032.3367054
博丹F夏里埃TQueffelec A公司施瓦岑特鲁伯F(2018)生成协作连接无人机的计划第27届国际人工智能联合会议记录10.5555/3304652.3304864(5811-5813)在线发布日期：2018年7月13日
https://dl.acm.org/doi/10.5555/3304652.3304864
杰夫纳H(2018)无模型、基于模型和通用智能第27届国际人工智能联合会议记录10.5555/3304415.3304418(10-17)在线发布日期：2018年7月13日
https://dl.acm.org/doi/10.5555/3304415.3304418
麦克纳利A利波维茨基N拉米雷斯M皮尔斯A安德烈·E柯尼格S达斯坦尼MSukthankar G公司(2018)透明规划的行动选择第17届自治代理和多代理系统国际会议记录10.5555/3237383.3237897(1327-1335)在线发布日期：2018年7月9日
https://dl.acm.org/doi/10.5555/3237383.3237897
拉米雷斯M帕帕西梅恩M利波韦茨基N本克L米勒T皮尔斯AScala E公司扎马尼M安德烈·E柯尼格S达斯塔尼MSukthankar G公司(2018)无人机实时机动的综合混合规划与程序控制第17届自治代理和多代理系统国际会议记录10.5555/3237383.3237896(1318-1326)在线发布日期：2018年7月9日
https://dl.acm.org/doi/10.5555/3237383.3237896

视图选项

查看选项

媒体

数字

其他

桌子