跳到主要内容
10.5555/3171837.3171887指导程序文章/章节视图摘要出版物页面会议记录acm-pubtype公司
第条

纯粹的声明性动作表示被高估了:带模拟器的经典规划

出版:2017年8月19日 出版历史
  • 获取引文提醒
  • 摘要

    经典规划涉及的问题是,需要通过采取具有确定性、已知效果的行动,从已知的初始状态达到目标。然而,经典规划师只处理可以用STRIPS或PDDL等声明性规划语言表示的经典问题。这就防止了它们在不容易进行声明性建模或其动力学通过仿真给出的问题上的使用。模拟器不提供动作的声明性表示,而只是返回后续状态。我们在本文中要解决的问题是:一个仅能访问状态和目标结构的规划者,能否接近那些也能访问PDDL中表示的动作结构的规划者的性能。为了回答这个问题,我们开发了完全忽略动作结构的域相关黑盒规划算法,并表明它们与最先进的经典规划师在标准规划基准上的表现相匹配。有效的黑盒算法为建模和表达控制知识开辟了新的可能性,我们也对此进行了说明。

    工具书类

    [1]
    马克·贝勒马尔(Marc Bellemare)、雅瓦·纳达夫(Yavar Naddaf)、乔尔·维内斯(Joel Veness)和迈克尔·鲍林(Michael Bowling)。街机学习环境:通用代理的评估平台。JAIR公司, 47:253-279, 2013.
    [2]
    Blai Bonet和Hector Geffner。GPT:具有不确定性和部分信息的规划工具。程序。IJCAI不确定性和部分信息规划研讨会, 2001.
    [3]
    Blai Bonet和Hector Geffner。规划是启发式搜索。人工智能, 129(1- 2):5-33, 2001.
    [4]
    汤姆·拜兰德。STRIPS规划的计算复杂性。人工智能, 69:165-204, 1994.
    [5]
    Stefan Edelkamp和Peter Kissmann。具有行动成本和偏好的最优符号规划。程序。国际JCAI,第1690-1695页,2009年。
    [6]
    吉伦·弗兰克斯和赫克托·杰夫纳。规划中的建模和计算:更具表现力的语言具有更好的启发式。程序。ICAPS公司,第70-78页,2015年。
    [7]
    赫克托·杰夫纳和布莱·博内。自动化规划模型和方法的简要介绍摩根&克莱普尔出版社,2013年。
    [8]
    托马斯·杰夫纳和赫克托尔·杰夫纳。一般视频游戏的基于宽度的规划。程序。AIIDE公司,第23-29页,2015年。
    [9]
    赫克托·杰夫纳。功能STRIPS。编辑J.Minker,基于逻辑的人工智能,第187-205页。Kluwer,2000年。
    [10]
    马尔特·赫尔默特。快速向下规划系统。JAIR公司, 26:191-246, 2006.
    [11]
    Joerg Hoffmann和Bernhard Nebel。FF计划系统:通过启发式搜索快速生成计划。JAIR公司, 14:253-302, 2001.
    [12]
    Joerg Hoffmann、Julie Porteous和Laura Sebastia。规划中的有序地标。JAIR公司, 22:215-278, 2004.
    [13]
    弗兰克·伊万科维奇和帕特里克·哈斯鲁姆。带公理的最优规划。程序。国际JCAI,第1580-1586页,2015年。
    [14]
    Yuu Jinnai和Alex Fukunaga。学习修剪在线黑盒计划中占主导地位的动作序列。程序。AAAI公司,第839-845页,2017年。
    [15]
    马修·约翰逊(Matthew Johnson)、卡蒂娅·霍夫曼(Katja Hofmann)、蒂姆·赫顿(Tim Hutton)和大卫·比格内尔(David Bignell)。人工智能实验的Malmo平台。程序。国际JCAI,第4246-4247页,2016年。
    [16]
    迈克尔·卡茨和乔格·霍夫曼。水星计划者:突破部分删除松弛的极限。程序。第八届国际规划竞赛, 2014.
    [17]
    亨利·考茨和巴特·塞尔曼。突破极限:规划、命题逻辑和随机搜索。程序。AAAI公司第1194-1201页,1996年。
    [18]
    尼尔·利波维茨基和赫克托·杰夫纳。经典规划问题的宽度和系列化。程序。ECAI公司,第540-545页,2012年。
    [19]
    尼尔·利波维茨基和赫克托·杰夫纳。最佳第一宽度搜索:经典规划中的探索和开发。程序。AAAI公司, 2017.
    [20]
    尼尔·利波维茨基(Nir Lipovetzky)、米奎尔·拉米雷斯(Miquel Ramirez)和赫克托·杰夫纳(Hector Geffner)。带模拟器的经典规划:atari视频游戏的结果。程序。国际JCAI,第1610-1616页,2015年。
    [21]
    尼尔·利波维茨基。古典规划中的结构与推理AI Access,2014年。
    [22]
    德鲁·麦克德莫特。使用回归匹配图控制规划中的搜索。人工智能, 109(1-2):111-159, 1999.
    [23]
    德鲁·麦克德莫特。1998年AI规划系统竞赛。人工智能杂志, 21(2):35-56, 2000.
    [24]
    阿伦·纽厄尔和赫伯特·西蒙。GPS:模拟人类思维的程序。计算机与思维,第279-293页。麦格劳·希尔,1963年。
    [25]
    尼尔斯·尼尔森和理查德·菲克斯。STRIPS:一种将定理证明应用于问题解决的新方法。人工智能, 1:27- 120, 1971.
    [26]
    尼尔斯·尼尔森。人工智能原理蒂奥加出版社,1980年。
    [27]
    开放人工智能。Universe软件平台。https://universe.openai.com/, 2016.
    [28]
    Diego Perez-Liebana、Spyridon Samothrakis、Julian Togelius、Simon M.Lucas和Tom Schaul。通用视频游戏AI:竞争、挑战和机遇。程序。AAAI公司, 2016.
    [29]
    Silvia Richter和Matthias Westphal。LAMA规划师:用地标指导基于成本的任何时间规划。JAIR公司, 39:122-177, 2010.
    [30]
    尤西·林塔南(Jussi Rintanen)。作为可满足性的规划:启发式。人工智能, 193:45-86, 2012.
    [31]
    汤姆·绍尔。用于基于模型或交互式学习的视频游戏描述语言。程序。IEEE-CIG公司,第1-8页,2013年。
    [32]
    Martin Seligman、Peter Railton、Chandra Sripada和Roy Baumeister。Homo招股说明书牛津大学出版社,2016年。
    [33]
    亚历山大·什利夫曼(Alexander Shleyfman)、亚历山大·图伊索夫(Alexander Tuisov)和卡梅尔·多姆什拉克(Carmel Domshlak)。重新访问了对类似atari的在线计划的盲目搜索。程序。国际JCAI,第3251-3257页,2016年。
    [34]
    Dennis Soemers、Chiara Sironi、Torsten Schuster和Mark Winands。增强了一般视频游戏中的实时Monte-Carlo树搜索。程序。IEEE-CIG公司,第436-443页,2016年。
    [35]
    奥斯汀·泰特。正在生成项目网络。程序。国际JCAI,第888-8931977页。
    [36]
    范谢、马丁·米勒和罗伯特·霍尔特。贾斯珀:贪婪的最佳优先搜索中的探索艺术。程序。第八届国际规划竞赛, 2014.

    引用人

    查看全部

    建议

    评论

    信息和贡献者

    问询处

    发布于

    封面图片指南会议记录
    IJCAI’17:第26届国际人工智能联合会议记录
    2017年8月
    5253页
    国际标准图书编号:9780999241103

    赞助商

    • 澳大利亚计算机学会
    • NSF:国家科学基金会
    • 格里菲斯大学
    • 悉尼理工大学
    • 人工智能期刊:人工智能期刊

    出版商

    AAAI出版社

    出版历史

    出版:2017年8月19日

    限定符

    • 第条

    贡献者

    其他指标

    文献计量学和引文

    文献计量学

    文章指标

    • 下载量(最近12个月)0
    • 下载次数(最近6周)0

    其他指标

    引文

    引用人

    查看全部
    • (2022)网络物理系统黑盒安全验证算法综述人工智能研究杂志10.1613/jair.1.1271672(377-428)在线发布日期:2022年1月4日
    • (2019)连接代理的可达性和覆盖范围规划第28届国际人工智能联合会议记录10.5555/3367032.3367054(144-150)在线发布日期:2019年8月10日
    • (2018)生成协作连接无人机的计划第27届国际人工智能联合会议记录10.5555/3304652.3304864(5811-5813)在线发布日期:2018年7月13日
    • (2018)无模型、基于模型和通用智能第27届国际人工智能联合会议记录10.5555/3304415.3304418(10-17)在线发布日期:2018年7月13日
    • (2018)透明规划的行动选择第17届自治代理和多代理系统国际会议记录10.5555/3237383.3237897(1327-1335)在线发布日期:2018年7月9日
    • (2018)无人机实时机动的综合混合规划与程序控制第17届自治代理和多代理系统国际会议记录10.5555/3237383.3237896(1318-1326)在线发布日期:2018年7月9日

    视图选项

    查看选项

    媒体

    数字

    其他

    桌子

    分享

    分享

    共享此出版物链接

    在社交媒体上分享