调试策略:人工智能规划中的自动操作策略测试

作者

  • 马塞尔·斯坦梅茨 萨尔州大学
  • 丹尼尔·菲舍尔 萨尔州大学
  • 哈桑·费里特·恩塞尔 MPI-SWS公司
  • 帕特里克·费伯 萨尔州大学巴塞尔大学
  • 蒂莫·格罗斯 萨尔州大学
  • 菲利普·海姆 萨尔州大学
  • 丹尼尔·霍勒 萨尔州大学
  • 桑德拉·舒勒 萨尔州大学
  • 瓦伦丁·瓦斯特霍尔茨(Valentin Wüstholz) ConsenSys公司
  • 玛丽亚·克里斯塔基斯 MPI-SWS公司
  • 约格·霍夫曼 萨尔州大学德国人工智能研究中心(DFKI)

内政部:

https://doi.org/10.1609/icaps.v32i1.19820

关键词:

操作策略、测试、启发式功能

摘要

测试是一种很有前途的方法,可以获得对神经动作策略π的信任。以前在顺序决策中针对导致故障条件的环境行为进行策略测试的工作。但如果考虑到这种行为,失败是不可避免的,那么π实际上并不是罪魁祸首。要使情况符合π中的“bug”,必须有一个更好的替代策略π'。我们介绍了一个基于这种直觉的通用策略测试框架。这就引发了错误确认问题,决定一个状态是否为错误。我们分析了乐观界和悲观界在设计近似该问题的测试预言机时的使用。我们在经典规划中实现了我们的框架,用几个测试预言和随机遍历方法进行了实验,生成了偏向于较差政策性能和/或状态新颖性的测试状态。我们根据ASNets学习的策略π评估这些技术。我们发现,他们能够有效地识别这些π中的错误,并且我们的随机游走偏差比未告知的基线有所改善。

下载

出版

2022-06-13

如何引用

Steinmetz,M.、Fišer,D.、Eniser,H.F.、Ferber,P.、Gros,T.P.、Heim,P.,Höller,D.、Schuler,X.、Wüstholz,V.、Christakis,M.和Hoffmann,J.(2022)。调试策略:AI规划中的自动操作策略测试。自动化规划和调度国际会议记录,32(1), 353-361. https://doi.org/10.1609/icaps.v32i1.19820