摘要

第二十四届国际人工智能联合会议论文摘要

基于Markov决策模型的概率论证优化/2004
Emmanuel Hadoux、Aurélie Beynier、Nicolas Maudet、Paul Weng、Anthony Hunter
PDF格式

处理代理人之间观点冲突的一个显著方法是进行辩论：通过交换论点，代理人可以寻求说服对方。在本文中，我们研究了一个智能体的问题，即针对假定行为随机且具有未知初始信念状态的对手，优化辩论中提出的一系列动作。尽管朴素映射到马尔可夫模型导致的状态数量令人望而却步，但我们表明，利用这种交互设置的几个特征可以在实践中获得最佳解决方案，特别是：（1）当辩论发生在公共空间（或公共场所）时，它们可以很容易地建模为混合可观测性马尔可夫决策过程，（2）由于论证问题是高度结构化的，可以设计优化技术来修剪初始实例。我们报告了对这些技术的实验评估。