摘要

第二十四届国际人工智能联合会议论文摘要

基于Markov决策模型的概率论证优化/2004
Emmanuel Hadoux、Aurélie Beynier、Nicolas Maudet、Paul Weng、Anthony Hunter
PDF格式

处理代理人之间观点冲突的一个显著方法是进行辩论:通过交换论点,代理人可以寻求说服对方。在本文中,我们研究了一个智能体的问题,即针对假定行为随机且具有未知初始信念状态的对手,优化辩论中提出的一系列动作。尽管朴素映射到马尔可夫模型导致的状态数量令人望而却步,但我们表明,利用这种交互设置的几个特征可以在实践中获得最佳解决方案,特别是:(1)当辩论发生在公共空间(或公共场所)时,它们可以很容易地建模为混合可观测性马尔可夫决策过程,(2)由于论证问题是高度结构化的,可以设计优化技术来修剪初始实例。我们报告了对这些技术的实验评估。