跳到主要内容
10.5555/2908738指导程序书籍页面出版物页面会议记录acm-pubtype公司
AAAIWS’11-13:第13届AAAI互动决策理论和博弈论会议记录
2011年诉讼
出版商:
  • AAAI出版社
会议:
2011年1月1日
出版:
2011年1月1日

反映截至2024年9月17日的下载量文献计量学
摘要

没有可用的摘要。

跳过目录部分
第条
在联合行动环境中领导多个临时队友
第2-8页

在实践中越来越多地使用自主代理可能需要代理作为一个团队进行合作,在这种情况下,他们彼此之间的事先知识有限,无法直接通信,或者不共享相同的世界模型。这些情况。。。

第条
两人困境博弈的互惠偏好模型
第9-15页

行为经济学的结果表明,个人并不总是最大化金钱回报。在行为经济学中,人们提出了不同的社会偏好模型来解释这种偏离博弈论标准假设的情况。。。

第条
在路径选择问题上向人们提供建议
第16-22页

在路径选择问题中,我们提出了一种新的生成建议的计算方法。顾问代理人的利益可能与接受建议的人的利益冲突。这样的优化。。。

第条
Agent交互过程中的有限理性建模
第23-29页

通常,代理对其他代理进行建模以预测它们在交互过程中的行为是有利的。将他人建模为理性在人工智能和博弈论中有着悠久的传统,但将其他代理人偏离理性建模是。。。

第条
有效地从一群用户那里获得偏好
第30-35页

了解用户的偏好可以让代理代表用户做出智能决策。当我们从一组用户那里获取偏好时,我们可以使用我们已经处理过的用户的偏好来提高。。。

第条
矩阵博弈中的FAQ学习:证明纳什均衡附近的收敛性,以及性别斗争中吸引子的分歧
第36-42页

本文研究了频率调整Q-学习(FAQ-learning),这是Q-学习的一种变体,可以模拟同步的值函数更新。本文的主要贡献是为FAQ学习的收敛性提供了实证和理论支持。。。

第条
多智能体强化学习的不完全信息马尔可夫对策
第43-51页

部分可观测随机博弈(POSG)对于许多多智能体领域来说是一个很有吸引力的模型,但在计算上极难求解。我们提出了一个新的模型,不完全信息的马尔可夫博弈(MGII),它强加了一个温和的。。。

第条
交互式一阶概率逻辑
第52-59页

能够紧凑地表示大型状态空间对于解决绝大多数实际随机规划问题至关重要。这一要求在多智能体系统的环境中更为严格,其中要建模的世界也。。。

第条
面向众包的贝叶斯概念学习方法
第60-67页

我们开发了一种用于众包应用程序的概念学习的贝叶斯方法。根据专家的(有噪声的)观察结果,对可能的概念定义保持和更新概率信念,专家的行为是使用…建模的。。。

建议