2011年1月
没有可用的摘要。
在实践中越来越多地使用自主代理可能需要代理作为一个团队进行合作,在这种情况下,他们彼此之间的事先知识有限,无法直接通信,或者不共享相同的世界模型。这些情况。。。
行为经济学的结果表明,个人并不总是最大化金钱回报。在行为经济学中,人们提出了不同的社会偏好模型来解释这种偏离博弈论标准假设的情况。。。
在路径选择问题中,我们提出了一种新的生成建议的计算方法。顾问代理人的利益可能与接受建议的人的利益冲突。这样的优化。。。
通常,代理对其他代理进行建模以预测它们在交互过程中的行为是有利的。将他人建模为理性在人工智能和博弈论中有着悠久的传统,但将其他代理人偏离理性建模是。。。
了解用户的偏好可以让代理代表用户做出智能决策。当我们从一组用户那里获取偏好时,我们可以使用我们已经处理过的用户的偏好来提高。。。
本文研究了频率调整Q-学习(FAQ-learning),这是Q-学习的一种变体,可以模拟同步的值函数更新。本文的主要贡献是为FAQ学习的收敛性提供了实证和理论支持。。。
部分可观测随机博弈(POSG)对于许多多智能体领域来说是一个很有吸引力的模型,但在计算上极难求解。我们提出了一个新的模型,不完全信息的马尔可夫博弈(MGII),它强加了一个温和的。。。
能够紧凑地表示大型状态空间对于解决绝大多数实际随机规划问题至关重要。这一要求在多智能体系统的环境中更为严格,其中要建模的世界也。。。
我们开发了一种用于众包应用程序的概念学习的贝叶斯方法。根据专家的(有噪声的)观察结果,对可能的概念定义保持和更新概率信念,专家的行为是使用…建模的。。。
我们正在准备下载您的搜索结果。。。
文件准备好后,我们会在这里通知您。
您的搜索结果引用文件现已准备就绪。
您的搜索导出查询已过期。请重试。