×

多智能体系统的广播随机滚动时域控制。 (英语) Zbl 1315.93086号

摘要:对随机行为主体的最优调控对于在主体群中实现稳健的聚合行为至关重要。如何最优地控制这些行为导致了设计最优控制体系结构的问题。本文提出了一种新的广播随机滚动时域控制结构,作为稳定随机行为代理群的最优策略。其目标是在每一个时间步,使用集体系统行为作为唯一可用的反馈信息,在滚动时域控制框架中设计一个最优控制律,并将其广播给所有代理,以实现所需的系统行为。使用概率工具,导出了一个基于条件期望的预测模型,以表示具有多状态转换的独立行为主体群的集合行为。提出了一个随机有限滚动时域控制问题,以稳定Agent的聚合行为。给出了两状态多智能体系统的分析和仿真结果。利用上鞅理论保证闭环系统的稳定性。确保闭环系统几乎肯定(概率为1)收敛到期望目标。最后,给出了结论。

理学硕士:

93E20型 最优随机控制
68T42型 Agent技术与人工智能
93E15型 控制理论中的随机稳定性
PDF格式BibTeX公司 XML格式引用
全文: 内政部