Fair collaborative vehicle routing: A deep multi-agent reinforcement learning approach

Mak, Stephen; Xu, Liming; Pearce, Tim; Ostroumov, Michael; Brintrup, Alexandra

doi:10.1016/j.trc.2023.104376

计算机科学>机器学习

arXiv:2310.17485（cs）

【提交日期：2023年10月26日】

标题：公平协作车辆路径：一种深度多智能体强化学习方法

作者：斯蒂芬·马克,徐黎明,蒂姆·皮尔斯,迈克尔·奥斯特鲁莫夫,亚历山德拉·布林特鲁普

查看PDF

摘要：当运营商通过共享其运输请求并代表彼此执行运输请求进行协作时，便会发生协作车辆路由。这实现了规模经济，从而降低了成本、温室气体排放和道路拥堵。但是，哪个承运人应该与谁合作，每个承运人应该得到多少赔偿？传统的博弈论解概念计算成本很高，因为特征函数随代理数量呈指数级增长。这将需要以指数次数解决车辆路径问题（NP-hard）。因此，我们建议将此问题建模为使用深度多智能体强化学习解决的联盟谈判博弈，其中至关重要的是，智能体无法访问特征函数。相反，我们隐含地推理特征函数；因此，当部署到生产环境中时，我们只需要对代价高昂的协作后车辆路径问题进行一次评估。我们的贡献是，我们是第一个同时考虑路由分配问题和增益共享问题的人，而没有使用昂贵的特征函数。通过分散的机器学习，我们的代理相互讨价还价，并同意与Shapley价值密切相关的结果，这是一种公平的利润分配机制。重要的是，我们能够将运行时间减少88%。

评论：	最终发布版本可在此处找到：此https URL
学科：	机器学习（cs.LG）
引用为：	arXiv:2310.17485【cs.LG】
	（或 arXiv:2310.17485v1【cs.LG】对于此版本）
	https://doi.org/10.48550/arXiv.2310.17485
日志参考：	第157卷，2023年12月，104376
相关DOI:	https://doi.org/10.1016/j.trc.2023.104376

提交历史记录

发件人：Stephen Mak[查看电子邮件]
[第1版]2023年10月26日星期四15:42:29 UTC（2522 KB）

计算机科学>机器学习

标题：公平协作车辆路径：一种深度多智能体强化学习方法

提交历史记录

访问纸张：

参考文献和引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目

计算机科学>机器学习

标题：公平协作车辆路径：一种深度多智能体强化学习方法

提交历史记录

访问纸张：

参考文献和引文

BibTeX格式的引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目