计算机科学>机器学习
标题: 公平协作车辆路径:一种深度多智能体强化学习方法
摘要: 当运营商通过共享其运输请求并代表彼此执行运输请求进行协作时,便会发生协作车辆路由。 这实现了规模经济,从而降低了成本、温室气体排放和道路拥堵。 但是,哪个承运人应该与谁合作,每个承运人应该得到多少赔偿? 传统的博弈论解概念计算成本很高,因为特征函数随代理数量呈指数级增长。 这将需要以指数次数解决车辆路径问题(NP-hard)。 因此,我们建议将此问题建模为使用深度多智能体强化学习解决的联盟谈判博弈,其中至关重要的是,智能体无法访问特征函数。 相反,我们隐含地推理特征函数; 因此,当部署到生产环境中时,我们只需要对代价高昂的协作后车辆路径问题进行一次评估。 我们的贡献是,我们是第一个同时考虑路由分配问题和增益共享问题的人,而没有使用昂贵的特征函数。 通过分散的机器学习,我们的代理相互讨价还价,并同意与Shapley价值密切相关的结果,这是一种公平的利润分配机制。 重要的是,我们能够将运行时间减少88%。