CoRide:面向多尺度顺风车平台的联合订单调度和车队管理
摘要:在线打车平台如何优化地派单给车辆,如何权衡即时和未来的回报是一个常见的问题。我们把打车模型化为大规模并行排名问题,并研究了在线打车平台中的订单派发和车队管理的联合决策任务。这个任务在以下四个方面带来了独特的挑战。首先,为了使大量的车辆能够高效稳定地行动和学习,我们将每个区域单元视为一个智能体,并构建了一个多智能体强化学习框架。其次,为了协调来自不同区域的智能体以实现长期利益,我们利用区域格子的地理层次结构进行层次强化学习。第三,为了处理联合订单派发和车队管理中的异构和变化的动作空间,我们将动作设计为排名权重向量,以一种统一的形式对特定订单或车队管理目的地进行排名和选择。第四,为了实现多尺度打车平台,我们采用分层方式进行决策过程,其中利用多头注意力机制来整合邻近智能体的影响并捕获每个尺度的关键智能体。整个创新框架被称为CoRide。基于多个城市的真实数据和分析合成数据的广泛实验表明,与强基线相比,CoRide在城市范围的混合订单派发和车队管理任务中提供了卓越的平台收入和用户体验。
作者:Jiarui Jin, Ming Zhou, Weinan Zhang, Minne Li, Zilong Guo, Zhiwei Qin, Yan Jiao, Xiaocheng Tang, Chenxi Wang, Jun Wang, Guobin Wu, Jieping Ye
论文ID:1905.11353
分类:Multiagent Systems
分类简称:cs.MA
提交时间:2019-09-02