摘要
Aamena Alshamsi、Sherief Abdallah和Iyad Rahwan。 2009年,出租车调度系统的多智能体自组织。 在第八届自治代理和多代理系统国际会议的会议记录中。 21–28. 谷歌学者 P.Arunapuram、J.W.Bartel和P.Dewan。 2014.堆栈溢出响应时间的分布、相关性和预测。 第十届IEEE协作计算国际会议论文集:网络、应用和工作共享。378–387。 内政部: https://doi.org/10.4108/icst.collaboratecom.2014.257265 谷歌学者 N.Burlutskiy、A.Fish、N.Ali和M.Petridis。 2015年问答社区用户响应时间预测。 2015年IEEE第14届机器学习和应用国际会议论文集。 618–623. 内政部: https://doi.org/10.109/ICMLA.2015.190 谷歌学者 陈勇、周明、温颖、杨耀东、苏玉凤、张卫南、张戴尔、王军和刘韩。 2018.用于大规模多智能体系统的因子化Q学习。 在第一届分布式人工智能国际会议论文集上。 ACM,第7条。 https://doi.org/10.1145/3356464.3357707 谷歌学者 P.Cheng、X.Lian、L.Chen和C.Shahabi,2017年。 空间众包中基于预测的任务分配。 《2017年IEEE第33届国际数据工程会议论文集》,IEEE,997-1008。 内政部: https://doi.org/10.109/ICDE.2017.146 谷歌学者 David Geiger和Martin Schader。 2014年。众包信息系统中的个性化任务建议——最新技术。决策支持系统65,C(2014),3–16。 谷歌学者 戈戈斯。 2020年,GOGOX香港。 检索自 https://www.gogox.com.hk。 谷歌学者 金嘉瑞、周明、张卫南、李敏妮、郭子龙、秦志伟、闫焦、汤晓成、王晨曦、王军、魏国斌和叶洁平。2019年。 CoRide:多尺度骑乘平台的联合订单调度和车队管理。 第28届ACM信息和知识管理国际会议记录。 ACM,美国纽约州纽约市,1983-1992年。 内政部: https://doi.org/10.1145/3357384.3357978 谷歌学者 数字图书馆 柯锦涛、冯晓、海阳和叶洁平,2020年。 《骑乘外包系统中的延迟学习:多智能体深度强化学习框架》,IEEE知识与数据工程汇刊,DOI:10.1109/TKDE.2020.3006084 谷歌学者 S.Klos née Müller、C.Tekin、M.van der Schaar和A.Klein。 2018.移动众包绩效最大化的情境软件分层在线学习。 IEEE/ACM网络汇刊26,3(2018年6月),1334–1347。 内政部: https://doi.org/10.109/TNET.2018.2828415 谷歌学者 李德洪、王浩、周汝龙和周勋。 2004年。基于当前需求和实时交通状况的出租车调度系统。 《运输研究记录1882》、《1882》(2004)、《193-200》。 谷歌学者 交叉引用 W.Li、J.Cao、J.Guan、S.Zhou、G.Liang、W.K.Y.So和M.Szczecinski。 2019.按需运输服务中未满足需求预测的一般框架。 IEEE智能交通系统汇刊20、8(2019年8月),2820–2830。 内政部: https://doi.org/10.109/TITS.2018.2873092 谷歌学者 交叉引用 林开祥、赵仁宇、徐哲和周嘉玉。 2018年。通过多智能体深度强化学习实现高效的大规模车队管理。 第24届ACM SIGKDD知识发现与数据挖掘国际会议论文集。 ACM,纽约州纽约市,1774-1783年。 内政部: https://doi.org/10.1145/3219819.3219993 谷歌学者 数字图书馆 贾拉尔·马哈茂德(Jalal Mahmud)、吉林·陈(Jilin Chen)和杰弗里·尼科尔斯(Jeffrey Nichols)。 2013年。你什么时候回答这个问题? 估计Twitter中的响应时间。 第七届AAAI网络日志和社交媒体国际会议论文集。 谷歌学者 Volodymyr Mnih、Koray Kavukcuoglu、David Silver、Andrei A.Rusu、Joel Veness、Marc G.Bellemare、Alex Graves、Martin Riedmiller、Andreas K.Fidjeland、Georg Ostrovski、Stig Petersen、Charles Beattie、Amir Sadik、Ioannis Antonoglou、Helen King、Dharshan Kumaran、Daan Wierstra、Shane Legg和Demis Hassabis。2015年。 通过深度强化学习进行人性化控制。 《自然》5187540(2015),529-533。 内政部: https://doi.org/10.1038/nature14236 谷歌学者 詹姆斯·蒙克雷斯(James Munkres)。 1957.分配和运输问题的算法。 《工业和应用数学学会杂志》10,1(1957),196-210。 谷歌学者 K.T.Seow、N.H.Dang和D.Lee。 2010年,多智能体协同出租车调度系统。 IEEE自动化科学与工程学报7,3(2010年7月),607-616。 内政部: https://doi.org/10.109/TASE.20092577 谷歌学者 唐晓成、秦志伟、张凡、王兆东、徐哲、马银泰、朱宏图和叶洁平,2019年。 一种基于深度值网络的多驱动程序订单调度方法。 第25届ACM SIGKDD知识发现和数据挖掘国际会议论文集。 ACM,纽约州纽约市,1780-1790年。 内政部: https://doi.org/10.1145/3292500.3330724 谷歌学者 数字图书馆 Hien To、Cyrus Shahabi和Leyla Kazemi。 2015年。服务器设计的空间众包框架。ACM空间算法系统交易1,1(2015年7月),第2条,28页。 内政部: https://doi.org/10.1145/2729713 谷歌学者 数字图书馆 童永新、舍洁英、丁伯林、陈雷、沃天宇、徐珂。 2016年,实时空间数据中的在线最小匹配:实验和分析。 VLDB捐赠会议记录9,12(2016年8月),1053–1064。 内政部: https://doi.org/10.14778/2994509.2994523 谷歌学者 数字图书馆 童永新、舍洁英、丁伯林、王立斌和陈雷。 2016年,空间众包中的在线移动微任务分配。 2016年IEEE第32届国际数据工程会议论文集。IEEE,49–60。 谷歌学者 交叉引用 童永新、王立斌、周子木、丁伯林、陈雷、叶洁平、徐珂。 2017.实时空间数据中的灵活在线任务分配。 VLDB捐赠会议记录10,11(2017),1334-1345。 谷歌学者 数字图书馆 Y.Tong、Y.Zeng、B.Ding、L.Wang和L.Chen。 2019.空间众包双边在线微任务分配。 IEEE知识与数据工程汇刊。DOI: https://doi.org/10.109/TKDE.2019.2948863 谷歌学者 Tong Yongxin、Zhou Zhou、Yuxiang Zeng、Lei Chen和Cyrus Shahabi,2020年。 空间众包:一项调查。 VLDB期刊29,1(2020),217-250。 内政部: https://doi.org/10.1007/s00778-019-00568-7 谷歌学者 数字图书馆 王玉琪、曹建农、何丽芳、李文根、孙立超和余菲利普。 2017.用于物流服务响应时间预测的耦合稀疏矩阵分解。 2017年ACM信息和知识管理会议记录。 ACM,纽约州纽约市,939–947。 内政部: https://doi.org/10.1145/3132847.3132948 谷歌学者 Y.Wang、Y.Tong、C.Long、P.Xu、K.Xu和W.Lv.2019。 自适应动态二部图匹配:一种强化学习方法。 《2019年IEEE第35届国际数据工程会议论文集》,IEEE,1478-1489。 内政部: https://doi.org/10.1109/ICDE.2019.00133(网址:https://doi.org/10.1109/ICDE.2019.00133) 谷歌学者 王振中、秦振中、唐熙、叶杰和朱浩。 2018年,通过知识转移进行深度强化学习,以实现在线骑乘订单调度。 2018年IEEE数据挖掘国际会议论文集。 IEEE,617–626。 内政部: https://doi.org/10.109/ICDM.2018.00077 谷歌学者 交叉引用 徐哲、李志新、关庆文、张定水、李强、南军校、刘春阳、魏卞和叶洁平,2018年。 按需搭车平台中的大规模订单调度:一种学习和规划方法。 第24届ACM SIGKDD知识发现和数据挖掘国际会议论文集。 ACM,纽约州纽约市,905-913。 内政部: https://doi.org/10.1145/3219819.3219824 谷歌学者 数字图书馆 L.Yang、X.Yu、J.Cao、W.Li、Y.Wang和M.Szczecinski。 2019.自治按需服务的新型需求调度模型。 IEEE服务计算汇刊。 内政部: https://doi.org/10.1109/TSC.2019.2941680 谷歌学者 张玲玉、胡涛、岳敏、吴国斌、张俊英、冯鹏程、龚平华和叶洁平,2017年。 基于组合优化的出租车订单调度模型。 第23届ACM SIGKDD知识发现和数据挖掘国际会议论文集。 ACM,纽约州纽约市,2151–2159。 内政部: https://doi.org/10.1145/3097983.3098138 谷歌学者 数字图书馆 L.Zheng和L.Chen。 2017年,最大限度地接受拒绝感知的空间众包。 IEEE知识与数据工程学报29,9(2017年9月),1943-1956。 内政部: https://doi.org/10.109/TKDE.2017.2676771 谷歌学者 交叉引用 郑立斌、陈雷、叶洁平,2018年。 价格软件共享中的订单发送。VLDB捐赠会议记录11,8(2018年4月),853–865。 内政部: https://doi.org/10.14778/3204028.3204030 谷歌学者 数字图书馆
建议
用深度强化学习解决火箭回收任务 ICIT’18:第六届信息技术国际会议记录:物联网与智能城市 强化学习是解决复杂顺序决策问题的一种很有前景的范式,已引起各个领域的日益关注。 在本文中,我们研究了使用强化学习的合理性。。。