{“状态”:“确定”,“消息类型”:“工作”,“信息版本”:“1.0.0”,“邮件”:{“索引”:{“日期-部件”:[[2024,6,7]],“日期-时间”:“2024-06-07T05:13:32Z”,“时间戳”:1717737212858},“参考-计数”:32,“出版商”:“计算机协会(ACM)”,“问题”:“3”,“资助者”:[{“DOI”:“10.13039\/501100001809”,“名称”:“中国国家自然科学基金”,“doi-asserted-by”:“crossref”,“award”:[“61972161”],“id”:[{“id”:“10.13039\/501100001809”,“id type”:“doi”,“asserted by”:“crosref”}]},{“name”:“香港RGC一般研究基金”,《award》:[“152199\/17E”]}基金会“,“doi-asserted-by”:“crossref”,“adward”:[“2020A1515011496”],“id”:[{“id”:“10.13039\/501100021171”,“id类型”:“doi”,“asserted by”:“crosref”}]}],“content-domain”:{“domain”:[“dl.acm.org”],”crossmark-restriction“:true},”short-container-title“:[”acm Trans.Knowl.Discov.Data“],”published-print“:{“日期部分”:[[2021,6,30]]},“摘要”:“自主式点播服务,如香港的GOGOX(前身为GoGoVan),为用户提供了一个请求服务的平台,也为供应商提供了满足此类需求的平台。在这样的平台上,供应商可以自主接受或拒绝发送给他/她的需求,因此在需求和供应商之间进行在线匹配是一项挑战。现有方法使用基于循环的方法来调度需求。在这些工作中,调度决策是基于供应商对本轮需求的预测响应模式,但它们都没有考虑未来需求和供应商对当前调度决策的影响。从未来的角度来看,这可能导致做出次优的调度决策。为了解决这个问题,我们提出了一种新的基于深度强化学习的需求调度模型。在这个模型中,我们将每个需求作为一个代理。每个代理的行为,即每个需求的调度决策,由一个集中式算法以协调的方式确定。该模型通过以下两个步骤工作。(1) 它使用历史过渡数据学习每个时空状态下的需求\u2019的预期值。(2) 基于学习值,采用组合优化算法,综合考虑下一轮需求的即时回报和期望值,进行多目标多目标调度。为了获得更高的总回报,未来期望值高(响应时间短)的需求可能会推迟到下一轮。相反,未来期望值较低(响应时间较长)的需求将立即发送。通过使用真实数据集的大量实验,我们表明该模型在取消率和平均响应时间方面优于现有模型<\/jats:p>“,”DOI“:”10.1145\/3442343“,”type“:”journal-article“,”created“:{”date-parts“:[2021,4,21]],”date-time“:”2021-04-21T15:42:54Z“,”timestamp“:1619019774000},”page“:“1-23”,“update-policy”:“http://\/dx.DOI.org\/10.1145\/crossmark-policy”,“source”:”Crossref“,”is-referenced-by-count“:6,”标题“:[”探索自主式点播服务中任务调度的深度强化学习“],“前缀”:“10.1145”,“卷”:“15”,“作者”:[{“给定”:“雷”,“家庭”:“杨”,“序列”:“第一”,“隶属”:[}“名称”:“中国广东广州华南理工大学软件工程学院”}]},{“给出”:“西”,“家人”:“余”,“sequence“:”additional“,”affiliation“:[{“name”:“中国广东广州华南理工大学软件工程学院”}]},{“given”:“建农”,“family”:“Cao”,“sequence”:“additional”,“affiliation:[{”name“:香港九龙香港理工大学计算系”}]{,{given“:”Xuxun“,”family“:”刘“,”sequence“:”additional“,”affiliation“:[{”name“:”中国广东广州华南理工大学电子与信息工程学院“}]},{”given“:”Pan“,”family“:”Zhou“,”sequence“:”additionable“,”feliation“:[{“name”:“”湖北省大数据安全工程研究中心、网络科学与工程学院、华中科技大学“}]}”,“成员”:“320”,“在线发布”:{“日期-部件”:[[2021,4,21]]},“参考”:[{“密钥”:“e_1_2_1_1”,“卷-标题”:“第八届自治代理和多代理系统国际会议论文集。21\u201328”,“作者”:“Alshamsi Aamena”,“年份”:“2009”,“非结构化”:“Aamena Alshamsi、Sherief Abdallah和Iyad Rahwan。2009 . 出租车调度系统的多智能体自组织。在第八届自治代理和多代理系统国际会议的会议记录中。2013年8月21日。Aamena Alshamsi、Sherief Abdallah和Iyad Rahwan。2009年,出租车调度系统的多智能体自组织。在第八届自治代理和多代理系统国际会议的会议记录中。21\u201328.“},{“key”:“e_1_1_2_1”,“volume-title”:“第十届IEEE协作计算国际会议论文集:网络、应用和工作共享.378\u2013387”,“author”:“Arunapuram P.”,“year”:“2014”,“unstructured”:“P.Arunapulam,J.W.Bartel,and P.Dewan.2014。堆栈溢出中响应时间的分布、关联和预测。第十届IEEE协作计算国际会议论文集:网络、应用和工作共享。378\u2013387。内政部:https:\/\/DOI.org\/10.4108\/icst.collaboratecom。2014.257265 10.4108 \/icst.collaboratecom.2014.2557265 P.Arunapuram、J.W.Bartel和P.Dewan。2014.堆栈溢出响应时间的分布、相关性和预测。第十届IEEE协作计算国际会议论文集:网络、应用和工作共享。378\u2013387。DOI:https:\/\/DOI.org\/10.4108\/icst.collaborationcom.2014.257265“},{“key”:“e_1_1_3_1”,“volume-title”:“2015 IEEE第十四届机器学习与应用国际会议论文集.618\u2013623”,“author”:“Burlutskiy N.”,《年份》:“2015”,“非结构化”:“N.Burlutskiy,A.Fish,N.Ali,and M.Petridis.2015”。2019年问答社区用户响应时间预测。2015年IEEE第14届机器学习和应用国际会议论文集。618\u2013623。DOI:https:\/\/DOI.org\/10.109\/ICLA。2015.190 10.1109 \/ICMLA.2015.190 N.Burlutskiy、A.Fish、N.Ali和M.Petridis。2015.2019年问答社区用户响应时间预测。2015年IEEE第14届机器学习与应用国际会议论文集。618\u2013623。DOI:https:\/\/DOI.org\/10.109\/IMLA.2015.190“},{“key”:“e_1_2_1_4_1”,“volume-title”:“第一届分布式人工智能国际会议论文集。ACM,第7条。https:\/\/doi.org/10”,“作者”:“陈勇”,“年份”:“2018”,“非结构化”:“陈勇、周明、温家宝、杨耀东、苏玉峰、张伟南、张戴尔、王军和刘汉。2018 . 大规模多智能体系统的因子化Q学习。第一届分布式人工智能国际会议论文集。ACM,第7条。https:\/\/doi.org\/10.1145\/335646.3357707 10.1145\/33564 64.3357707陈勇、周明、温颖、杨耀东、苏玉凤、张卫南、张戴尔、王军和刘韩。2018.大规模多智能体系统的因子化Q学习。第一届分布式人工智能国际会议论文集。ACM,第7条。https:\/\/doi.org\/10.1145\/3356464.3357707“},{“key”:“e_1_2_1_5_1”,“volume-title”:“2017年IEEE第33届数据工程国际会议论文集。IEEE,997\u20131008”,“author”:“Cheng P.”,《年份》:“2017”,“unstructured”:“P.Cheng,X.Lian,L.Chen,and C.Shahabi.2017”。空间众包中基于预测的任务分配。2017年IEEE第33届国际数据工程会议论文集。IEEE,997\u20131008。DOI:https:\/\/DOI.org\/10.109\/ICDE。2017.146 10.1109 \/ICDE.2017.146 P.Cheng、X.Lian、L.Chen和C.Shahabi.2017年。空间众包中基于预测的任务分配。在2017年IEEE第33届国际数据工程会议论文集。IEEE,997\u20131008。DOI:https:\/\/DOI.org\/10.109\/ICDE.2017.146“},{”key“:”e_1_2_1_6_1“,”volume-title“:”C“,”author“:”Geiger David“,“year”:“2014”,“unstructured”:“David Geiger and Martin Schader.2014。众包信息系统中的个性化任务推荐\u2014最新技术。决策支持系统65,C(2014),3\u201316。David Geiger和Martin Schader。2014.众包信息系统中的个性化任务建议\u2014最新技术。决策支持系统65,C(2014),3\u201316.“},{”key“:”e_1_2_1_7_1“,”unstructured“:”GOGOX.2020。GOGOX香港。检索自https:\/\/www.gogox.com.hk.gogox。2020年,GOGOX香港。检索自https:\/\/www.gogox.com.hk.“},{”key“:”e_1_1_8_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1145\/3357384.3357978”},“key”:“e_2_1_9_1”,“article-title”:“学习在乘车外包系统中的延迟:一个多智能体深度强化学习框架”,“volume”:”10“,“author”:“Ke Kapolato”,“year”:“2020”,“unstructured”:“”柯锦涛、冯晓、海阳和叶洁平。2020 . 骑乘外包系统中的延迟学习:一个多智能体深度强化学习框架。IEEE知识与数据工程汇刊。DOI:10.1109。TKDE.020.3006084 10.1109。骑乘外包系统中的延迟学习:一个多智能体深度强化学习框架。IEEE知识与数据工程学报。DOI:10.1109\/TKDE.2020.3006084“,”journal-title“:”IEEE知识和数据工程学报.DOI“},{”key“:”e_1_1_10_1“,”first page“:“3”,“article-title”:“移动众包绩效最大化的上下文软件分层在线学习”,“卷”:“26”,“作者”:“u00e9e M\u00fcller S.Klos”,“年份”:“2018年”,“非结构化”:“S.Klots n\u00e9 e M\u 00fcler,C.Tekin,M.van der Schaar,A.Klein。2018 . 移动众包中实现性能最大化的上下文软件分层在线学习。IEEE\/ACM网络交易26,3(2018年6月),1334\u20131347。内政部:https:\/\/DOI.org\/10.1109\/TNET.2018.2828415 10.1109\/TNET.2018.28215 S.Klos n\u00e9e M\u00fcller、C.Tekin、M.van der Schaar和A.Klein。2018.移动众包绩效最大化的情境软件分层在线学习。IEEE\/ACM网络交易26,3(2018年6月),1334\u20131347。DOI:https:\/\/DOI.org\/10.109\/TNET.2018.28415“,”journal-title“:”IEEE\/ACM网络事务“},{“key”:“e_1_1_11_1”,“DOI-asserted-by”:“publisher”,”DOI“:”10.3141\/1882-23“}”,{”key“:”e_1_i_12_12_1“,”DOI-assert-by“:”publisher“,2_1_13_1“,”DOI-asserted-by“:”publisher“,“DOI”:“10.1145\/3219819.3219993“},{“key”:“e_1_2_1_14_1”,“volume-title”:“第七届AAAI网络日志和社交媒体国际会议论文集”,“author”:“Mahmud Jalal”,“year”:“2013”,“unstructured”:“Jalal Mahmudu,Jilin Chen,and Jeffrey Nichols.2013.你什么时候回答这个问题?估计Twitter中的响应时间。第七届AAAI网络日志和社交媒体国际会议论文集。贾拉尔·马哈茂德(Jalal Mahmud)、吉林·陈(Jilin Chen)和杰弗里·尼科尔斯(Jeffrey Nichols)。2013年。你什么时候回答这个问题?估计Twitter的响应时间。第七届AAAI网络日志和社交媒体国际会议论文集。“},{”key“:”e_1_1_15_1“,”volume-title“:”通过深度强化学习进行人类层面的控制。Nature 518,7540“,”author“:”Mnih Volodymyr“,”year“:”2015“,”unstructured“:”Volodymyer Mnih,Koray Kavukcuoglu,David Silver,Andrei A.Rusu,Joel Veness,Marc G.Bellemare,Alex Graves,Martin Riedmiller,Andreas K。菲德杰兰德、乔治·奥斯特罗夫斯基、斯蒂格·彼得森、查尔斯·贝蒂、埃米尔·萨迪克、伊奥尼斯·安东诺格鲁、海伦·金、达珊·库马兰、达安·维尔斯特拉、谢恩·莱格和黛米斯·哈萨比斯。2015年,通过深度强化学习进行人性化控制。《自然》5187540(2015),529\u2013533。内政部:https://\/DOI.org\/10.1038\/nature14236 10.1038\/nature 14236 Volodymyr Mnih,Koray Kavukcuoglu,David Silver,Andrei A.Rusu,Joel Veness,Marc G.Bellemare,Alex Graves,Martin Riedmiller,Andreas K.Fidjeland,Georg Ostrovski,Stig Petersen,Charles Beattie,Amir Sadik,Ioannis Antonoglou,Helen King,Dharshan Kumaran,Daan Wierstra,Shane Legg和Demis Hassabis,2015年。通过深度强化学习进行人性化控制。《自然》5187540(2015),529\u2013533。DOI:https:\/\/DOI.org\/10.1038\/nature14236“},{“key”:“e_1_2_1_16_1”,“first page”:”196“,”article-title“:”分配和运输问题的算法“,”volume“:”10“,”author“:”Munkres James“,“year”:“1957”,“unstructured”:“詹姆斯·蒙克雷斯(James Munkres)。1957 . 分配和运输问题的算法。《工业和应用数学学会杂志》10,1(1957),196\u2013 210。詹姆斯·蒙克雷斯(James Munkres)。1957.分配和运输问题的算法。《工业和应用数学学会杂志》10,1(1957),196\u2013210.“,”Journal-title“:”Journal of the Society for Industrial and Applied Mathematics“},{”key“:”e_1_1_17_1“,”first page“:“3”,“article-title”:“A collaborative multi-agent tax-dispatch system”,“volume”:“7”,“author”:“Seow K.T.”,”year“:”2010“,”unstructured“:”K.T。Seow、N.H.Dang和D.Lee。2010 . 一个协作的多智能体出租车调度系统。IEEE自动化科学与工程学报7,3(2010年7月),607\u2013616。DOI:https:\/\/DOI.org\/10.1109\/TASE.2009.2028577 10.1109\/TASE.2009.2028777 K.T.Seow、N.H.Dang和D.Lee。2010年,多智能体协同出租车调度系统。IEEE自动化科学与工程学报7,3(2010年7月),607\u2013616。DOI:https:\/\/DOI.org\/10.109\/TASE.2009.2028577“,”journal-title“:”IEEE自动化科学与工程学报“},{“key”:“e_1_1_18_1”,“DOI-asserted-by”:“publisher”,”DOI“:”10.1145\/3292500.3330724“}”,{”key“:”e_1_i_19_1“,”DOI-assert-by“:”publisher _1“,”DOI-asserted-by“:”publisher“,“DOI”:“10.14778\/2994509.2994523“},{“key”:“e_1_2_1_21_1”,“doi-asserted-by”:“publisher”,”doi“:“10.1109\/ICDE.2016.7498228”},“key“:”e_1_i_1_22_22_1“,”doi-assert-by“:”publisher“,空间众包中的在线微任务分配”,“卷”:“2019年”,“作者:“Tong Y.”,“年份”:“2019年”,“非结构化”:“Y.Tong,Y.Zeng,B.Ding,L.Wang,and L.Chen。2019 . 空间众包中的双向在线微任务分配。IEEE知识与数据工程汇刊。DOI:https:\/\/DOI.org\/10.109\/TKDE。2019 . 2948863 10.1109 \/TKDE.2019.2948863 Y.Tong、Y.Zeng、B.Ding、L.Wang和L.Chen。2019.空间众包双边在线微任务分配。IEEE知识与数据工程学报。DOI:https:\/\/DOI.org\/10.109\/TKDE.2019.2948863“,”journal-title“:”IEEE知识和数据工程学报.DOI:https:\/\/DOI.org\/10.1109\/TKDE。“},{”key“:”e_1_1_24_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1007\/s00778-019-00568-7”},“key”:“e_2_1_25_1”,“volume-title”:“2017 ACM信息与知识管理会议论文集。ACM”,“author”:“Wang Yuqi”,“unstructured”:“Yuqi-Wang,Cao,Lifang He,Wengen Li,Lichao Sun,and Philip S.Yu.2017。物流服务响应时间预测的耦合稀疏矩阵分解。在2017年ACM信息与知识管理会议记录中。ACM,纽约州纽约市,939\u2013947。内政部:https:\/\/DOI.org\/10.1145\/3132847.3132948 10.1145\/3132877.3132848王玉琦、曹建农、何利芳、李稳根、孙立超和俞敏洪。2017.用于物流服务响应时间预测的耦合稀疏矩阵分解。2017年ACM信息和知识管理会议记录。ACM,纽约州纽约市,939\u2013947。DOI:https:\/\/DOI.org\/10.1145\/3132847.3132948“},{“key”:“e_1_2_1_26_1”,“volume-title”:“2019 IEEE第35届国际数据工程会议论文集。IEEE,1478\u20131489”,“author”:“Wang Y.”,“year”:“199”,”非结构化:“Y.Wang,Y.Tong,C.Long,P.Xu,K.Xu,and W.Lv.2019”。自适应动态二部图匹配:一种强化学习方法。2019年IEEE第35届国际数据工程会议论文集。IEEE,1478\u20131489。DOI:https:\/\/DOI.org\/10.109\/ICDE。2019.00133 10.1109 \/ICDE.2019.00133 Y.Wang、Y.Tong、C.Long、P.Xu、K.Xu和W.Lv.2019。自适应动态二部图匹配:一种强化学习方法。2019年IEEE第35届国际数据工程会议论文集。IEEE,1478\u20131489。DOI:https:\/\/DOI.org\/10.109\/ICDE.2019.00133“},{“key”:“e_1_2_1_27_1”,“DOI-asserted-by”:“publisher”,”DOI“:”10.1109\/ICDM.2018.00077“}”,{”key“:”e_1_i_1_28_1“,”DOI-assert-by“:”publisher“,,“文章标题”:“自主点播服务的新型需求调度模型”,“卷”:“2019年”,“作者”:“杨L.”,“年份”:“199年”、“非结构化”:“L.Yang、X.Yu、J.Cao、W.Li、Y.Wang和M.Szczecinski。2019 . 一种新的自治按需服务需求调度模型。IEEE服务计算汇刊。DOI:https:\/\/DOI.org/10.1109\/TSC。2019 . 2941680 10.1109 \/TSC.2019.2941680 L.Yang、X.Yu、J.Cao、W.Li、Y.Wang和M.Szczecinski。2019.自治按需服务的新型需求调度模型。IEEE服务计算汇刊。DOI:https:\/\/DOI.org\/10.109\/TSC.2019.2941680“,”journal-title“:”IEEE服务计算事务。DOI:https:\/\/DOI.org\/10.109\/TSC。“},{”key“:”e_1_1_30_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1145\/3097983.3098138”},“key”:“e_2_1_31_1”,“doi-assert-by”:“publisher”,”doi“:”10.1109\/TKDE.2017.2703848“container-title”:[“ACM从数据中发现知识的事务”],“original-title“:[],”language“:”en“,”link“:[{”URL“:”https:\/\/dl.acm.org\/doi\/pdf\/10.1145\/3442343“,”content-type“:”unspecified“,”content-version“:”vor“,”intended-application“:”similarity-checking“}],”deposed“:{”date-parts“:[2023,1]],”date-time“:“2023-01-01T21:18:55Z”,“timestamp”:1672607935000},“score“:1,”resource“:{”primary”:{“URL”:“https:\/\/dl.acm.org\/doi\/10.1145\/3442343“}},”副标题“:[],”短标题“:[],”已发布“:{”日期部分“:[[2021,4,21]]},“引用计数”:32,“日志发布”:{“发布”:“3”,“发布发布”:}“日期部分”:[2021,6,30]]}}:\/\/dx.doi.org\/10.1145\/3442343“,”关系“:{},”ISSN“:[”1556-4681“,”1556-472X“],”issn-type“:[{”value“:“1556-4681”,“type”:“print”},{”value“:”1556-472X“,”type“:”electronic“}],“subject”:[],“published”:{”date-parts“:[2021,4,21]]},“assertion”:[{”value:“2020-03-01”,“order”:0,“name”:“received”,“label”:“received”,{“value”:“2020-12-01”,“order”:1,“name”:“accepted”,“label“:”Accepted“,”group“:{”name“:”publication_history“,”label“:”publication history“}},{”value“:”2021-04-21“,”order“:2,“name”:“published”,“label”:“published”,“group”:{