{“状态”:“确定”,“消息类型”:“工作”,“信息版本”:“1.0.0”,“邮件”:{“索引”:{“日期-部分”:[[2024,5,30]],“日期-时间”:“2024-05-30T09:44:02Z”,“时间戳”:1717062242322},“引用-计数”:39,“发布者”:“运筹学与管理科学研究所(INFORMS)”,“问题”:“2”,“内容-域”:{-“域”:[],“交叉标记-限制”:false},“short-container-title”:[“Operations Research”],“published-print”:{“date-parts”:[[2021,3]]},”抽象“:”每当新用户到来时,平台都会面临冷启动问题:即平台必须学习新用户的属性(探索),以便在未来更好地匹配他们(利用)。当推荐的项目数量有限时,平台应如何处理冷启动?例如,在就业机会有限的情况下,劳动力市场平台应该如何在工人的一生中为工人匹配工作?在这种情况下,每个工人都面临着一个多武器匪徒问题,再加上不同类型工作的有限供应。针对这个问题制定了一个解决方案。研究发现,该平台应为每种工作类型估计影子价格,并根据这些价格调整每个员工的报酬(i)以平衡早期学习与报酬,以及(ii)以在此后短期匹配它们<\/jats:p>“,”DOI“:”10.1287\/opere.2020.2013“,”type“:”journal-article“,”created“:{”date-parts“:[2021,1,7]],”date-time“:”2021-01-07T14:40:13Z“,”timestamp“:1610030413000},”page“:“作者”:[{“ORCID”:“http://\/orcid.org\/00000-0002-3960-0770“,”authenticated-orcid“:false,”given“:”Ramesh“,”family“:”Johari“,”sequence“:”first“,”affiliation“:[{”name“:”Stanford University,Stanford,California 94305;“}]},{”orcid“:family“:”Kamble“,”sequence“:”additional“,”affiliation“:[{”name“:”伊利诺伊州芝加哥伊利诺伊大学信息与决策科学系,芝加哥,伊利诺伊60607;“}]},{”ORCID“:”http://\/ORCID.org\/00000-0002-7221-357X“,”authenticated-ORCID“:false,”given“:“Yash”,“family”:“Kanoria”,“sequence”:“additional”,“affiliance”:[{“name”:“哥伦比亚商学院,纽约州纽约市,10027“}]}],“成员”:“109”,“参考”:[{“key”:“B2”,”doi-asserted-by“:”crossref“,”unstructured“:”Agrawal S,Devanur NR(2014)《带凹奖赏和凸背包的匪徒》,第15届ACM Conf.Econom.Compute.(ACM,纽约),989\u20131006.“,”doi“:”10.1145\/2600057.2602844“},{“key”:”B5“,”非结构化”:“Agrawal S,Goyal N(2012)多武器强盗问题的汤普森抽样分析。Mannor S、Srebro N、Williamson RC编辑。第25届年度Conf.Learn。理论(苏格兰爱丁堡),第23卷,39.1\u201339.26。“},{“key”:“B8”,“doi-asserted-by”:“crossref”,“unstructured”:“Anderson R,Ashlagi I,Gamarnik D,Kanoria Y(2015)易货交易的动态模型。Proc.26 Annual ACM-SIAM Sympos.Discrete Algorithms(SIAM,Philadelphia),1925\u20131933。”,“doi”:“10.1137\/1.9781611973730.129”doi由“:”publisher断言,“doi”:“10.1214\/1005051604000000495”},{“key”:“B11”,“doi由”:“publisher断言”,“doi”:“10.1023\/A:101369704352”},{“key”:“B12”,“doi由”:“publisher断言”,“doi”:“10.1145\/2559152”},{“key”:“B14”,“doi由”:“crossref断言”,“nonstructured”:“Badanidiyuru A,Kleinberg R,Slivkins A(2013年)带背包的匪徒。程序。2013年IEEE第54届年度交响乐会。(IEEE,纽约),207\u2013216.“,”DOI“:”10.1109\/FOCS.2013.30“},{“key”:“B15”,“unstructured”:“Badanidiyuru A,Langford J,Slivkins A(2014)Resourceful contextual batchants。Balcan MF,Feldman V,Szepesvari C,eds.Proc.27th Conf.Learn.Theory(西班牙巴塞罗那),第35卷,1109\u20131134.”},“key“:”B16“,”DOI-asserted-by“:”publisher“,”Do I“:”10.1287\/opere.1080.0640“},{“key”:“B17”,“doi-asserted-by”:“publisher”,“doi”:“10.1287\/opere.1120.1103”},}“keys”:“B1 8”,“doi-asserte-by”:“publisher”,“DI:”10.1080\/01621459.1964.10482176 key“:”B21“,”非结构化“:”陈伟,王毅,袁毅(2013)组合多武器强盗:一般框架和应用。国际。Conf.机器学习。(亚特兰大),第28卷,151\u2013159.“},{“key”:“B22”,“doi asserted by”:“publisher”,“doi”:“10.1016\/j.geb.2004.06.014”},{“key”:“B23”,“nonstructured”:“Das S,Kamenica E(2005)双面强盗和约会市场。第19届国际联合人工智能会议(Morgan Kaufmann Publishers Inc.,Burlington,MA),947\u2013952.”},{“key”:“B24”,“doi-asserted-by“:”publisher“,”doi“:”10.1016\/j.sorms.2015.03.001“},{“key”:“B25”,“doi-assert-by”:“publisher”,“doi”:“10.1287\/mnsc.2013.1788”},“key“:”B26“,”doi-assered-by“:”publisher“,”doi“:I“:”10.1137\/060670705“},{“key”:“B28”,“doi-asserted-by”:“publisher”,“doi”:“10.1287\/opere.2018.1755“},{“key”:“B29”,“unstructured”:“Fershtman D,Pavan A(2017)匹配拍卖。技术报告0144,经济系,产业组织研究中心,伊利诺伊州埃文斯顿市。”},“key“:”B30“,”doi-asserted-by“:”crossref“,”unstructure“:”Gai Y,Krishnamachari B,Jain R(2010)学习认知无线电网络中的多用户信道分配:一个组合多臂盗贼公式。IEEE交响乐。新前沿动态光谱(IEEE,纽约),1\u20139.“,”DOI“:”10.1109\/DYSPAN.2010.5457857“},”key“:”B31“,”DOI-asserted-by“:”publisher“,”DOI“:“10.1109\/TNET.2011.2181864”},“”key”:“B33”,“”DOI-sserted-by”:“crossref”,“unstructured”:“Hsu WK,Xu J,Lin X,Bell MR(2018)将在线学习和自适应控制集成到具有不确定收益的排队系统中。2018年通知。理论应用。研讨会(ITA)(IEEE,纽约),1\u20139.”,“DOI”:“10.1109\/ITA.2018.8503124”},{“key”:“B34”,“unstructured”:“Hu M,Zhou Y(2018)Dynamic type matching.Preprint,提交日期:11月16日,https:\/\/arxiv.org\/abs\/1811.07048.”}“key”:“B36”,“DOI-asserted-by”:“publisher“,”DOI“:”10.1007\/s42973-019-00004-z“},{“key”:“B38”,“DOI-asserted-by”:“publisher”,“DOI”:“10.1016\/0196-8858(85)90002-8”},“key“:”B39“,”unstructured“:”Liu K,Zhao Q(2012)未知和随机变化链路状态下的自适应最短路径路由。Proc.10th Internat.Sympos.Model.Optim.Mobile Ad Hoc Wireless Networks(WiOpt)(IEEE,纽约),232\u2013237.“},{”key“:”B40“,”doi-asserted-by“:”publisher“,”doi“:”10.1287\/oper.2017.680“}”,{“问题”:“4”,“key”:“B41”,“首页”:“265”,“卷”:“8”,“作者”:“Mehta A”,“年份”:“2012”,“新闻标题”:“理论计算科学”},},”issue“:”1“,”key“:”B45“,”首页“:”2442“,”卷“:”17“,”作者“:”俄罗斯D“,”年份“:”2016“,”journal-title“:”J.机器学习。研究“},{”key“:”B46“,”doi-asserted-by“:”publisher“,”doi“:”10.1287\/msom.2013.0429“}、{”key“:“B47”,”doo-asserted-by“:“publisher”,“doi”:“10.1561\/1300000007”}、}“key”:“B48”,“doi-assert-by”:“publiser”,”doi:“10.1007\/BF01753437”},}“key”:”B49“,”volume-title“:”互联网拥塞控制数学“,”author“:”Srikant R“,”year“:”2012“},{”key“:”B50“,”doi-asserted-by“:”publisher“,”doi“:”10.1016\/j.jet.2004.10.005“},{“key”:“B51”,”doo-asserted-by“:“crossref”,“unstructured”:“Tassiulas L,Ephremides A(1990)约束排队系统的稳定性和多跳无线网络中最大吞吐量的调度策略。第29届IEEE Conf.Decision Control(IEEE,纽约),2130\u20132132.“,”DOI“:”10.1109\/CCDC.1990.204000“},{“key”:“B52”,“DOI-asserted-by”:“publisher”,“DOI”:“10.1287\/opere.2013.1245”}],“container-title”:[“Operations Research”],“original-title“:[],“language”:“en”,“link”:[{“URL”:“https:\/\/pubsonline.notifies.org\/DOI\/pdf\/10.1287\/opere”。2020.2013“,“content-type”:“unspecified”,“content-version”:“vor”,“intended-application“:”similarity-checking“}],”deposed“:{”date-parts“:[2023,4,2],”date-time“:”2023-04-02T15:32:03Z“,”timestamp“:1680449523000},”score“:1,”resource“:{primary”:{“URL”:“https:\/\/pubsonline.notifies.org\/doi\/10.1287\/opere.2020.2013”},“subtitle”:[],“shorttitle”:[],“issued”:{“date-part”rts“:[[2021,3]]},”引用计数“:39,”日志问题“:{”问题“:“2”,“published-print”:{“date-parts”:[[2021,3]]}},“alternative-id”:[“10.1287\/opere.2020.2013”],“URL”:“http://\/dx.doi.org\/10.1287\/oper.e020.2013”,“relationship”:{},”ISSN“:[”0030-364X“,”1526-5463“],”问题类型“:[{”值“0030-364 X”,“type”:“打印”},{“值”:“1526-5463”,“类型”:“电子”}],“主题”:[],“发布”:{”日期部分“:[[2021,3]]}}}