{“状态”：“确定”，“消息类型”：“工作”，“信息版本”：“1.0.0”，“邮件”：{“索引”：{“日期-部分”：[[2024,5,30]]，“日期-时间”：“2024-05-30T09:44:02Z”，“时间戳”：1717062242322}，“引用-计数”：39，“发布者”：“运筹学与管理科学研究所（INFORMS）”，“问题”：“2”，“内容-域”：{-“域”：[]，“交叉标记-限制”：false}，“short-container-title”：[“Operations Research”]，“published-print”：{“date-parts”：[[2021,3]]}，”抽象“：”每当新用户到来时，平台都会面临冷启动问题：即平台必须学习新用户的属性（探索），以便在未来更好地匹配他们（利用）。当推荐的项目数量有限时，平台应如何处理冷启动？例如，在就业机会有限的情况下，劳动力市场平台应该如何在工人的一生中为工人匹配工作？在这种情况下，每个工人都面临着一个多武器匪徒问题，再加上不同类型工作的有限供应。针对这个问题制定了一个解决方案。研究发现，该平台应为每种工作类型估计影子价格，并根据这些价格调整每个员工的报酬（i）以平衡早期学习与报酬，以及（ii）以在此后短期匹配它们<\/jats:p>“，”DOI“：”10.1287\/opere.2020.2013“，”type“：”journal-article“，”created“：{”date-parts“：[2021,1,7]]，”date-time“：”2021-01-07T14:40:13Z“，”timestamp“：1610030413000}，”page“：“作者”：[{“ORCID”：“http://\/orcid.org\/00000-0002-3960-0770“，”authenticated-orcid“：false，”given“：”Ramesh“，”family“：”Johari“，”sequence“：”first“，”affiliation“：[{”name“：”Stanford University，Stanford，California 94305；“}]}，{”orcid“：family“：”Kamble“，”sequence“：”additional“，”affiliation“：[{”name“：”伊利诺伊州芝加哥伊利诺伊大学信息与决策科学系，芝加哥，伊利诺伊60607；“}]}，{”ORCID“：”http://\/ORCID.org\/00000-0002-7221-357X“，”authenticated-ORCID“：false，”given“：“Yash”，“family”：“Kanoria”，“sequence”：“additional”，“affiliance”：[{“name”：“哥伦比亚商学院，纽约州纽约市，10027“}]}]，“成员”：“109”，“参考”：[{“key”：“B2”，”doi-asserted-by“：”crossref“，”unstructured“：”Agrawal S，Devanur NR（2014）《带凹奖赏和凸背包的匪徒》，第15届ACM Conf.Econom.Compute.（ACM，纽约），989\u20131006.“，”doi“：”10.1145\/2600057.2602844“}，{“key”：”B5“，”非结构化”：“Agrawal S，Goyal N（2012）多武器强盗问题的汤普森抽样分析。Mannor S、Srebro N、Williamson RC编辑。第25届年度Conf.Learn。理论（苏格兰爱丁堡），第23卷，39.1\u201339.26。“}，{“key”：“B8”，“doi-asserted-by”：“crossref”，“unstructured”：“Anderson R，Ashlagi I，Gamarnik D，Kanoria Y（2015）易货交易的动态模型。Proc.26 Annual ACM-SIAM Sympos.Discrete Algorithms（SIAM，Philadelphia），1925\u20131933。”，“doi”：“10.1137\/1.9781611973730.129”doi由“：”publisher断言，“doi”：“10.1214\/1005051604000000495”}，｛“key”：“B11”，“doi由”：“publisher断言”，“doi”：“10.1023\/A:101369704352”}，｛“key”：“B12”，“doi由”：“publisher断言”，“doi”：“10.1145\/2559152”}，｛“key”：“B14”，“doi由”：“crossref断言”，“nonstructured”：“Badanidiyuru A，Kleinberg R，Slivkins A（2013年）带背包的匪徒。程序。2013年IEEE第54届年度交响乐会。（IEEE，纽约），207\u2013216.“，”DOI“：”10.1109\/FOCS.2013.30“}，{“key”：“B15”，“unstructured”：“Badanidiyuru A，Langford J，Slivkins A（2014）Resourceful contextual batchants。Balcan MF，Feldman V，Szepesvari C，eds.Proc.27th Conf.Learn.Theory（西班牙巴塞罗那），第35卷，1109\u20131134.”}，“key“：”B16“，”DOI-asserted-by“：”publisher“，”Do I“：”10.1287\/opere.1080.0640“}，{“key”：“B17”，“doi-asserted-by”：“publisher”，“doi”：“10.1287\/opere.1120.1103”}，}“keys”：“B1 8”，“doi-asserte-by”：“publisher”，“DI:”10.1080\/01621459.1964.10482176 key“：”B21“，”非结构化“：”陈伟，王毅，袁毅（2013）组合多武器强盗：一般框架和应用。国际。Conf.机器学习。（亚特兰大），第28卷，151\u2013159.“｝，｛“key”：“B22”，“doi asserted by”：“publisher”，“doi”：“10.1016\/j.geb.2004.06.014”｝，｛“key”：“B23”，“nonstructured”：“Das S，Kamenica E（2005）双面强盗和约会市场。第19届国际联合人工智能会议（Morgan Kaufmann Publishers Inc.，Burlington，MA），947\u2013952.”｝，｛“key”：“B24”，“doi-asserted-by“：”publisher“，”doi“：”10.1016\/j.sorms.2015.03.001“}，{“key”：“B25”，“doi-assert-by”：“publisher”，“doi”：“10.1287\/mnsc.2013.1788”}，“key“：”B26“，”doi-assered-by“：”publisher“，”doi“：I“：”10.1137\/060670705“}，{“key”：“B28”，“doi-asserted-by”：“publisher”，“doi”：“10.1287\/opere.2018.1755“}，{“key”：“B29”，“unstructured”：“Fershtman D，Pavan A（2017）匹配拍卖。技术报告0144，经济系，产业组织研究中心，伊利诺伊州埃文斯顿市。”}，“key“：”B30“，”doi-asserted-by“：”crossref“，”unstructure“：”Gai Y，Krishnamachari B，Jain R（2010）学习认知无线电网络中的多用户信道分配：一个组合多臂盗贼公式。IEEE交响乐。新前沿动态光谱（IEEE，纽约），1\u20139.“，”DOI“：”10.1109\/DYSPAN.2010.5457857“}，”key“：”B31“，”DOI-asserted-by“：”publisher“，”DOI“：“10.1109\/TNET.2011.2181864”}，“”key”：“B33”，“”DOI-sserted-by”：“crossref”，“unstructured”：“Hsu WK，Xu J，Lin X，Bell MR（2018）将在线学习和自适应控制集成到具有不确定收益的排队系统中。2018年通知。理论应用。研讨会（ITA）（IEEE，纽约），1\u20139.”，“DOI”：“10.1109\/ITA.2018.8503124”}，{“key”：“B34”，“unstructured”：“Hu M，Zhou Y（2018）Dynamic type matching.Preprint，提交日期：11月16日，https:\/\/arxiv.org\/abs\/1811.07048.”}“key”：“B36”，“DOI-asserted-by”：“publisher“，”DOI“：”10.1007\/s42973-019-00004-z“}，{“key”：“B38”，“DOI-asserted-by”：“publisher”，“DOI”：“10.1016\/0196-8858（85）90002-8”}，“key“：”B39“，”unstructured“：”Liu K，Zhao Q（2012）未知和随机变化链路状态下的自适应最短路径路由。Proc.10th Internat.Sympos.Model.Optim.Mobile Ad Hoc Wireless Networks（WiOpt）（IEEE，纽约），232\u2013237.“}，{”key“：”B40“，”doi-asserted-by“：”publisher“，”doi“：”10.1287\/oper.2017.680“}”，{“问题”：“4”，“key”：“B41”，“首页”：“265”，“卷”：“8”，“作者”：“Mehta A”，“年份”：“2012”，“新闻标题”：“理论计算科学”}，}，”issue“：”1“，”key“：”B45“，”首页“：”2442“，”卷“：”17“，”作者“：”俄罗斯D“，”年份“：”2016“，”journal-title“：”J.机器学习。研究“}，{”key“：”B46“，”doi-asserted-by“：”publisher“，”doi“：”10.1287\/msom.2013.0429“}、{”key“：“B47”，”doo-asserted-by“：“publisher”，“doi”：“10.1561\/1300000007”}、}“key”：“B48”，“doi-assert-by”：“publiser”，”doi:“10.1007\/BF01753437”}，}“key”：”B49“，”volume-title“：”互联网拥塞控制数学“，”author“：”Srikant R“，”year“：”2012“}，{”key“：”B50“，”doi-asserted-by“：”publisher“，”doi“：”10.1016\/j.jet.2004.10.005“}，{“key”：“B51”，”doo-asserted-by“：“crossref”，“unstructured”：“Tassiulas L，Ephremides A（1990）约束排队系统的稳定性和多跳无线网络中最大吞吐量的调度策略。第29届IEEE Conf.Decision Control（IEEE，纽约），2130\u20132132.“，”DOI“：”10.1109\/CCDC.1990.204000“}，{“key”：“B52”，“DOI-asserted-by”：“publisher”，“DOI”：“10.1287\/opere.2013.1245”}]，“container-title”：[“Operations Research”]，“original-title“：[]，“language”：“en”，“link”：[{“URL”：“https:\/\/pubsonline.notifies.org\/DOI\/pdf\/10.1287\/opere”。2020.2013“，“content-type”：“unspecified”，“content-version”：“vor”，“intended-application“：”similarity-checking“}]，”deposed“：{”date-parts“：[2023,4,2]，”date-time“：”2023-04-02T15:32:03Z“，”timestamp“：1680449523000}，”score“：1，”resource“：{primary”：{“URL”：“https:\/\/pubsonline.notifies.org\/doi\/10.1287\/opere.2020.2013”}，“subtitle”：[]，“shorttitle”：[]，“issued”：{“date-part”rts“：[[2021,3]]}，”引用计数“：39，”日志问题“：{”问题“：“2”，“published-print”：{“date-parts”：[[2021,3]]}}，“alternative-id”：[“10.1287\/opere.2020.2013”]，“URL”：“http://\/dx.doi.org\/10.1287\/oper.e020.2013”，“relationship”：{}，”ISSN“：[”0030-364X“，”1526-5463“]，”问题类型“：[{”值“0030-364 X”，“type”：“打印”}，{“值”：“1526-5463”，“类型”：“电子”}]，“主题”：[]，“发布”：{”日期部分“：[[2021,3]]}｝｝