内森·卡卢斯;马德琳·乌德尔 高维度的动态产品组合个性化。 (英语) Zbl 1451.90077号 操作。物件。 68,第4期,1020-1037(2020). 摘要:我们研究了具有大量异质人群和广泛产品阵列的动态分类个性化问题,并证明了结构化先验对于有效、高效的大规模个性化的重要性。产品组合个性化是指为每个人(类型)选择最佳的产品、广告或其他产品(项目)组合,以实现收入最大化的问题。这个问题是电子商务和在线广告收入管理的核心,在这些领域,商品和类型都可能达到数百万。我们将动态分类个性化问题描述为具有(m)上下文(类型)和指数级多武器(项目分类)的离散控制土匪。我们假设每个类型的首选项都遵循一个带有\(n \)参数的简单参数模型。总之,存在\(mn\)参数,现有文献表明,最优后悔等级为\(mn\)。然而,估计这么多参数所需的数据比大多数收入管理应用程序中可用的数据大几个数量级;在这些模型下,最优后悔率高得令人无法接受。在本文中,我们将一个自然结构强加给这个问题——一个小的潜在维度,或低秩。在静态设置中,我们表明,只要模型是可学习的,就可以使用节省时间和内存的优化算法,从极少数交互中高效地学习该模型。在动态设置中,我们表明,结构软件动态分类个性化可能会产生比结构-忽略方法小一个数量级的遗憾。我们通过实证验证了我们的理论结果。电子伴侣可在https://doi.org/10.1287/opre.2019.1948网址. 引用于8文件 MSC公司: 90B50型 管理决策,包括多个目标 91B42型 消费者行为、需求理论 关键词:个性化;背景盗贼;商品分类计划;离散选择;高维统计;一阶优化;推荐系统;矩阵完成 软件:皮格尔姆;HOGWILD公司;低等级模型 PDF格式BibTeX公司 XML格式引用 \textit{N.Kallus}和\textit{M.Udell},Oper。第68号决议,第4号,1020--1037(2020;Zbl 1451.90077) 全文: 内政部 arXiv公司 参考文献: [1] Agrawal S、Avadhanula V、Goyal V、Zeevi A(2019)《Mnl-batter:产品组合选择的动态学习方法》。运营收入.67(5):1453-1485.谷歌学者·Zbl 1444.90021号 [2] Bastani H,Bayati M(2019)高维协变量在线决策。操作。雷斯.68(1):276-294谷歌学者·Zbl 1445.90042号 [3] Bernstein F,KöK AG,Xie L(2015)《库存有限的动态产品组合定制》。制造服务运营。管理17(4):427-619链接,谷歌学者 [4] Bernstein F、Modaresi S、SauréD(2019)数据驱动分类个性化的动态聚类方法。管理科学.65(5):1949-2443.谷歌学者 [5] Bertsimas D,Kallus N(2020)《从预测到规定分析》。管理科学.66(3):1025-1044谷歌学者 [6] Bhojanapalli S,Kyrillidis A,Sanghavi S(2016),降低凸性以实现更快的半定优化。预印本,提交日期:年月日,https://arxiv.org/abs/1509.03917.谷歌学者 [7] Blanchet J、Gallego G、Goyal V(2016)选择模型的马尔可夫链近似。操作。雷斯.64(4):886-905.谷歌学者·Zbl 1348.90614号 [8] Bubeck S,Cesa-Bianchi N(2012)随机和非随机多武器强盗问题的后悔分析。机器学习5(1):1-122.Crossref,谷歌学者·Zbl 1281.91051号 ·doi:101561/2200000024 [9] Cai JF,Candès EJ,Shen Z(2010)矩阵补全的奇异值阈值算法。SIAM J.Optim公司。20(4):1956-1982.Crossref,谷歌学者·Zbl 1201.90155号 ·doi:10.1137/080738970 [10] Candès E,《Y计划》(2010年),《有噪音的矩阵完工》。程序。电气与电子工程师协会98(6):925-936.谷歌学者 [11] Candès E,Recht B(2009)通过凸优化实现精确矩阵补全。基础计算。数学。9(6):717-772.Crossref,谷歌学者·Zbl 1219.90124号 ·doi:10.1007/s10208-009-9045-5 [12] Candès E,Tao T(2010)凸松弛的力量:近最优矩阵完成。IEEE传输。通知。理论56(5):2053-2080.谷歌学者交叉引用·Zbl 1366.15021号 ·doi:10.1109/TIT.2010.2044061 [13] Caro F,Gallien J(2007),季节性消费品需求学习动态分类。管理科学。53(2):276-292.链接,谷歌学者·Zbl 1232.91420号 [14] Davenport M,Plan Y,van den Berg E,Wootters M(2014)1位矩阵补全。通知。推断3(3):189-223.Crossref,谷歌学者·Zbl 1309.62124号 ·doi:10.1093/imaiai/iau006 [15] Davis JM、Gallego G、Topalogu H(2014),嵌套logit模型变体下的产品组合优化。操作。物件。62(2):250-273.Link,谷歌学者·Zbl 1295.90076号 [16] DeShazo J,Fermo G(2002)为陈述偏好方法设计选择集:复杂性对选择一致性的影响。J.环境。经济。管理44(1):123-143.Crossref,谷歌学者·Zbl 1024.91005号 ·doi:10.1006/jeem.20011.199 [17] Désir A,Goyal V,Zhang J(2014)容量受限产品组合优化的近优算法。预印本,于12月29日提交,http://dx.doi.org/10.2139/ssrn.2543309.谷歌学者 [18] Farias VF、Jagabathula S、Shah D(2013)有限数据下建模选择的非参数方法。管理科学。59(2):305-322.Link,谷歌学者 [19] Funk S(2006)Netflix更新:在家试试这个。2016年10月18日访问,http://silter.org/simon/journal/20061211.html。谷歌学者 [20] Goldenshluger A,Zeevi A(2013)线性响应土匪问题。随机系统3(1):230-261.Link,谷歌学者·Zbl 1352.91009号 [21] Golrezaei N,Nazerzadeh H,Rusmevichientong P(2014)个性化产品组合的实时优化。管理科学。60(6):1532-1551.谷歌学者链接 [22] Gunasekar S,Ravikumar P,Ghosh J(2014)结构约束下的指数族矩阵完成。Xing EP,Jebara T编辑,Proc。第31届国际。Conf.机器学习。32(6月):1917-1925.谷歌学者 [23] Hazan E(2008)半定规划的稀疏近似解。Laber ES,Bornstein C,Faria LT,eds.LATIN 2008:理论信息学(Springer-Verlag,Berlin,Heidelberg),306-316.谷歌学者·Zbl 1136.90430号 [24] Hotelling H(1933)将复杂的统计变量分析为主成分。心理学杂志编辑。24(6):417-441.Crossref,谷歌学者·联合财务报表59.1182.04 ·doi:10.1037/h0071325 [25] Jagabathula S、Subramanian L、Venkataraman A(2017)用于细分客户的基于模型的投影技术。预印本,1月25日提交,https://arxiv.org/abs/1701.07483谷歌学者 [26] Jain P、Netrapalli P、Sanghavi S(2013)使用交替最小化完成低秩矩阵。程序。第45届ACM年度交响曲。理论计算。(ACM,纽约),665-674.谷歌学者·Zbl 1293.65073号 [27] Kahneman D,Tversky A(1979)《前景理论:风险下的决策分析》。计量经济学47(2):263-292.Crossref,谷歌学者·Zbl 0411.90012号 ·doi:10.2307/1914185 [28] Kallus N,Udell M(2016)《揭示规模偏好:从产品组合选择中学习个性化偏好》。程序。2016年ACM经济大会。计算。(ACM,纽约),821-837.谷歌学者 [29] Keshavan R,Montanari A,Oh S(2009),《从嘈杂的条目中完成矩阵》。Bengio y,Schuurmans d,Lafferty JD,Williams CKI,Culotta A,eds.神经信息处理系统进展,第22卷(纽约州Red Hook市Curran Associates),952-960.谷歌学者 [30] Keshavan RH,Montanari A,Oh S(2010),《完成矩阵》中的几个条目。IEEE传输。通知。理论56(6):2980-2998.Crossref,谷歌学者·Zbl 1366.62111号 ·doi:10.1109/TIT.2010.2046205 [31] Lai TL,Robbins H(1985)渐近有效自适应分配规则。高级应用数学.6(1):4-22.Crossref,谷歌学者·Zbl 0568.62074号 ·doi:10.1016/0196-8858(85)90002-8 [32] Li G,Rusmevichienton P,Topalogu H(2015)d级嵌套logit模型:产品组合和价格优化问题。操作。物件。63(2):325-342.链接,谷歌学者·Zbl 1327.90315号 [33] Lu Y,Negahban SN(2014)使用核规范正则化的个体等级聚合。Allerton Conf.Comm.Control计算。,伊利诺伊州乌尔班纳,1473-1479年。谷歌学者 [34] 卢斯DR(1959)个人选择行为的理论分析(威利,纽约)。谷歌学者·Zbl 0093.31708号 [35] Maillard OA,Mannor S(2014)《潜在的强盗》。国际。Conf.机器学习,136-144.谷歌学者 [36] McFadden D(1973)定性选择行为的条件logit分析。Zarembka P编辑。经济学前沿(纽约学术出版社),105-142.谷歌学者 [37] McFadden D(1980)产品概率选择的计量经济学模型。J.总线。53(3):S13-S29.Crossref,谷歌学者·doi:10.1086/296093 [38] McFadden D,Train K(2000)离散响应的混合mnl模型。J.应用。计量经济学15(5):447-470.谷歌学者(Google Scholar)交叉引用·doi:10.1002/1099-1255(200009/10)15:5<447::AID-JAE570>3.0.CO;2-1 [39] Megiddo N(1979)有理目标函数组合优化。数学。操作。物件。4(4):414-424.链接,谷歌学者·Zbl 0425.90076号 [40] Negahban S,Wainwright MJ(2011),带噪声和高维缩放的(近)低秩矩阵估计。安。统计师。39(2):1069-1097.Crossref,谷歌学者·兹比尔1216.62090 ·doi:10.1214/10-AOS850 [41] Negahban SN,Ravikumar P,Wainwright MJ,Yu B(2012)使用可分解正则化子对M估计进行高维分析的统一框架。统计师。科学。27(4):538-557.Crossref,谷歌学者·Zbl 1331.62350号 ·doi:10.1214/12-STS400 [42] Oh S,Thekumparampil KK,Xu J(2015)从序数数据中合作学习偏好。Cortes C,Lawrence ND,Lee DD,Sugiyama M,Garnett R,eds.《神经信息处理系统进展》,第28卷(Curran Associates,Red Hook,NY),1909-1917年。谷歌学者 [43] Orabona F,Argyriou A,Srebro N(2012)《棱镜:近端迭代平滑算法》。预印本,6月11日提交,https://arxiv.org/abs/1206.2372.谷歌学者 [44] Parikh N,Boyd S(2014)近似算法。基金会趋势优化.1(3):127-239.Crossref,谷歌学者·数字对象标识代码:10.1561/24000003 [45] Perchet V,Rigollet P(2013)具有协变量的多臂强盗问题。安。统计师。41(2):693-721.Crossref,谷歌学者·Zbl 1360.62436号 ·doi:10.1214/13-AOS1101 [46] Recht B,Fazel M,Parrilo P(2010)通过核范数最小化保证线性矩阵方程的最小秩解。SIAM版本.52(3):471-501.谷歌学者·Zbl 1198.90321号 [47] Recht B,Re C,Wright S,Niu F(2011)Hogwild:一种并行化随机梯度下降的无锁方法。Shawe-Taylor J,Zemel RS,Bartlett PL,Pereira F,Weinberger KQ,eds.神经信息处理系统进展,第22卷(纽约州Red Hook市Curran Associates),693-701.谷歌学者 [48] Rigollet P,Zeevi A(2010),具有协变量的非参数强盗。预印本,3月8日提交,https://arxiv.org/abs/1003.1630.谷歌学者 [49] Rusmevichienton P,Shen ZJM,Shmoys DB(2010)《基于多项式logit选择模型和能力约束的动态产品组合优化》。操作。物件。58(6):1666-1680.Link,谷歌学者·Zbl 1228.90170号 [50] Rusmevichientong P,Shmoys D,Tong C,Topalogu H(2014)具有随机选择参数的多项式logit模型下的产品组合优化。生产运营。管理23(11):2023-2039。Crossref,谷歌学者·doi:10.1111/poms.12191 [51] SauréD,Zeevi A(2013),具有需求学习的最优动态分类规划。制造服务运营。管理15(3):387-404.Link,谷歌学者 [52] Schuler A,Liu V,Wan J,Callahan A,Udell M,Stark D,Shah N(2016)使用广义低阶模型发现患者表型。太平洋交响乐团。生物计算机。2016年,夏威夷大岛,144-155。谷歌学者 [53] Slivkins A(2014)具有相似信息的背景盗贼。J.马赫。学习。物件。15(1):2533-2568谷歌学者·Zbl 1319.62013号 [54] 斯皮尔曼C(1904)《一般智力》,客观地确定和衡量。阿默尔。心理学杂志。15(2):201-292.谷歌学者Crossref·doi:10.2307/1412107 [55] Talluri KT,Van Ryzin GJ(2006)收益管理理论与实践《运筹学与管理科学国际丛书》,第68卷(Springer Science&Business Media,纽约)。谷歌学者 [56] Tropp JA(2012)随机矩阵和的用户友好型尾界。基础计算。数学。12(4):389-434.Crossref,谷歌学者·Zbl 1259.60008号 ·doi:10.1007/s10208-011-9099-z [57] Udell M,Horn C,Zadeh R,Boyd S(2016)广义低秩模型。基础趋势机器学习.9(1):1-118.Crossref,谷歌学者·Zbl 1350.68221号 ·数字对象标识代码:10.1561/9781680831412 [58] Udell M,Townsend A(2017)尼斯潜变量模型具有对数秩。预印本,5月21日提交,https://arxiv.org/abs/1705.07474v1.谷歌学者 [59] van Ryzin G,Vulcano G(2014)估计一般类非参数选择模型的市场发现算法。管理科学。61(2):281-300.Link,谷歌学者 [60] Williams HC(1977)关于旅游需求模型的形成和用户利益的经济评价措施。环境。规划A9(3):285-344.Crossref,谷歌学者·doi:10.1068/a090285 [61] 维滕·D·Zbl 1437.62658号 ·doi:10.1093/biostatistics/kxp008 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。