×

多层张量因式分解及其在推荐系统中的应用。 (英语) 兹比尔1454.62511

摘要:推荐系统已被电子商务和娱乐行业广泛采用,用于进行个性化预测和推荐,这有利于消费者,提高商业智能。在本文中,我们提出了一种新颖的张量推荐系统方法,即多层推荐引擎(REM)。该方法利用张量响应的结构来整合来自多种模式的信息,并创建额外的嵌套潜在因素层来适应受试者之间的依赖性。一个主要优点是,在缺乏新客户、新产品或新环境信息的情况下,所提出的方法能够解决“冷启动”问题。具体而言,它通过子组信息提供更有效的建议。为了实现可扩展的计算,我们为该方法开发了一种新的算法,该算法将最大块改进策略引入到循环块坐标渐变算法中。理论上,我们研究了从任意初始点收敛和局部收敛的算法性质,以及估计参数的渐近一致性。最后,将提出的方法应用于模拟和IRI营销数据中,获得了1.16亿个产品销售观察值。数值研究表明,该方法优于现有文献中的竞争对手。

MSC公司:

第60页 统计学在工程和工业中的应用;控制图
15A69号 多线性代数,张量演算
90C26型 非凸规划,全局优化
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Adomavicius,G.和Tuzhilin,A.(2005)。迈向下一代推荐系统:对最先进技术和可能扩展的调查。IEEE传输。知识。数据工程17 734–749。
[2] Adomavicius,G.和Tuzhilin,A.(2011)。上下文软件推荐系统。在推荐系统手册217–253中。柏林施普林格·Zbl 1060.68672号
[3] Aswani,A.(2016)。低秩近似和正张量补全。SIAM J.矩阵分析。申请37 1337–1364·Zbl 1380.90216号 ·doi:10.1137/16M1078318
[4] Bhojanapalli,S.和Sanghavi,S.(2015)。张量的一种新采样技术。预印本。可从arXiv:1502.05023获得·兹比尔1371.68320
[5] Bi,X.,Qu,A.和Shen,X.(2018)。补充“多层张量因式分解及其在推荐系统中的应用”DOI:10.1214/17-AOS1659SUPP·兹比尔1454.62511
[6] Bi,X.,Qu,A.,Wang,J.和Shen,X.(2017)。一个特定于组的推荐系统。J.Amer。统计师。协会112 1344–1353。
[7] Bobadilla,J.、Ortega,F.、Hernando,A.和Gutiérrez,A.(2013)。推荐系统调查。知识-基于系统46 109–132。
[8] Bronnenberg,B.J.、Kruger,M.W.和Mela,C.F.(2008)。数据库纸张—IRI营销数据集。作记号。科学27 745–748。
[9] Chen,B.、He,S.、Li,Z.和Zhang,S.(2012)。最大块改进和多项式优化。SIAM J.Optim.22 87–107·Zbl 1250.90069号 ·doi:10.1137/10834524
[10] Chi,E.C.和Kolda,T.G.(2012年)。关于张量、稀疏性和非负因子分解。SIAM J.矩阵分析。申请33 1272-1299·Zbl 1262.15029号 ·数字对象标识代码:10.1137/10859063
[11] Colombo-Mendoza,L.O.、Valencia-García,R.、Rodríguez-González,a.、Alor-Hernández,G.和Samper-Shapater,J.J.(2015)。RecomMetz:一个基于上下文的电影放映时间移动推荐系统。专家系统。申请42 1202–1222。
[12] de Silva,V.和Lim,L.-H.(2008年)。张量秩和最佳低秩近似问题的不适定性。SIAM J.矩阵分析。申请号:30 1084–1127·Zbl 1167.14038号 ·数字对象标识码:10.1137/06066518X
[13] DeVore,R.A.和Lorentz,G.G.(1993)。构造近似。柏林施普林格·Zbl 0797.41016号
[14] Fang,Y.和Wang,J.(2012)。通过引导方法选择簇数。计算。统计师。数据分析56 468–477·Zbl 1239.62076号 ·doi:10.1016/j.csda.2011.09.003
[15] Feuerverger,A.、He,Y.和Khatri,S.(2012年)。Netflix挑战的统计意义。统计师。科学27 202–231·兹比尔1330.62090 ·doi:10.1214/11-TS368
[16] 《福布斯》,P.和朱M.(2011)。推荐系统中基于内容的矩阵分解:配方推荐实验。第五届ACM推荐系统会议记录261-264。纽约ACM。
[17] Goldberg,K.、Roeder,T.、Gupta,D.和Perkins,C.(2001)。Eigentaste:一种恒定时间的协同过滤算法。信息检索4 133–151·Zbl 0989.68052号 ·doi:10.1023/A:101149012209
[18] Karatzoglou,A.、Amatriain,X.、Baltrunas,L.和Oliver,N.(2010年)。多维推荐:上下文软件协同过滤的N维张量因子分解。第四届ACM推荐系统会议论文集79-86。纽约ACM。
[19] Kolda,T.G.和Bader,B.W.(2009年)。张量分解及其应用。SIAM版次51 455–500·Zbl 1173.65029号 ·doi:10.1137/07070111X
[20] Koren,Y.(2010)。具有时间动态的协同过滤。Commun公司。ACM53 89–97。
[21] Kruskal,J.B.(1977年)。三路数组:三线性分解的秩和唯一性,应用于算术复杂性和统计学。线性代数应用.18 95–138·Zbl 0364.15021号 ·doi:10.1016/0024-3795(77)90069-6
[22] Laird,N.M.和Ware,J.H.(1982年)。纵向数据的随机效应模型。生物统计学38 963–974·Zbl 0512.62107号 ·doi:10.2307/2529876
[23] Land,A.H.和Doig,A.G.(1960年)。解决离散编程问题的自动方法。计量经济学28 497–520·Zbl 0101.37004号 ·doi:10.2307/1910129
[24] Li,L.和Zhang,X.(2017)。节俭张量反应回归。J.Amer。统计师。协会112 1131–1146。
[25] Li,Z.、Suk,H.-I.、Shen,D.和Li,L.(2016)。阿尔茨海默病研究的稀疏多响应张量回归与多变量临床评估。IEEE传输。医学图像35 1927年至1936年。
[26] Li,Z.、Uschmajew,A.和Zhang,S.(2015)。关于最大块改进方法的收敛性。SIAM J.Optim.25 210–233·Zbl 1355.65077号 ·doi:10.1137/130939110
[27] Miranda,M.、Zhu,H.和Ibrahim,J.G.(2015)。TPRM:张量分配回归模型及其在成像生物标志物检测中的应用。预印本。可在arXiv:1505.05482购买。
[28] Nguyen,J.和Zhu,M.(2013)。推荐系统中基于内容的矩阵分解技术。统计分析。数据最小值6286–301。
[29] Nguyen,T.V.、Karatzoglou,A.和Baltrunas,L.(2014)。用于上下文软件推荐的高斯过程分解机。第37届国际ACM SIGIR信息检索研究与开发会议论文集63-72。纽约ACM。
[30] Paatero,P.(1999)。多线性引擎——一个用于解决多线性问题的表驱动最小二乘程序,包括双向平行因子分析模型。J.计算。图表。统计8 854–888。
[31] Paatero,P.(2000)。退化PARAFAC模型的构建与分析。《化学杂志》.14 285–299。
[32] Palmisano,C.、Tuzhilin,A.和Gorgoglione,M.(2008)。使用上下文改进个性化应用程序中客户的预测建模。IEEE传输。知识。数据工程.20 1535–1549。
[33] Park,S.-T.,Pennock,D.,Madani,O.,Good,N.和DeCoster,D.(2006)。天真的过滤机器人,提供强大的冷启动建议。第十二届ACM SIGKDD知识发现和数据挖掘国际会议论文集。ACM 699–705。
[34] Rendle,S.(2012)。带有libFM的分解机。ACM事务处理。智力。系统。Technol.3 57.技术。
[35] Rendle,S.、Gantner,Z.、Freudenthaler,C.和Schmidt-Thieme,L.(2011年)。使用因子分解机的快速上下文感知推荐。第34届国际ACM SIGIR信息检索研究与开发会议论文集635-644。纽约ACM。
[36] Salakhutdinov,R.、Mnih,A.和Hinton,G.(2007年)。用于协作过滤的受限Boltzmann机器。第24届机器学习国际会议论文集791-798。纽约ACM。
[37] 沈欣(1998)。论刑罚的方法。统计师。Sinica8 337–357·Zbl 0907.62046号
[38] Shen,X.、Tseng,G.C.、Zhang,X.和Wong,W.H.(2003)。关于(ψ)-学习。J.Amer。统计师。协会98 724–734·Zbl 1052.62095号 ·doi:10.1198/0162145000000639
[39] Shi,Y.、Larson,M.和Hanjalic,A.(2014)。超越用户-项目矩阵的协作过滤:对最新技术和未来挑战的调查。ACM计算调查(CSUR)47 3。
[40] Srebro,N.、Alon,N.和Jaakkola,T.S.(2005)。低秩矩阵协同预测的广义误差界。神经信息处理系统进展17 5–27。
[41] Verbert,K.、Manouselis,N.、Ochoa,X.、Wolpers,M.、Drachsler,H.、Bosnic,I.和Duval,E.(2012)。用于学习的上下文软件推荐系统:调查和未来挑战。IEEE学习技术汇刊5 318–335。
[42] Wang,J.(2010)。通过交叉验证一致选择集群数量。生物特征97 893–904·Zbl 1204.62104号 ·doi:10.1093/biomet/asq061
[43] Wang,P.、Tsai,G.和Qu,A.(2012年)。具有未指定随机效应分布的混合效应模型的条件推理函数。J.Amer。统计师。协会107 725–736·Zbl 1261.62068号 ·doi:10.1080/01621459.2012.665199
[44] Welling,M.和Weber,M.(2001年)。正张量因式分解。模式识别。第22页,1255–1261·Zbl 0990.68123号 ·doi:10.1016/S0167-8655(01)00070-8
[45] Xiong,L.、Chen,X.、Huang,T.-K、Schneider,J.和Carbonell,J.G.(2010)。采用贝叶斯概率张量分解的时间协同滤波。2010年SIAM数据挖掘国际会议论文集SIAM,宾夕法尼亚州费城。
[46] Yuan,M.和Zhang,C.-H.(2016)。非相干张量范数及其在高阶张量完备中的应用。预印本。可从arXiv:1606.03504获得。
[47] Yuan,M.和Zhang,C.-H.(2016)。基于核范数最小化的张量补全。已找到。计算。数学16 1031–1068·Zbl 1378.90066号 ·doi:10.1007/s10208-015-9269-5
[48] Zhou,H.、Li,L.和Zhu,H.(2013)。张量回归在神经影像数据分析中的应用。J.Amer。统计师。协会108 540–552·Zbl 06195959号 ·doi:10.1080/01621459.2013.776499
[49] Zhu,Y.、Shen,X.和Ye,C.(2016)。潜在因素模型中的个性化预测和稀疏性追求。J.Amer。统计师。协会111 241–252·doi:10.1080/01621459.2014.999158
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。