×

两级单调多级推荐系统。 (英语) Zbl 1493.62379号

小结:推荐系统学习同时预测所有用户对许多项目的特定用户偏好或意图,根据相对较少的观察结果提出个性化建议。一个中心问题是如何利用三方交互,即单调事件链上的用户-项目-阶段依赖,以提高预测准确性。例如,在文章共享数据集中会出现单调的事件链,其中“follow”动作意味着“like”动作,而“like“动作又意味着“view”动作。在本文中,我们利用表征单调事件链的两级单调特性开发了一个多级推荐系统,用于个性化预测。特别是,我们推导了一个基于非负加性潜在因子模型的大边缘分类器,该分类器在存在高百分比的缺失观测值的情况下,尤其是在阶段之间,减少了个性化预测的模型参数数量,同时保证了预测的一致性。在此基础上,我们推导了一个正则化成本函数来学习不同阶段的用户特定行为,将决策函数与数值和类别协变量联系起来,以建模用户-项目-阶段交互。在计算上,我们推导了一种基于分块坐标下降的算法。理论上,我们表明,与单独处理每个阶段的标准方法和仅利用一级单调性的序数方法相比,两级单调性提高了学习的准确性。最后,该方法与现有的仿真方法和文章共享数据集进行了比较。

MSC公司:

62小时30分 分类和区分;聚类分析(统计方面)
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Bhaskar,S.A.量化测量的概率低秩矩阵完成。机器学习研究杂志17,1(2016),2131-2164·Zbl 1395.62120号
[2] Bi,X.,Qu,A.和Shen,X.多层张量因式分解及其在推荐系统中的应用。统计年鉴46,6B(2018),3308-3333·Zbl 1454.62511号
[3] Cawley,G.C.和Talbot,N.L.关于模型选择中的过度拟合和性能评估中的后续选择偏差。机器学习研究杂志11,2010年7月,2079-2107·Zbl 1242.62051号
[4] Chen,B.,He,S.,Li,Z.,and Zhang,S.最大块改进和多项式优化。SIAM优化杂志22, 1 (2012), 87-107. ·Zbl 1250.90069号
[5] Cheng,C.、Xia,F.、Zhang,T.、King,I.和Lyu,M.R.梯度增强因子分解机。第八届ACM推荐系统会议记录(2014),第265-272页。
[6] Cortes,C.和Vapnik,V.支持向量网络。机器学习20, 3 (1995), 273-297. ·Zbl 0831.68098号
[7] Crammer,K.和Singer,Y.恶搞排名。神经信息处理系统研究进展(2002),第641-647页。
[8] Dai,B.、Shen,X.、Wang,J.和Qu,A.,个性化预测的可扩展协作排名。美国统计协会杂志(2019年1月)。
[9] Dai,B.、Wang,J.、Shen,X.和Qu,A.平滑邻域推荐系统。机器学习研究杂志20, 16 (2019), 1-24. ·兹比尔1483.68292
[10] 爱德华兹。图形建模简介《施普林格科学与商业媒体》,2012年。
[11] 弗里德曼,J.H.贪婪函数近似:梯度增强机。统计年鉴(2001), 1189-1232. ·Zbl 1043.62034号
[12] Giné,E.,Koltchinskii,V.等人。比率型经验过程的浓度不等式和渐近结果。概率年鉴34, 3 (2006), 1143-1216. ·Zbl 1152.60021号
[13] Haeffele,B.D.和Vidal,R.张量因子分解、深度学习及其他领域的全局最优性。arXiv预打印arXiv:1506.07540(2015年)。
[14] He,X.,Liao,L.,Zhang,H.,Nie,L第26届万维网国际会议记录(2017),第173-182页。
[15] 科尔钦斯基。经验风险最小化和稀疏恢复问题中的Oracle不等式:圣弗洛尔概率经济学院XXXVIII-2008第2033卷。施普林格科学与商业媒体,2011年·Zbl 1223.91002号
[16] Koren,Y.因子分解满足邻域:一个多方面的协作过滤模型。第14届ACM SIGKDD知识发现和数据挖掘国际会议论文集(2008),第426-434页。
[17] Le,Q.和Mikolov,T.句子和文档的分布式表示。国际机器学习会议(2014),第1188-1196页。
[18] Mazumder,R.、Hastie,T.和Tibshirani,R.学习大型不完备矩阵的谱正则化算法。机器学习研究杂志11(2010), 2287-2322. ·Zbl 1242.68237号
[19] McCullagh,P.和Nelder,J.A。广义线性模型劳特利奇,2019年。
[20] Schmidhuber,J.《神经网络中的深度学习:概述》。神经网络61(2015), 85-117.
[21] Shen,X.,Tseng,G.C.,Zhang,X.和Wong,W.H.On(ψ)-学习。美国统计协会杂志98, 463 (2003), 724-734. ·兹比尔1052.62095
[22] Sun,W.W.,Lu,J.,Liu,H.,and Cheng,G.可证明稀疏张量分解。英国皇家统计学会杂志:B辑(统计方法)79, 3 (2017), 899-916. ·Zbl 1411.62158号
[23] Suphavilai,C.、Bertrand,D.和Nagarajan,N.使用推荐系统预测癌症药物反应。生物信息学34, 22 (2018), 3907-3914.
[24] Tang,X.,Bi,X.和Qu,A.个体化多层张量学习及其在成像分析中的应用。美国统计协会杂志115, 530 (2020), 836-851. ·兹比尔1445.62155
[25] Tran,T.、Phung,D.Q.和Venkatesh,S.推荐系统中顺序偏好的顺序决策方法。第26届AAAI人工智能会议(2012).
[26] Tseng,P.不可微极小化块坐标下降法的收敛性。优化理论与应用杂志109, 3 (2001), 475-494. ·Zbl 1006.65062号
[27] Tsybakov,A.B.等人,《统计学习中分类器的最佳聚合》。统计年鉴32, 1 (2004), 135-166. ·Zbl 1105.62353号
[28] Wan,M.和McAuley,J.关于单调行为链的项目建议。第十二届ACM推荐系统会议记录(2018),ACM,第86-94页。
[29] Wang,J.、Wong,R.K.、Mao,X.和Chan,K.C.G.无模型加权矩阵完成。第38届机器学习国际会议论文集(2021)。
[30] Weinberger,K.,Dasgupta,A.,Attenberg,J.,Langford,J.和Smola,A.大型多任务学习的特征散列。arXiv预印本arXiv:0902.2206(2009).
[31] Wong、W.H.、Shen和Xiaotong。筛极大似然比和收敛速度的概率不等式。统计年鉴23, 2 (1995), 339-362. ·Zbl 0829.62002号
[32] Wright,S.J.坐标下降算法。数学编程151, 1 (2015), 3-34. ·Zbl 1317.49038号
[33] Zhang,C.和Liu,Y.基于多类别角度的大边缘分类。生物特征101, 3 (2014), 625-640. ·Zbl 1335.62110号
[34] Zhu,J.和Hastie,T.Kernel logistic回归和输入向量机。神经信息处理系统研究进展(2002),第1081-1088页。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。