文件Zbl 1330.62090-zbMATH Open

Netflix挑战的统计意义。（英语） Zbl 1330.62090号

统计科学。 27，第2期，202-231（2012）.

总结：受Netflix竞赛遗产的启发，我们概述了从我们自己和他人的努力中学到的关于协作过滤和推荐系统问题的知识。数据集包括约1亿部电影收视率（从1到5颗星），涉及约48万用户和约1.8万部电影；相关的评级矩阵约99%稀疏。目标是预测用户对电影的评分；能够准确做到这一点的系统具有重要的商业应用，尤其是在万维网上。我们详细讨论了“基线”建模、奇异值分解（SVD）以及kNN（最近邻）和神经网络模型的方法；还讨论了时间效应、交叉验证问题、集成方法和其他考虑因素。为了寻找新的模型，我们比较了现有的模型，并讨论了当参数空间的维数达到数百万时出现的惩罚和参数收缩等任务关键问题。虽然计算机科学和机器学习社区已经就这些问题开展了大量工作，但我们的目标是面向统计受众，并对从这组非凡的数据中吸取的教训进行主要的统计处理。

引用于11文件

MSC公司：

62F07型	统计排名和选择程序
62J07型	岭回归；收缩估计量
62小时30分	分类和区分；聚类分析（统计方面）
62J10型	方差和协方差分析（ANOVA）
62M15型	随机过程和谱分析的推断

关键词：

协同过滤;交叉验证;有效自由度;经验贝叶斯;集合方法;梯度下降;潜在因素;最近的邻居;Netflix竞赛;神经网络;惩罚;预测误差;推荐系统;受限Boltzmann机器;收缩，收缩;奇异值分解

软件：

PRMLT公司

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司欧几里得

参考文献：

[1]	ACM SIGKDD（2007）。2007年KDD杯和工作坊。可从获取。
[2]	Adomavicius，G.和Tuzhilin，A.（2005）。面向下一代推荐系统：对最新技术和可能扩展的调查。IEEE知识与数据工程汇刊17 634-749。
[3]	Barbieri，M.M.和Berger，J.O.（2004年）。最优预测模型选择。安。统计师。32 870-897. ·Zbl 1092.62033号 ·doi:10.1214/00905360400000023
[4]	Baron，A.（1984）。预测平方误差：自动模型选择的标准。《建模中的自组织方法》（S.Farrow编辑）。马塞尔·德克尔（Marcel Dekker），纽约。
[5]	Bell，R.和Koren，Y.（2007a）。Netflix大奖挑战的经验教训。ACM SIGKDD探索新闻稿9 75-79。
[6]	Bell，R.和Koren，Y.（2007b）。改进了基于邻居的协作过滤。2007年KDD杯和研讨会7-14。纽约ACM。
[7]	Bell，R.和Koren，Y.（2007c）。具有联合派生的邻域插值权重的可缩放协同过滤。程序中。第七届IEEE数据挖掘国际会议43-52。IEEE计算机学会，加利福尼亚州洛斯阿拉米托斯。
[8]	Bell，R.、Koren，Y.和Volinsky，C.（2007a）。在多个尺度上建模关系，以提高大型推荐系统的准确性。程序中。第13届ACM SIGKDD知识发现和数据挖掘国际会议95-104。纽约ACM。
[9]	Bell，R.、Koren，Y.和Volinsky，C.（2007b）。BellKor对Netflix奖的解决方案。可从获取。
[10]	Bell，R.、Koren，Y.和Volinsky，C.（2007c）。Chasing（1000000：我们如何获得Netflix进步奖。ASA统计与计算图形新闻稿18 4-12。）
[11]	Bell，R.、Koren，Y.和Volinsky，C.（2008）。BellKor 2008年Netflix奖解决方案。可从获取。
[12]	Bell，R.M.、Bennett，J.、Koren，Y.和Volinsky，C.（2009年）。百万美元的节目奖。IEEE频谱46 28-33。
[13]	Bennett，J.和Lanning，S.（2007年）。Netflix奖。程序中。2007年KDD杯和研讨会3-6。纽约ACM。
[14]	Berger，J.（1982）。贝叶斯稳健性和斯坦因效应。J.Amer。统计师。协会77 358-368·Zbl 0491.62030号 ·doi:10.2307/2287253
[15]	Bishop，C.M.（1995年）。模式识别的神经网络。纽约克拉伦登出版社·Zbl 0868.68096号
[16]	Bishop，C.M.（2006年）。模式识别和机器学习。纽约州施普林格·Zbl 1107.68072号
[17]	Breiman，L.（1996）。装袋预测器。机器学习26 123-140·Zbl 0858.68080号
[18]	Breiman，L.和Friedman，J.H.（1997）。在多元线性回归中预测多元反应（与讨论）。J.罗伊。统计师。Soc.序列号。B 59 3-54·Zbl 0897.62068号 ·doi:10.1111/1467-9868.00054
[19]	Burges，C.（1998年）。模式识别支持向量机教程。数据挖掘和知识发现2 121-167。
[20]	Candes，E.和Plan，Y.（2009年）。带噪声的矩阵完成。技术报告，加州理工学院。
[21]	Candes，E.和Tao，T.（2007）。Dantzig选择器：当\（p）远大于\（n）时的统计估计。安。统计师。35 2313-2351. ·Zbl 1139.62019号 ·doi:10.1214/09053606000001523
[22]	Canny，J.F.（2002）。通过因子分析与隐私协同过滤。程序中。第25届国际ACM SIGIR信息检索研究与开发年会238-245。纽约ACM。
[23]	Carlin，B.P.和Louis，T.A.（1996年）。数据分析的贝叶斯和经验贝叶斯方法。单声道。统计师。申请。普罗巴伯。69 . 查普曼和霍尔，伦敦·Zbl 0871.62012号
[24]	Casella，G.（1985年）。经验贝叶斯数据分析简介。阿默尔。统计师。39 83-87. ·doi:10.2307/2682801
[25]	Chien，Y.H.和George，E.（1999）。协同过滤的贝叶斯模型。在线程序。第7届国际人工智能与统计研讨会。佛罗里达州劳德代尔堡。
[26]	Christianini，N.和Shawe-Taylor，J.（2000）。支持向量机和其他基于内核的学习方法简介。剑桥大学出版社，剑桥。
[27]	Cohen，W.W.、Schapire，R.E.和Singer，Y.（1999）。学习排序。《人工智能研究》10 243-270（电子版）·Zbl 0915.68031号
[28]	Copas，J.B.（1983年）。回归、预测和收缩。J.罗伊。统计师。Soc.序列号。乙45 311-354·Zbl 0532.62048号
[29]	DeCoster，D.（2006年）。使用最大边际矩阵分解的集合进行协作预测。程序中。第23届国际机器学习大会249-256。纽约ACM。
[30]	Deerwester，S.C.、Dumais，S.T.、Landauer，T.K.、Furnas，G.W.和Harshman，R.A.（1990年）。通过潜在语义分析进行索引。美国信息科学学会杂志41 391-407。
[31]	Dempster，A.P.、Laird，N.M.和Rubin，D.B.（1977年）。通过EM算法获得不完整数据的最大似然性（带讨论）。J.罗伊。统计师。Soc.序列号。B 39 1-38·Zbl 0364.62022号
[32]	Efron，B.（1975）。有偏估计与无偏估计。数学进步。16 259-277. ·Zbl 0306.62010年 ·doi:10.1016/0001-8708（75）90114-0
[33]	Efron，B.（1983年）。估计预测规则的错误率：交叉验证的改进。J.Amer。统计师。协会78 316-331·Zbl 0543.62079号 ·doi:10.2307/2288636
[34]	Efron，B.（1986年）。预测规则的明显错误率有多大偏差？J.Amer。统计师。协会81 461-470·Zbl 0621.62073号 ·doi:10.2307/2892236
[35]	Efron，B.（1996）。结合可能性的经验贝叶斯方法（与讨论）。J.Amer。统计师。协会91 538-565·2018年8月68日 ·doi:10.2307/2291646
[36]	Efron，B.（2004）。预测误差的估计：协方差惩罚和交叉验证（附讨论）。J.Amer。统计师。协会99 619-642·Zbl 1117.62324号 ·doi:10.1198/016214500000692
[37]	Efron，B.和Morris，C.（1971）。限制贝叶斯和经验贝叶斯估值器的风险。贝叶斯案例。J.Amer。统计师。协会66 807-815·Zbl 0229.62003号 ·doi:10.2307/2284231
[38]	Efron，B.和Morris，C.（1972a）。限制贝叶斯和经验贝叶斯估值器的风险。二、。经验贝叶斯案例。J.Amer。统计师。协会67 130-139·Zbl 0231.62013号 ·doi:10.2307/2284711
[39]	Efron，B.和Morris，C.（1972b）。向量观测的经验贝叶斯：Stein方法的扩展。生物特征59 335-347·Zbl 0238.62072号 ·doi:10.1093/biomet/59.2.335
[40]	Efron，B.和Morris，C.（1973年a）。Stein的估计规则及其竞争对手——一种经验贝叶斯方法。J.Amer。统计师。协会68 117-130·Zbl 0275.62005号 ·doi:10.2307/2284155
[41]	Efron，B.和Morris，C.（1973b）。结合可能相关的估算问题（与讨论）。J.罗伊。统计师。Soc.序列号。乙35 379-421·兹比尔0281.62030
[42]	Efron，B.和Morris，C.（1975年）。使用Stein估计及其推广进行数据分析。J.Amer。统计师。协会70 311-319·Zbl 0319.62039号 ·doi:10.2307/2285453
[43]	Efron，B.和Morris，C.（1977年）。斯坦因的统计悖论。《科学美国人》236 119-127。
[44]	Efron，B.、Hastie，T.、Johnstone，I.和Tibshirani，R.（2004）。最小角度回归（讨论）。安。统计师。32 407-499. ·Zbl 1091.62054号 ·doi:10.1214/009053604000000067
[45]	Fan，J.和Li，R.（2006）。高维统计挑战：知识发现中的特征选择。在国际数学家大会III 595-622。欧洲数学。苏黎世·Zbl 1117.62137号
[46]	Friedman，J.（1994）。预测学习和函数逼近概述。《从统计学到神经网络》（V.Cherkassky，J.Friedman和H.Wechsler编辑）。北约ISI系列F 136。纽约州施普林格·Zbl 0809.0025号
[47]	Funk，S.（2006/2007）。见Webb，B.（2006/2007）。
[48]	Gorrell，G.和Webb，B.（2006年）。增量潜在语义分析的广义Hebbian算法。瑞典林雪平大学技术报告。
[49]	Greenshtein，E.和Ritov，Y.（2004）。高维线性预测器选择的持续性和超参数化的优点。伯努利10 971-988·Zbl 1055.62078号 ·doi:10.3150/bj/1106314846
[50]	Hastie，T.、Tibshirani，R.和Friedman，J.（2009）。《统计学习的要素》，第二版，纽约斯普林格出版社·兹比尔1273.62005 ·doi:10.1007/978-0-387-84858-7
[51]	Herlocker，J.L.、Konstan，J.A.、Borchers，A.和Riedl，J.（1999）。用于执行协同过滤的算法框架。第22届ACM SIGIR信息检索会议230-237。
[52]	Herlocker，J.L.、Konstan，J.A.和Riedl，J.T.（2000）。解释协作过滤建议。程序中。2000年ACM计算机支持的协同工作会议241-250。纽约ACM。
[53]	Herlocker，J.L.、Konstan，J.A.、Terveen，L.G.和Riedl，J.T.（2004）。评估协同过滤推荐系统。ACM信息系统交易22 5-53。
[54]	Hertz，J.、Krogh，A.和Palmer，R.G.（1991）。神经计算理论导论。加利福尼亚州红木市Addison-Wesley。
[55]	Hill，W.、Stead，L.、Rosenstein，M.和Furnas，G.（1995年）。在虚拟社区中推荐和评估选择。程序中。194-201年SIGCHI计算机系统人为因素会议。纽约ACM。
[56]	Hinton，G.E.（2002年）。通过最小化对比差异来培训专家产品。神经计算。14 1771-1800. ·Zbl 1010.68111号 ·网址：10.1162/089976602760128018
[57]	Hofmann，T.（2001年a）。概率潜在语义分析的无监督学习。机器。学习。J 42 177-196·Zbl 0970.68130号 ·doi:10.1023/A:1007617005950
[58]	Hofmann，T.（2001b）。了解人们想要什么。程序中。欧洲机器学习会议。莱克特。注释计算。科学。工程2167 214-225。柏林施普林格·Zbl 1007.68548号
[59]	Hofmann，T.（2004）。协同过滤的潜在语义模型。ACM信息系统交易22 89-115。
[60]	Hofmann，T.和Puzicha，J.（1999）。协作过滤的潜在类模型。国际人工智能联合会议2 688-693。Morgan Kaufmann，加利福尼亚州旧金山。
[61]	Hu，Y.、Koren，Y.&和Volinsky，C.（2008）。隐式反馈数据集的协作过滤。技术报告，AT&T Labs-Research，Florham Park，NJ。
[62]	Izenman，A.J.（2008）。现代多元统计技术：回归、分类和流形学习。纽约州施普林格·兹比尔1155.62040 ·doi:10.1007/978-0-387-78189-1
[63]	James，W.和Stein，C.（1961年）。二次损失估算。程序中。第四届伯克利交响乐团。数学。统计师。普罗巴伯。I 361-379。加利福尼亚大学出版社，加利福尼亚州伯克利·Zbl 1281.62026号
[64]	Kim，D.和Yum，B.（2005年）。基于迭代主成分分析的协同过滤。应用专家系统28 823-830。
[65]	Koren，Y.（2008）。因式分解满足邻域：一个多方面的协同过滤模型。程序中。第14届ACM SIGKDD国际知识发现和数据挖掘大会426-434。纽约ACM。
[66]	Koren，Y.（2009）。具有时间动态的协同过滤。程序中。第15届ACM SIGKDD国际知识发现和数据挖掘大会447-456。纽约ACM。
[67]	Koren，Y.（2010）。邻域因素：可扩展且准确的协作过滤。ACM数据4知识发现事务第1篇。
[68]	Koren，Y.、Bell，R.和Volinsky，C.（2009年）。推荐系统的矩阵分解技术。计算机42（8）30-37。
[69]	Li，K.-C.（1985）。从Stein的无偏风险估计到广义交叉验证方法。安。统计师。13 1352-1377. ·Zbl 0605.62047号 ·doi:10.1214/aos/1176349742
[70]	Lim，Y.J.和Teh，Y.W.（2007）。电影分级预测的变分贝叶斯方法。程序中。2007年KDD杯和研讨会15-21。纽约ACM。
[71]	Little，R.J.A.和Rubin，D.B.（1987年）。缺失数据的统计分析。纽约威利·Zbl 0665.62004号
[72]	Mallows，C.（1973）。关于\（\mathrm的一些评论{C}（C）_{p} \）。技术计量学15 661-675·Zbl 0269.62061号 ·doi:10.2307/1267380
[73]	Maritz，J.S.和Lwin，T.（1989）。经验贝叶斯方法，第二版，Monogr。统计师。申请。普罗巴伯。35 . 查普曼和霍尔，伦敦·Zbl 0731.62040号
[74]	Marlin，B.（2004）。协作过滤：机器学习的视角。多伦多大学计算机科学系硕士论文。
[75]	Marlin，B.和Zemel，R.S.（2004年）。协同过滤的多乘性因子模型。第21届国际机器学习大会。纽约ACM。
[76]	Marlin，B.、Zemel，R.S.、Roweis，S.和Slaney，M.（2007年）。协同过滤和随机假设缺失。程序中。第23届人工智能不确定性大会。AMC，纽约。
[77]	Moguerza，J.M.和Muñoz，A.（2006年）。支持向量机和应用程序。统计师。科学。21 322-336. ·Zbl 1246.68185号 ·doi:10.1214/088342306000000493
[78]	Moody，J.E.（1992年）。有效参数数：非线性学习系统中泛化和正则化的分析。神经信息处理系统进展4。Morgan Kaufmann，加利福尼亚州旧金山。
[79]	Morris，C.N.（1983年）。参数经验贝叶斯推断：理论与应用（附讨论）。J.Amer。统计师。协会78 47-65·Zbl 0506.62005年 ·doi:10.2307/2287098
[80]	Narayanan，A.和Shmatikov，V.（2008）。强大的大型数据集非对称化（如何打破Netflix Prize数据集的匿名性）。
[81]	Neal，R.M.和Hinton，G.E.（1998年）。EM算法视图，证明增量、稀疏和其他变量的合理性。《图形模型学习》（M.I.Jordan编辑）355-368。克鲁沃·Zbl 0916.62019号
[82]	Netflix Inc.（2006/2010）。Netflix Prize网页：。Netflix大奖排行榜：http://www.netflixprize.com/leaderboard/ . 网飞奖论坛：www.netflixprize.com/community/。
[83]	Oard，D.和Kim，J.（1998年）。推荐系统的隐含反馈。程序中。AAAI推荐系统研讨会31-36。加利福尼亚州门罗公园AAAI。
[84]	Park，S.T.和Pennock，D.M.（2007年）。将协作过滤技术应用于电影搜索，以获得更好的排名和浏览。程序中。第13届ACM SIGKDD国际知识发现和数据挖掘大会550-559。纽约ACM。
[85]	Paterek，A.（2007年）。改进正则奇异值分解用于协同过滤。2007年KDD杯和研讨会39-42。纽约ACM。
[86]	Piatetsky，G.（2007）。西蒙·芬克访谈。SIGKDD探索新闻稿9 38-40。
[87]	Popescul，A.、Ungar，L.、Pennock，D.和Lawrence，S.（2001）。稀疏数据环境中统一协作和基于内容的推荐的概率模型。程序中。第17届不确定性人工智能大会。Morgan Kaufmann，加利福尼亚州旧金山，邮编：437-444。
[88]	Pu，P.、Bridge，D.G.、Mobasher，B.和Ricci，F.（2008）。程序中。2008年ACM推荐系统会议。
[89]	Raiko，T.、Ilin，A.和Karhunen，J.（2007）。具有大量缺失值的大规模问题的主成分分析。在ECML 2007中。人工智能4701课堂讲稿（J.N.Kok等人编辑）691-698。柏林施普林格。
[90]	Rennie，J.D.M.和Srebro，N.（2005年）。用于协同预测的快速最大边际矩阵分解。程序中。第22届国际机器学习大会713-719。纽约ACM。
[91]	Resnick，P.和Varian，H.R.（1997）。推荐系统。ACM 40 56-58的通信。
[92]	Resnick，P.、Iacocou，N.、Suchak，M.、Berstrom，P.和Riedl，J.（1994）。Grouplens：一个开放的网络新闻协同过滤架构。程序中。ACM计算机支持合作工作会议175-186。
[93]	Ripley，B.D.（1996）。模式识别和神经网络。剑桥大学出版社，剑桥·Zbl 0853.62046号
[94]	Robbins，H.（1956年）。统计的经验贝叶斯方法。程序中。第三届伯克利交响乐团。数学。统计师。普罗巴伯。I 157-163。加州大学出版社，伯克利·Zbl 0074.35302号
[95]	Robbins，H.（1964年）。统计决策问题的经验贝叶斯方法。安。数学。统计师。35 1-20. ·Zbl 0138.12304号 ·doi:10.1214/aoms/1177703729
[96]	罗宾斯，H.（1983）。关于经验贝叶斯估计的几点思考。安。统计师。11 713-723. ·Zbl 0522.62024号 ·doi:10.1214/aos/1176346239
[97]	Roweis，S.（1997）。PCA和SPCA的EM算法。神经信息处理系统进展10 626-632。麻省理工学院出版社，马萨诸塞州剑桥。
[98]	Salakhutdinov，R.和Mnih，A.（2008a）。概率矩阵分解。神经信息处理系统进展20 1257-1264。麻省理工学院出版社，马萨诸塞州剑桥。
[99]	Salakhutdinov，R.和Mnih，A.（2008b）。使用MCMC的贝叶斯概率矩阵分解。程序中。第25届国际机器学习大会。
[100]	Salakhutdinov，R.、Mnih，A.和Hinton，G.（2007年）。用于协同过滤的受限Boltzmann机器。第24届国际机器学习大会。ACM国际会议记录系列227 791-798。纽约ACM。
[101]	Sali，S.（2008）。基于奇异值分解的电影分级预测。加州大学圣克鲁斯分校技术报告。
[102]	Sarwar，B.、Karypis，G.、Konstan，J.和Riedl，J.T.（2000年）。降维在推荐系统中的应用——案例研究。程序中。ACM WebKDD研讨会。纽约ACM。
[103]	Sarwar，B.、Karypis，G.、Konstan，J.和Riedl，J.T.（2001）。基于项目的协同过滤推荐算法。程序中。第十届国际互联网大会285-295。纽约ACM。
[104]	Srebro，N.和Jaakkola，T.（2003年）。加权低阶近似。程序中。第二十届国际机器学习大会（T.Fawcett和N.Mishra，eds.）720-727。ACM，纽约。
[105]	Srebro，N.、Rennie，J.D.M.和Jaakkola，T.S.（2005）。最大边际矩阵分解。《神经信息处理系统进展》17 1329-1336。
[106]	Stein，C.（1974）。多元正态分布平均值的估计。《布拉格渐近统计研讨会论文集》（Charles Univ.，Prague，1973）II 345-381。布拉格查尔斯大学。
[107]	Stein，C.M.（1981）。多元正态分布平均值的估计。安。统计师。9 1135-1151. ·Zbl 0476.62035号 ·doi:10.1214/aos/1176345632
[108]	Stone，M.（1974年）。统计预测的交叉验证选择和评估（讨论）。J.罗伊。统计师。Soc.序列号。乙36 111-147·Zbl 0308.62063号
[109]	Takacs，G.、Pilaszy，I.、Nemeth，B.和Tikk，D.（2007年）。在重力推荐系统上。程序中。KDD杯和工作坊2007 22-30。ACM，纽约。
[110]	Takacs，G.、Pilaszy，I.、Nemeth，B.和Tikk，D.（2008a）。重力推荐系统的主要组件。SIGKDD探索9 80-83。
[111]	Takacs，G.、Pilaszy，I.、Nemeth，B.和Tikk，D.（2008b）。研究大型推荐系统的各种矩阵分解方法。程序中。第二届Netflix KDD研讨会。纽约ACM。
[112]	Takacs，G.、Pilaszy，I.、Nemeth，B.和Tikk，D.（2008c）。Netflix Prize问题的矩阵分解和基于邻居的算法。程序中。ACM推荐系统会议267-274。纽约ACM。
[113]	Tibshirani，R.（1996）。通过套索回归收缩和选择。J.罗伊。统计师。Soc.序列号。乙58 267-288·Zbl 0850.62538号
[114]	Tintarev，N.和Masthoff，J.（2007年）。推荐系统中的解释调查。程序中。第23届国际数据工程研讨会会议801-810。IEEE，纽约。
[115]	Toscher，A.和Jahrer，M.（2008）。2008年Netflix大奖的BigChaos解决方案。技术报告，commodo研究和咨询，奥地利科弗拉赫。
[116]	Toscher，A.、Jahrer，M.和Bell，R.M.（2009年）。Netflix大奖的BigChaos解决方案。技术报告，commodo研究和咨询，奥地利科夫拉赫。
[117]	Toscher，A.、Jahrer，M.和Legenstein，R.（2008年）。大规模推荐系统中基于邻域的改进算法。程序中。2008年第二届Netflix KDD研讨会。纽约ACM。
[118]	Toscher，A.、Jahrer，M.和Legenstein，R.（2010年）。为准确的推荐系统组合预测。程序中。第16届ACM SIGKDD国际知识发现和数据挖掘大会693-701。华盛顿特区ACM。
[119]	Tuzhilin，A.、Koren，Y.、Bennett，C.、Elkan，C.和Lemire，D.（2008）。程序。第二届大规模推荐系统KDD研讨会和Netflix大奖赛。纽约ACM。
[120]	Ungar，L.和Foster，D.（1998年）。协同过滤的聚类方法。推荐系统研讨会。AAAI出版社，门洛帕克。
[121]	van Houwelingen，J.C.（2001）。收缩和惩罚似然作为提高预测准确性的方法。统计师。尼尔兰迪卡55 17-34·Zbl 1075.62591号 ·doi:10.1111/1467-9574.00154
[122]	Vapnik，V.N.（2000）。《统计学习理论的本质》，第二版，纽约斯普林格出版社·Zbl 0934.62009号
[123]	Wang，J.、de Vries，A.P.和Reinders，M.J.T.（2006）。通过相似性融合统一基于用户和基于项目的协同过滤方法。程序中。第29届国际ACM SIGIR信息检索研发会议501-508。纽约ACM。
[124]	Webb，B.（又名Funk，S.）（2006/2007年）博客条目，2006年10月27日、2006年11月2日、2007年12月11日和2007年8月17日。可从获取。
[125]	Wu，M.（2007）。通过矩阵分解集成进行协同过滤。程序中。2007年KDD杯和研讨会43-47。纽约ACM。
[126]	Ye，J.（1998）。关于测量和纠正数据挖掘和模型选择的影响。J.Amer。统计师。协会93 120-131·Zbl 0920.62056号 ·doi:10.2307/2669609
[127]	Yuan，M.和Lin，Y.（2005）。线性模型中有效的经验贝叶斯变量选择和估计。J.Amer。统计师。协会100 1215-1225·Zbl 1117.62453号 ·doi:10.1198/0162145005000367
[128]	Zhang，Y.和Koren，J.（2007）。推荐系统的高效贝叶斯层次用户建模。程序中。第30届国际ACM SIGIR信息检索研究与发展会议。纽约ACM。
[129]	Zhou，Y.、Wilkinson，D.、Schreiber，R.和Pan，R.（2008）。Netlix奖的大规模并行协同过滤。程序中。第四届国际信息与管理算法会议。计算机课堂讲稿。科学。5031 337-348. 柏林施普林格。
[130]	Zou，H.、Hastie，T.和Tibshirani，R.（2006）。稀疏主成分分析。J.计算。图表。统计师。15 265-286. ·doi:10.1198/106186006X113430
[131]	Zou，H.、Hastie，T.和Tibshirani，R.（2007）。关于套索的“自由度”。安。统计师。35 2173-2192. ·Zbl 1126.62061号 ·doi:10.1214/009053600700000127

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
数据传输时间	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

Netflix挑战的统计意义。（英语） Zbl 1330.62090号

MSC公司：

关键词：

软件：

参考文献：

示例

领域

操作员

Netflix挑战的统计意义。 （英语） Zbl 1330.62090号

MSC公司：

关键词：

软件：

参考文献：

Netflix挑战的统计意义。（英语） Zbl 1330.62090号