×

有序空间数据的多域模型,应用于在线评级数据。 (英语) Zbl 1411.62352号

摘要:近年来,人们对在线评级数据的兴趣有所增加,其中产品或本地企业的排名由网站用户提供,例如Yelp!或亚马逊。评级异质性的一个来源是用户在提供评级时采用不同的标准;即使两个用户从一个产品中获得相同的收益,他们也可能以不同的方式将其收益转化为评级。在本文中,我们提出了一个有序数据模型,我们称之为多准则模型,该模型将用于将潜在效用转换为评级的标准视为用户特定的随机效应,这些随机效应的分布以非参数方式建模。我们证明,除了由于项目质量、用户偏见、项目和用户之间的交互以及用户和项目的空间结构导致的异质性的常见来源外,这种方法还能够解释这种类型的差异。我们将这里开发的模型应用于网站Yelp!的公开数据!并证明,除了提供更好的评级预测和更好的整体项目质量总结外,它还可以根据用户的评级行为生成可解释的用户聚类。

理学硕士:

62第20页 统计学在经济学中的应用
62H11型 定向数据;空间统计学
62G07年 密度估算

软件:

FRK公司
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Albert,J.H.和Chib,S.(1993年)。二进制和多光子响应数据的贝叶斯分析。J.Amer。统计人员。协会88 669-679·Zbl 0774.62031号 ·doi:10.1080/01621459.1993.10476321
[2] Banerjee,S.、Gelfand,A.E.、Finley,A.O.和Sang,H.(2008年)。大型空间数据集的高斯预测过程模型。J.R.统计社会服务。B.统计方法70 825-848·兹伯利05563371 ·文件编号:10.1111/j.1467-9868.2008.00663.x
[3] Bao,J.和Hanson,T.E.(2015)。贝叶斯非参数多元序数回归。加拿大。《统计学杂志》43 337-357·Zbl 1321.62033号 ·doi:10.1002/cjs.11253
[4] Berrett,C.和Calder,C.A.(2012年)。贝叶斯空间概率回归模型的数据扩充策略。计算。统计人员。数据分析56 478-490·Zbl 1239.62065号 ·doi:10.1016/j.csda.2011.08.020
[5] Binder,D.A.(1978年)。贝叶斯聚类分析。生物特征65 31-38·Zbl 0376.62007号 ·doi:10.1093/biomet/65.1.31
[6] Bobadilla,J.、Ortega,F.、Hernando,A.和Gutiérrez,A.(2013)。推荐系统调查。知识-基于系统46 109-132。
[7] Bradley,J.R.、Holan,S.H.和Wikle,C.K.(2015)。高维区域数据的多维时空模型,应用于纵向雇主-家庭动态。附录申请。法令9 1761-1791·兹比尔1397.62356 ·doi:10.1214/15-AOAS862
[8] Bradley,J.R.、Wikle,C.K.和Holan,S.H.(2016)。贝叶斯支持值调查数据的空间变化及其在美国社区调查中的应用。J.Amer。统计人员。协会111472-487。
[9] Cargnoni,C.、Müller,P.和West,M.(1997)。通过条件高斯动态模型对多项式时间序列进行贝叶斯预测。J.Amer。统计人员。协会92 640-647·Zbl 0889.62079号
[10] Carlin,B.P.和Polson,N.G.(1992年)。离散回归模型和分类时间序列的蒙特卡罗贝叶斯方法。贝叶斯统计,4(佩尼斯科拉,1991)(J.M.Bernardo、J.O.Berger、A.P.Dawid和A.Smith编辑)109-125。牛津大学出版社,纽约。
[11] Chen,M.-H.和Dey,D.K.(2000年)。用于分析相关顺序响应数据的统一贝叶斯方法。钎焊。J.概率。统计数据14 87-111·Zbl 0966.62045号
[12] Cowles,M.K.(1996)。加速累积链广义线性模型的蒙特卡罗-马尔可夫链收敛。统计计算6 101-111。
[13] 北卡罗来纳州克雷西(2015)。空间数据统计,修订版,威利,纽约·Zbl 1347.62005年
[14] Cressie,N.和Johannesson,G.(2008年)。固定秩kriging用于非常大的空间数据集。J.R.统计社会服务。B.《美国法律总汇》第70卷第209-226页·Zbl 05563351号 ·doi:10.1111/j.1467-9868.2007.00633.x
[15] De Oliveira,V.(2000年)。截断高斯随机场的贝叶斯预测。计算。统计人员。数据分析34 299-314·Zbl 1043.62079号 ·doi:10.1016/S0167-9473(99)00103-6
[16] De Oliveira,V.(2004)。空间降雨场的简单模型。斯托奇。环境。研究风险评估18 131-140·Zbl 1114.86003号 ·doi:10.1007/s00477-003-0146-4
[17] DeYoreo,M.和Kottas,A.(2014年)。多元序数回归的贝叶斯非参数建模。预打印。可从arXiv:1408.1027获取·Zbl 1398.62089号 ·doi:10.1080/01621459.2017.1328357
[18] Escobar,M.D.和West,M.(1995)。使用混合物的贝叶斯密度估计和推断。J.Amer。统计人员。协会90 577-588·Zbl 0826.62021号 ·doi:10.1080/01621459.1995.10476550
[19] Ferguson,T.S.(1973)。一些非参数问题的贝叶斯分析。安。统计师。1 209-230·Zbl 0255.62037号 ·doi:10.1214/aos/1176342360
[20] Fritsch,A.和Ickstadt,K.(2009年)。基于后验相似矩阵的改进聚类标准。贝叶斯分析。4 367-391·Zbl 1330.62249号 ·doi:10.1214/09-BA414
[21] Gelman,A.(2006年)。层次模型中方差参数的先验分布(Browne和Draper的文章评论)。贝叶斯分析。1 515-533·Zbl 1331.62139号 ·doi:10.1214/06-BA117A
[22] Gill,J.和Casella,G.(2009年)。序数贝叶斯社会科学模型的非参数先验:规范和估计。J.Amer。统计人员。协会104 453-464·Zbl 1388.62377号 ·doi:10.1198/jasa.2009.0039
[23] Härdle,W.和Müller,M.(2000)。多元和半参数核回归。《平滑与回归:方法、计算与应用》(M.G.Schimek编辑)。纽约威利·Zbl 0979.62023号
[24] Higgs,M.D.和Hoeting,J.A.(2010年)。一种用于空间相关有序分类数据的截断潜变量模型。计算。统计人员。数据分析54 1999-2011·Zbl 1284.62322号 ·doi:10.1016/j.csda.2010.02.024
[25] Hoffman,M.D.、Blei,D.M.、Wang,C.和Paisley,J.(2013)。随机变分推理。J.马赫。学习。第14号决议1303-1347·Zbl 1317.68163号
[26] Houlsby,N.、Hernández-Lobato,J.M.和Ghahramani,Z.(2014)。具有稳健序数矩阵分解的冷启动主动学习。在766-774国际机器学习会议上。
[27] Ishwaran,H.和Zarepour,M.(2002年)。有限正态混合物中的Dirichlet先验筛。统计人员。中国12 941-963·Zbl 1002.62028号
[28] Koren,Y.和Sill,J.(2011)。OrdRec:预测个性化物品评级分布的序数模型。第五届ACM推荐系统会议记录117-124。纽约ACM。
[29] Kottas,A.、Müller,P.和Quintana,F.(2005年)。多元序数数据的非参数贝叶斯建模。J.计算。图表。统计.14 610-625。
[30] Linero,A.R.(2018)。用于高维预测和变量选择的贝叶斯回归树。J.Amer。统计人员。协会113 626-636·Zbl 1398.62065号 ·doi:10.1080/01621459.2016.1264957
[31] Linero,A.R.、Bradley,J.R.和Desai,A.(2018)。补充“有序空间数据的多域模型及其在线评级数据的应用”。DOI:10.1214/18-aoas1143增补·Zbl 1411.62352号
[32] Marlin,B.M.和Zemel,R.S.(2009年)。使用非随机缺失数据进行协作预测和排名。第三届ACM推荐系统会议记录5-12。纽约ACM。
[33] Marlin,B.M.、Zemel,R.S.、Roweis,S.和Slaney,M.(2007年)。协同过滤和随机假设缺失。在第二十届人工智能不确定性会议论文集267-275。奥艾出版社,俄勒冈州科瓦利斯。
[34] Mnih,A.和Salakhuttinov,R.R.(2008年)。概率矩阵分解。神经信息处理系统进展20 1257-1264。纽约州Red Hook市Curran Associates。
[35] Neal,R.M.(2003)。切片取样。统计年鉴31 705-767·Zbl 1051.65007号 ·doi:10.1214/aos/1056562461
[36] Paquet,U.、Thomson,B.和Winther,O.(2012)。有序矩阵分解的层次模型。统计计算22 945-957·Zbl 1252.62068号 ·doi:10.1007/s11222-011-9264-x
[37] Rasmussen,C.E.和Williams,C.K.I.(2006)。机器学习的高斯过程。麻省理工学院出版社,马萨诸塞州剑桥·Zbl 1177.68165号
[38] Sang,H.和Huang,J.Z.(2012)。大型空间数据集协方差函数的全尺度近似。J.R.统计社会服务。B.统计方法74 111-132·Zbl 1411.62274号
[39] Schliep,E.M.和Hoeting,J.A.(2015)。独立或空间相关序数数据的数据增强和参数扩展。计算。统计人员。数据分析90 1-14·Zbl 1468.62173号 ·doi:10.1016/j.csda.2015.03.020
[40] Simpson,D.、Rue,H.、Riebler,A.、Martins,T.G.和Sörbye,S.H.(2017年)。惩罚模型组件复杂性:构建先验的原则性、实用方法。统计人员。科学32 1-28·Zbl 1442.62060号 ·doi:10.1214/16-STS576
[41] Teh,Y.W.、Jordan,M.I.、Beal,M.J.和Blei,D.M.(2006)。分层狄利克雷过程。J.Amer。统计人员。协会101 1566-1581·Zbl 1171.62349号 ·doi:10.1198/016214500000302
[42] Velozo,P.L.、Alves,M.B.和Schmidt,A.M.(2014)。模拟分类降水水平。钎焊。J.概率。统计数字28 190-208·Zbl 1319.62227号 ·doi:10.1214/12-BJPS201
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。