×

关于最佳推荐集和短视最佳查询集的等价性。 (英语) Zbl 1493.68353号

摘要:偏好诱导是许多人工智能应用程序的重要组成部分,包括决策支持和推荐系统。此类系统必须基于与用户的交互来评估用户偏好,并使用(可能不完整和不精确)关于这些偏好的信念提出建议。显式的机制偏好诱导–要求用户直接回答有关其偏好的问题–可能会有很大的价值;但是由于用户的认知和时间成本,通过询问那些具有高(预期)信息价值的查询来最小化查询数量是很重要的。另一种方法是简单地提出建议,让用户提供反馈(例如,接受建议或以某种方式进行批评),并使用这种更间接的反馈来逐步提高建议的质量。由于用户真实偏好的固有不确定性一套建议在每个阶段呈现给用户。从概念上讲,一组建议也可以被视为选择查询,其中用户指示该集合中最首选的选项。由于在做一个好的推荐和询问一个信息丰富的选择查询之间存在潜在的紧张关系,我们探索了两者之间的联系。我们考虑了两种不同的偏好不确定性和优化模型:(a)贝叶斯框架,在该框架中,保持后验效用大于用户效用函数,使用期望效用评估最优建议,并使用信息的期望值评估查询;以及(b)用户效用不确定性严格的minimax-returnal框架(用多面体表示),使用minimax-recurnal稳健性准则提出建议,并使用最坏情况下的后悔减少来评估查询。我们发现,有点令人惊讶的是,在这两种情况下,在好的建议和好的查询之间没有进行权衡:我们证明了大小为(k)的最佳建议集也是大小为(k\)的最佳选择查询。我们还研究了用户对选择查询的响应容易出错的情况(使用常数和混合多项式logit噪声模型),表明结果对这种形式的噪声是稳健的。在这两个框架中,我们的理论结果对交互式推荐器的设计具有实际意义。我们的结果还允许我们设计高效的算法来计算最佳查询/建议集。我们为这两种设置开发了几种这样的算法(精确和近似),并对其性能进行了实证验证。

MSC公司:

68层35 人工智能语言和软件系统理论(基于知识的系统、专家系统等)
68层37 人工智能背景下的不确定性推理
68单位35 信息系统的计算方法(超文本导航、接口、决策支持等)
91B06型 决策理论
91B16号 效用理论
PDF格式BibTeX公司 XML格式引用
全文: 内政部 哈尔

参考文献:

[1] Abbas,A.,自适应效用启发的熵方法,IEEE Trans。系统。科学。赛博。,34, 2, 169-178 (2004)
[2] 阿多马维修斯,G。;Kwon,Y.,《最大化总推荐多样性:一种图表理论方法》,(第五届ACM推荐系统国际会议推荐系统新颖性和多样性研讨会论文集(DiveRS-11)。第五届ACM推荐系统国际会议推荐系统新颖性和多样性研讨会论文集(DiveRS-11),RecSys-11,芝加哥,伊利诺伊州,美国(2011)),3-10
[3] 艾,Q。;Bi,K。;郭杰。;Croft,W.B.,《学习深度列表上下文模型以进行排名细化》,(第41届国际ACM信息检索研究与开发会议论文集。第41届ACM国际信息检索研究和发展会议论文集,SIGIR-18,美国密歇根州安阿伯(2018)), 135-144
[4] Ailon,N。;Karnin,Z.S。;Joachims,T.,《将决斗强盗减少为主要强盗》(《第三十一届机器学习国际会议论文集》,第三十一届国际机器学习会议论文集,ICML-14,中国北京(2014)),856-864
[5] Akrour,R。;Schoenauer,M。;Sebag,M.,APRIL:基于主动偏好学习的强化学习,(欧洲机器学习和数据库知识发现会议论文集。欧洲机器学习和数据库知识发现会议论文集,ECML-PKDD 2012,英国布里斯托尔(2012)),116-131
[6] Baier,J.A。;McIlraith,S.A.,《带偏好的规划》,AI Mag.,29,4,25-36(2008)
[7] 巴纳,E。;Costa,C.A。;Vansnick,J.-C.,MACBETH——构建基本价值函数的互动路径,国际翻译。操作。第1489-500号决议(1994年)·Zbl 0857.90004号
[8] Bell,D.E.,《不确定性下决策的后悔》,Oper。决议,30961-981(1982)·Zbl 0491.90004号
[9] 贝洛,I。;库尔卡尼,S。;Jain,S。;Boutiler,C。;Chi,E。;Eban,E。;罗,X。;Mackey,A。;Meshi,O.,Seq2slate:使用RNN进行重新排名和板岩优化(2018)
[10] Benabbou,N。;迪奥多罗,S.D.S.D。;佩尔尼,P。;Viappiani,P.,《多属性领域中的增量偏好启发,以使用Borda计数进行选择和排名》,(第十届可扩展不确定性管理国际会议论文集。第十届国际可扩展不确定管理会议论文集,SUM-16,法国尼斯(2016)),81-95
[11] Benabbou,N。;Perny,P.,在多目标状态空间图中结合偏好启发和搜索,(第二十四届国际人工智能联合会议论文集。第二十四届国际人工智能联合会议论文集,IJCAI-15,布宜诺斯艾利斯,阿根廷(2015)),297-303
[12] Benabbou,N。;佩尔尼,P。;Viappiani,P.,《多准则决策中Choquet能力的增量启发》(《欧洲人工智能会议论文集》,欧洲人工智能大会论文集,ECAI-14(2014)),87-92·Zbl 1366.91044号
[13] Benabbou,N。;佩尔尼,P。;Viappiani,P.,多准则选择、排序和排序问题的Choquet能力增量启发,Artif。智力。,246, 152-180 (2017) ·Zbl 1419.68071号
[14] Berry,D.A。;弗里斯特特,B.,《班迪特问题:实验的顺序分配》(1985),查普曼和霍尔:查普曼与霍尔伦敦·Zbl 0659.62086号
[15] 比戈,D。;扎努蒂尼,B。;Fargier,H。;Mengin,J.,概率条件偏好网络,(第二十届人工智能不确定性会议论文集。第二十届人造智能不确定性大会论文集,UAI-13,华盛顿州贝尔维尤,美国(2013))
[16] 博尼利亚,E.V。;郭,S。;Sanner,S.,高斯过程偏好启发,(神经信息处理系统进展23。神经信息处理系统进展23,IPS-10,加拿大不列颠哥伦比亚省温哥华(2010)),262-270
[17] Bous,G。;Pirlot,M.,用随机效用模型学习多准则效用函数,(第三届算法决策理论国际会议论文集。第三届国际算法决策理论会议论文集,ADT-13,比利时布鲁塞尔(2013)),101-115·Zbl 1406.91128号
[18] Boutiler,C.,偏好激发问题的POMDP公式,(第十八届全国人工智能会议论文集。第十八届国家人工智能会议文献集,AAAI-02,加拿大爱德蒙顿,AB(2002)),239-246
[19] Boutiler,C.,《计算决策支持:基于回归的优化和偏好激发模型》,(Zentall,T.R.;Crowley,P.H.,《比较决策:跨学科和应用的分析和支持》(2011),牛津大学出版社),423-453
[20] Boutiler,C。;布拉夫曼,R。;Domshlak,C。;胡斯,H。;Poole,D.,使用CP-nets的基于偏好的约束优化,计算。智力。,20, 2, 137-157 (2004)
[21] Boutiler,C。;Patrascu,R。;Poupart,P。;Schuurmans,D.,基于约束的优化和使用最小最大决策准则的效用启发,Artif。智力。,170, 8-9, 686-713 (2006) ·Zbl 1131.91317号
[22] Boutiler,C。;桑德霍姆,T。;Shields,R.,《在(组合)拍卖中引发竞标者的非价格偏好》,(第十九届全国人工智能会议论文集。第十九届国家人工智能会议文献集,AAAI-04,加利福尼亚州圣何塞,美国(2004)),204-211
[23] Boutiler,C。;Zemel,R.S。;Marlin,B.,《主动协同过滤》,(《第十九届人工智能不确定性会议论文集》,《第十九次人工智能不确定度会议论文集,UAI-03,墨西哥阿卡普尔科》(2003)),98-106
[24] Braziunas,博士,《广义可加效用的决策理论启发》(2011),多伦多大学,博士论文
[25] Braziunas,D。;Boutiler,C.,《基于Minimax后悔的广义加性效用启发》,(《第二十三届人工智能不确定性会议论文集》,UAI-07,温哥华,不列颠哥伦比亚省,加拿大(2007)),25-32
[26] Braziunas,D。;Boutiler,C.,《激励因子化公用事业》,AI Mag.,29,4,79-92(2008)
[27] Braziunas,D。;Boutiler,C.,《使用UTPREF推荐系统评估基于回归的偏好激发》,(第十一届ACM电子商务会议论文集。第十一届AC电子商务会议文献集,EC’10(2010)),219-228
[28] Buchbinder,N。;费尔德曼,M。;Naor,J。;Schwartz,R.,带基数约束的子模块最大化,(第二十五届年度ACM-SIAM离散算法研讨会论文集。第二十五届ACM-SIAM离散算法研讨会文献集,SODA-14,美国俄勒冈州波特兰(2014)),1433-1452·Zbl 1423.90212号
[29] Burke,R.,《电子商务中目录导航的交互式评论》,Artif。智力。修订版,18,3-4,245-267(2002)
[30] (Camerer,C.F.;Loewenstein,G.;Rabin,M.,《行为经济学进展》(2003),普林斯顿大学出版社:普林斯顿大学出版,新泽西州普林斯顿)
[31] 坎波斯,P.G。;Díez,F。;Cantador,I.,Time-aware推荐系统:对现有评估协议的综合调查和分析,用户模型。用户适应。互动。,24, 1-2, 67-119 (2014)
[32] Chajewska,美国。;科勒,D。;Parr,R.,《使用自适应效用启发进行理性决策》,(《第十七届全国人工智能会议论文集》,第十七届国家人工智能会议文献集,AAAI-00,德克萨斯州奥斯汀,美国(2000)),363-369
[33] Chen,L。;Pu,P.,评估基于评论的推荐代理,(《第二十届全国人工智能会议论文集》,第二十届国家人工智能会议文献集,AAAI-06,波士顿,马萨诸塞州,美国(2006))
[34] Chen,L。;Pu,P.,基于混合评论的推荐系统,(第十二届智能用户界面国际会议论文集。第十二届国际智能用户界面会议论文集,IUI-07,美国夏威夷火奴鲁鲁(2007)),22-31
[35] Chen,L。;Pu,P.,《基于评判的推荐人:调查和新兴趋势》,《用户模型》。用户适配器。互动。,22, 1-2, 125-150 (2012)
[36] 陈,M。;Beutel,A。;科文顿,P。;Jain,S。;Belletti,F。;Chi,E.,针对REINFORCE推荐系统的Top-k非政策修正,(第十二届ACM网络搜索和数据挖掘国际会议论文集。第十二届ASM网络搜索与数据挖掘国际大会论文集,WSDM-19,澳大利亚墨尔本(2019)),456-464
[37] Cheng,H.-T。;Koc,L。;Harmsen,J。;摇动,T。;Chandra,T。;Aradhye,H。;安德森,G。;Corrado,G。;Chai,W。;伊斯皮尔,M。;阿尼尔,R。;哈克,Z。;洪,L。;Jain,V。;刘,X。;Shah,H.,推荐系统的广泛和深入学习,(推荐系统深度学习第一次研讨会论文集。推荐系统深度教学第一次研讨会文献集,美国马萨诸塞州波士顿(2016)),7-10
[38] Choi,S。;哈,H。;Hwang,美国。;Kim,C。;哈,J.-W。;Yoon,S.,使用双聚类技术的基于强化学习的推荐系统(2018)
[39] 楚·W。;Ghahramani,Z.,有序回归的高斯过程,J.Mach。学习。第61019-1041号决议(2005年)·Zbl 1222.68170号
[40] Corless,R.M。;Gonnet,G.H。;黑尔,D.E。;杰弗里·D·J。;Knuth,D.E.,关于Lambert W函数,高级计算。数学。,5,1329-359(1996年)·Zbl 0863.65008号
[41] 科内利奥,C。;戈德史密斯,J。;马泰,N。;罗西,F。;Venable,K.B.,《CP网络中的更新和不确定性》,(第26届澳大拉西亚联合会议论文集。第26届澳大拉西亚联席会议论文集,AI 2013,新西兰达尼丁(2013)),301-312
[42] 科文顿,P。;亚当斯,J。;Sargin,E.,youtube推荐的深度神经网络,(《第十届ACM推荐系统会议论文集》,第十届AC推荐系统会议文献集,RecSys-16,马萨诸塞州波士顿,美国(2016)),191-198
[43] 北卡罗来纳州克拉斯韦尔。;Zoeter,O。;泰勒,M。;Ramsey,B.,点击位置偏倚模型的实验比较,(《2008年网络搜索和数据挖掘国际会议论文集》,2008年国际网络搜索与数据挖掘会议论文集,WSDM-08(2008)),87-94
[44] 德斯贾丁斯,M。;伊顿,E。;Wagstaff,K.,《学习用户对对象集的偏好》,(第二十届机器学习国际会议论文集,第二十届国际机器学习大会论文集,ICML-06,匹兹堡,美国(2006)),273-280
[45] Dragone,P。;佩莱格里尼,G。;韦斯科维,M。;Tentori,K。;Passerini,A.,《没有更多现成的交易:电信服务捆绑的建设性建议》,(《第十二届ACM推荐系统会议论文集》,第十二届AC推荐系统会议文献集,RecSys-18,加拿大不列颠哥伦比亚省温哥华(2018)),163-171
[46] 德拉贡,P。;Teso,S。;库马尔,M。;Passerini,A.,建设性偏好激发的分解策略,(《第三十二届AAAI人工智能会议论文集》,第三十二次AAAI人造智能会议论文,AAAI-18,新奥尔良,洛杉矶,美国(2018)),2934-2942
[47] 医学博士Ekstrand。;里德尔,J。;Konstan,J.A.,《协作过滤推荐系统》,Found。趋势Hum.计算。互动。,4, 2, 175-243 (2011)
[48] Elahi,M。;里奇,F。;Rubens,N.,《协作过滤中评价启发的主动学习策略:系统范围的观点》,ACM Trans。智力。系统。技术。,5, 1, 13 (2013)
[49] Fishburn,P.C.,多元中的相互依赖性和可加性,一维预期效用理论,国际经济学。第8版,第335-342页(1967年)·Zbl 0153.49302号
[50] Gajos,K。;Weld,D.S.,界面优化偏好启发,(第18届美国计算机学会用户界面软件与技术年度研讨会论文集。第18届美国计算机学会用户界面软件与技术年度研讨会论文集,UIST-05,美国华盛顿州西雅图(2005)),173-182
[51] Gauci,J。;康蒂,E。;梁,Y。;维罗奇里,K。;何毅。;Z.卡登。;纳拉亚南,V。;Ye,X.,Horizon:脸书开源应用强化学习平台(2018)
[52] 吉尔伯特,H。;O·斯潘贾德。;维亚皮亚尼,P。;Weng,P.,减少交互式值迭代中的查询数,(第四届算法决策理论国际会议论文集。第四届国际算法决策理论会议论文集,ADT-15,列克星敦,肯塔基州,美国(2015)),139-152·Zbl 1405.91114号
[53] 戈麦斯·乌里韦,C.A。;Hunt,N.,Netflix推荐系统:算法、商业价值和创新,ACM Trans。管理。信息系统。,6, 4, 13:1-13:19 (2016)
[54] J.González。;戴,Z。;公元前达米亚努。;Lawrence,N.D.,Preferential Bayesian optimization,(第三十四届国际机器学习会议论文集。第三十四次国际机器学习大会论文集,ICML-17,澳大利亚悉尼(2017)),1282-1291
[55] Grabisch,M.,决策中的集合函数、博弈和能力,理论与决策库C,第46卷(2016),施普林格国际出版社·Zbl 1339.91003号
[56] Grabisch,M。;Labreuche,C.,《Choquet积分和Sugeno积分在多准则决策辅助中的十年应用》,Ann.Oper。第175号决议,第1247-286号决议(2010年)·Zbl 1185.90118号
[57] Grabisch,M。;Marichal,J.-L。;梅西亚尔,R。;Pap,E.,《聚合函数》,《数学及其应用百科全书》(2009),剑桥大学出版社:美国纽约州纽约市剑桥大学出版社·Zbl 1196.00002号
[58] Greco,S。;穆索,V。;Slowinski,R.,《重新审视序数回归:使用一组加性值函数的多标准排名》,《欧洲期刊·Oper》。决议,191,416-436(2008)·Zbl 1147.90013号
[59] 郭,S。;Sanner,S.,实时多属性贝叶斯偏好启发与成对比较查询,(《第十三届国际人工智能与统计会议论文集》,第十三届人工智能与统计学国际会议论文集,AISTATS-10,意大利撒丁岛恰拉古纳度假村(2010)),289-296
[60] 郭毅。;Gomes,C.P.,《使用隐含用户偏好学习最优子集》,(第二十届国际人工智能联合会议论文集。第二十届第一届国际人工人工智能联合大会论文集,IJCAI-09,加州帕萨迪纳,美国(2009)),1052-1057
[61] Halpern,J.Y.,《关于不确定性的推理》(2005),麻省理工学院出版社
[62] He,R。;McAuley,J.,《将相似性模型与马尔可夫链融合用于稀疏序列推荐》,(IEEE国际数据挖掘会议论文集。IEEE数据挖掘国际会议论文集,ICDM-16,西班牙巴塞罗那(2016))
[63] 赫布里希,R。;Minka,T。;Graepel,T.,Trueskill^tm:贝叶斯技能评级系统,(神经信息处理系统进展19。神经信息处理系统进展19,NIPS-06,加拿大不列颠哥伦比亚省温哥华(2006),569-576
[64] Herlocker,J.L。;Konstan,J.A。;Borchers,A。;Riedl,J.,执行协同过滤的算法框架,(第22届国际ACM SIGIR信息检索研究与开发年会论文集。第22届ACM SIGIS信息检索研究和开发年会文献集,SIGIR-99,加州伯克利,美国(1999)),230-237
[65] 海因斯,G。;Larson,K.,《风险前景的偏好启发》,(第九届自主代理和多代理系统国际会议论文集。第九届自治代理和多智能体系统国际会议文献集,AAMAS.10,加拿大安大略省多伦多市(2010)),889-896
[66] 霍洛韦,H.A。;怀特,C.C.,《多属性决策辅助的问题选择》,欧洲期刊Oper。决议,148,525-543(2003)·Zbl 1035.90034号
[67] (Howard,R.A.;Matheson,J.E.,《决策分析原理和应用读物》(1984),战略决策小组:战略决策小组,加利福尼亚州门洛·帕克)
[68] 即E。;Jain,V。;Wang,J。;纳夫雷卡,S。;阿加瓦尔,R。;吴,R。;Cheng,H.-T。;Chandra,T。;Boutilier,C.,SlateQ:用推荐集进行强化学习的可处理分解,(第二十八届国际人工智能联合会议论文集。第二十八届国际人工智能联合会议论文集,IJCAI-19,中国澳门(2019)),2592-2599
[69] 艾扬格,V.S。;Lee,J。;Campbell,M.,Q-Eval:使用查询评估多属性项目,(《第三届ACM电子商务会议论文集》。《第三次ACM电子商业会议论文集,EC’01,佛罗里达州坦帕,美国》(2001)),144-153
[70] 雅各布森,K。;穆拉利,V。;Newett,E。;惠特曼,B。;Yon,R.,Spotify音乐个性化,(第十届ACM推荐系统会议论文集。第十届推荐系统ACM会议论文集,RecSys-16,美国马萨诸塞州波士顿(2016)),373
[71] 雅克·拉盖泽,E。;Siskos,Y.,《评估一组用于多准则决策的加性效用函数:UTA方法》,欧洲期刊Oper。第10号决议,151-164(1982)·Zbl 0481.90078号
[72] 江,R。;Gowal,S。;Mann,T.A。;Rezende,D.J.,《超越贪婪排名:通过列表-CVAE优化板岩》,(第七届学习表征国际会议论文集。第七届国际学习表征会议论文集,ICLR-19,新奥尔良,洛杉矶,美国(2019))
[73] Joachims,T.,使用点击数据优化搜索引擎,(第八届ACM SIGKDD国际知识发现和数据挖掘会议论文集。第八届AC M SIGKDD国际知识发现与数据挖掘会议文献集,KDD-02,Edmonton,AB,Canada(2002)),133-142
[74] 基尼,R.L。;Raiffa,H.,《多目标决策:偏好和价值权衡》(1976年),John Wiley and Sons:John Willey and Sons New York·Zbl 0488.90001号
[75] 科尔里,P。;Salek,M。;Stoddard,G.,《向具有不同口味的用户推荐的快速盗贼算法》(《第二十七届AAAI人工智能会议论文集》,第二十七届人工智能会议文献集,AAAI-13,华盛顿州贝尔维尤,美国(2013)),1135-1141
[76] Konstan,J.A。;米勒,B.N。;Maltz,D。;Herlocker,J.L。;Gordon,L.R。;Riedl,J.,《Grouplens:将协作过滤应用于usenet新闻》,Commun。ACM,40,3,77-87(1997)
[77] Koren,Y。;Bell,R.M.,《协作过滤的进展》(Ricci,F.;Rokach,L.;Shapira,B.,《推荐系统手册》(2015),Springer),77-118
[78] 库韦利斯,P。;Yu,G.,鲁棒离散优化及其应用(1997),Kluwer:Kluwer-Dordrecht·兹比尔0873.90071
[79] Kunaver,M。;Pozrl,T.,《推荐系统的多样性——一项调查》,Knowl-基于系统。,123, 154-162 (2017)
[80] 克韦顿,B。;塞佩斯瓦里,C。;温,Z。;Ashkan,A.,《级联盗贼:学习在级联模型中排名》,(《第三十二届机器学习国际会议论文集》,第三十二次机器学习国际大会论文集,ICML-15,法国里尔(2015)),767-776
[81] 拉布雷切,C。;Huédé,F.L.,Miriad:mcda的一个工具套件,(EUSFLAT’05(2005)会议记录),204-209
[82] Leskovec,J。;克劳斯,A。;Guestrin,C。;Faloutsos,C。;VanBriesen,J.M。;Glance,N.S.,网络中的成本效益暴发检测,(第13届ACM SIGKDD国际知识发现和数据挖掘会议论文集。第13届AC M SIGKDD国际知识发现与数据挖掘会议文献集,KDD-07,美国加利福尼亚州圣何塞(2007)),420-429
[83] Loepp,B。;侯赛因,T。;齐格勒,J.,协同过滤推荐系统的基于选择的偏好激发,(2014年SIGCHI计算机系统人为因素会议论文集。2014年SIGC计算机系统人为因子会议论文集,CHI-14,加拿大安大略省多伦多(2014)),3085-3094
[84] 织机,G。;Sugden,R.,《后悔理论:不确定性下理性选择的替代理论》,《经济学》。J.,92,805-824(1982)
[85] Louviere,J.J。;Hensher,医学博士。;Swait,J.D.,《陈述选择方法:分析与应用》(2000),剑桥大学出版社:剑桥大学出版社·Zbl 0992.91002号
[86] 卢·T。;Boutiler,C.,《投票协议中的稳健近似和增量启发》,(《第二十二届人工智能国际联合会议论文集》,第二十二届国际人工智能联合会议论文,2011年,西班牙加泰罗尼亚巴塞罗那,IJCAI-11),287-293
[87] 卢卡斯,C.G。;Griffiths,T.L。;徐,F。;Fawcett,C.,儿童偏好学习和选择预测的理性模型,(神经信息处理系统进展21。神经信息处理系统进展21,IPS-08(2008)),985-992
[88] Luce,R.D.,《个人选择行为:理论分析》(1959年),Wiley·Zbl 0093.31708号
[89] Marichal,J.-L。;梅耶,P。;Roubens,M.,《排序多属性备选方案:TOMASO方法》,计算。操作。研究,32,861-877(2005)·Zbl 1071.90550号
[90] McFadden,D.,定性选择行为的条件逻辑分析,(Zarembka,P.,《计量经济学的前沿》(1974),学术出版社,105-142
[91] 麦金蒂,L。;Reilly,J.,《评论推荐人的演变》(Ricci,F.;Rokach,L.;Shapira,B.;Kantor,P.B.,《推荐人系统手册》(2011),Springer),419-453
[92] Minka,T.P.,近似贝叶斯推理的期望传播,(第十七届人工智能不确定性会议论文集。第十七届人工智能不确定性会议论文集,UAI-01,美国华盛顿州西雅图(2001)),362-369
[93] Minoux,M.,最大化子模集函数的加速贪婪算法,(第八届IFIP优化技术会议论文集。第八届优化技术IFIP会议论文集,德国瓦茨堡(1978)),234-243·Zbl 0372.90128号
[94] Naamani-Dery,L。;戈兰,我。;Kalech,M。;Rokach,L.,《使用Borda投票规则的群体决策偏好启发》,《群体决策》。黑人。,24, 6, 1015-1033 (2015)
[95] Neal,R.M.,《切片取样》,《Ann.Stat.》,第31、3、705-770页(2003年)·Zbl 1051.65007号
[96] 纳姆豪泽,G.L。;洛杉矶沃尔西。;Fisher,M.L.,最大化子模集函数的近似分析-I,数学。程序。,14, 1, 265-294 (1978) ·Zbl 0374.90045号
[97] Ng,A。;Russell,S.,《反向强化学习算法》(第十七届国际机器学习会议论文集,第十七届机器学习国际会议论文集),ICML-00,斯坦福,加利福尼亚州,美国(2000),663-670
[98] 佩尔尼,P。;维亚皮亚尼,P。;Boukhetem,A.,《使用等级相关效用模型进行风险下决策的增量偏好启发》,(第三十二届人工智能不确定性会议论文集。第三十二次人工智能不确定度会议论文集,UAI-16,美国纽约州纽约市(2016))
[99] Perrault,A。;Boutilier,C.,自主加热和冷却系统的经验偏好启发,(第十八届自主代理和多代理系统会议记录。第十八届自主代理和多代理系统会议记录,AAMAS-19,加拿大魁北克省蒙特利尔市(2019)),431-439
[100] 价格,R。;Messinger,P.R.,《最佳推荐集:涵盖用户偏好的不确定性》,(《第二十届全国人工智能会议论文集》,第二十届国家人工智能会议文献集,AAAI-05,匹兹堡,宾夕法尼亚州,美国(2005)),541-548
[101] 里根,K。;Boutiler,C.,马尔可夫决策过程的基于后悔的奖励启发,(第二十五届人工智能不确定性会议论文集。第二十五届人造智能不确定性大会论文集,UAI-09,蒙特利尔,QC,加拿大(2009)),444-451
[102] 雷利,J。;麦卡锡,K。;麦金蒂,L。;Smyth,B.,《动态评论》,(第七届基于案例推理进展欧洲会议论文集。第七届欧洲基于案例推理发展会议论文集,ECCBR-04,西班牙马德里(2004)),763-777
[103] 雷利,J。;麦卡锡,K。;麦金蒂,L。;Smyth,B.,《增量批评》,Knowl-基于系统。,18, 4-5, 143-151 (2005)
[104] 雷利,J。;张杰。;麦金蒂,L。;Pu,P。;Smyth,B.,《评估复合评论推荐人:一项实际用户研究》,(第八届ACM电子商务会议论文集。第八届AC电子商务会议文献集,2007年,美国加利福尼亚州圣地亚哥),114-123
[105] 伦德尔,S。;弗洛伊登塔勒,C。;Schmidt-Thieme,L.,为下一个基础建议分解个性化马尔可夫链,(第19届国际万维网会议论文集。第19届世界万维网大会论文集,WWW-10,美国北卡罗来纳州罗利市(2010)),811-820
[106] 雷尼,J。;Srebro,N.,《协作预测的快速最大边际矩阵分解》,(第二十二届机器学习国际会议论文集,第二十二届国际机器学习大会论文集,ICML-05,德国波恩(2005))
[107] 里克尔梅,C。;塔克,G。;Snoek,J.,深度贝叶斯土匪决战:汤普森抽样的贝叶斯深度网络的实证比较,(第六届学习表征国际会议论文集。第六届学习表征国际会议论文集,ICLR-18,温哥华,不列颠哥伦比亚省,美国(2018))
[108] Saaty,T.,《层次分析过程、规划、优先级设置、资源分配》(The Analytic Hierarchy Process,Planning,Priority Setting,Resource Allocation)(1980),麦格劳-希尔:麦格劳–希尔纽约·Zbl 0587.90002号
[109] Sahoo,N。;Singh,P.V。;Mukhopadhyay,T.,协作过滤的隐马尔可夫模型,Manag。信息系统。Q.,36,4(2012)
[110] Salakhutdinov,R。;Mnih,A.,概率矩阵分解,(神经信息处理系统进展20。神经信息处理系统进展20,NIPS-07,加拿大不列颠哥伦比亚省温哥华(2007),1257-1264
[111] Salo,A。;Hämäläinen,R.P.,《多属性评估中的偏好比——不完全信息下的启发和决策程序》,IEEE Trans。系统。人类网络。,31, 6, 533-545 (2001)
[112] Salo,A。;Hämäläinen,R.P.,《偏好规划——不完全信息下的多准则加权模型》,(《多准则分析手册》,《多准则研究手册》,应用优化,第103卷(2010年),施普林格出版社),167-187·Zbl 1207.90001号
[113] 萨维奇,L.J.,《统计决策理论》,J.Am.Stat.Assoc.,46,253,55-67(1951)·Zbl 0042.14302号
[114] Savage,L.J.,《统计学基础》(1954年),威利:威利纽约·Zbl 0055.12604号
[115] 塞尔文,S。;布洛克瑟姆,M。;Khuri,A.I。;摩尔,M。;科尔曼,R。;布莱斯,G.R。;哈根斯,J.A。;Chalmers,T.C。;麦克斯韦,E.A。;Smith,G.N.,《致编辑的信》,《美国统计》,第29、1、67-71页(1975年)
[116] 沙尼·G。;赫克曼,D。;Brafman,R.I.,基于MDP的推荐系统,J.Mach。学习。第6号决议,1265-1295(2005)·Zbl 1222.68406号
[117] 隋,Y。;庄,V。;J.W.伯迪克。;Yu,Y.,《依赖武器的多燃料土匪》(《第三十三届人工智能不确定性会议论文集》,第三十三次人工智能不确定度会议论文集,UAI-17,澳大利亚悉尼(2017))
[118] Swaminathan,A。;克里希纳穆尔西,A。;阿加瓦尔,A。;杜迪克,M。;Langford,J。;Jose,D。;Zitouni,I.,板岩建议的非政策评估,(神经信息处理系统进展30。神经信息处理系统进展30,IPS-17,美国加利福尼亚州长滩(2017)),3632-3642
[119] Taghipour,N。;卡丹,A。;Ghidary,S.S.,《基于Usage-based web recommendations:a reinforcement learning approach》,(《第一届ACM推荐系统会议论文集》,《第一届AMC推荐系统会议文献集》,RecSys07(2007),ACM:美国明尼阿波利斯ACM出版社),113-120
[120] Tan,Y.K。;Xu,X。;Liu,Y.,改进的基于会话的推荐递归神经网络,(推荐系统深度学习第一次研讨会论文集。推荐系统深度教学第一次研讨会文献集,美国马萨诸塞州波士顿(2016)),17-22
[121] Tehrani,A.F。;Cheng,W。;Dembczynski,K。;Hüllermier,E.,《使用Choquet积分学习单调非线性模型》,(《欧洲数据库机器学习和知识发现会议论文集》,《欧洲数据库中机器学习与知识发现会议文献集》,ECML-PKDD 2011,希腊雅典(2011)),414-429
[122] Teso,S。;Dragone,P。;Passerini,A.,《协同批评:偏好和特征的激发》,(《第三十届AAAI人工智能会议论文集》,第三十届美国AAAI-17会议论文集,美国加利福尼亚州旧金山(2017)),2639-2645
[123] Teso,S。;帕塞里尼,A。;Viappiani,P.,通过集合最大边际学习进行建构性偏好启发,(第二十五届国际人工智能联合会议论文集,第二十五届人工智能国际联合会议论文,IJCAI-16,纽约,美国纽约州纽约市(2016)),2067-2073
[124] Teso,S。;Passerini,A。;Viappiani,P.,《多用户对集合最大边际的建构性偏好启发》,(第五届算法决策理论国际会议论文集。第五届国际算法决策理论会议论文集,ADT-17,卢森堡(2017)),3-17·Zbl 1398.91225号
[125] 托拉,V。;Narukawa,Y.,《建模决策-信息融合和聚合算子》(2007),Springer
[126] O.图比亚。;豪泽,J.R。;Simester,D.I.,基于自适应选择的联合分析的多面体方法,J.Mark.Res.,41,1,116-131(2004)
[127] Train,K.E.,《模拟离散选择方法》(2009),剑桥大学出版社:剑桥大学出版社,英国剑桥·Zbl 1269.62073号
[128] A.特维斯基。;Kahneman,D.,《不确定性下的判断:启发式和偏见》,《科学》,18541571124-1131(1974)
[129] van den Oord,A。;迪尔曼,S。;Schrauwen,B.,基于深度内容的音乐推荐,(神经信息处理系统进展26。神经信息处理系统进展26,IPS-13,美国内华达州塔霍湖(2013),2643-2651
[130] 瓦尔加斯,S。;巴尔特鲁纳斯,L。;卡拉佐格鲁,A。;Castells,P.,《推荐系统体裁多样性中的覆盖率、冗余度和尺寸意识》,(《第八届ACM推荐系统会议论文集》,《第八次ACM推荐器系统会议论文集中》,RecSys-14,美国加利福尼亚州硅谷福斯特城(2014)),209-216
[131] 维亚皮亚尼,P。;Boutiler,C.,会话式推荐系统中基于后悔的最优推荐集,(第三届ACM推荐系统会议论文集。第三届AC推荐系统会议文献集,RecSys-09,纽约州纽约市,美国(2009)),101-108
[132] 维亚皮亚尼,P。;Boutiler,C.,最佳贝叶斯推荐集和近视最佳选择查询集,(神经信息处理系统进展23。神经信息处理系统进展23,IPS-10,加拿大不列颠哥伦比亚省温哥华(2010),2352-2360
[133] 维亚皮亚尼,P。;Boutiler,C.,建议集和选择查询:没有勘探/开发权衡!,(《第二十五届美国人工智能学会人工智能会议论文集》,第二十五届人工智能学会会议论文集,美国加利福尼亚州旧金山,AAAI-11(2011)),1571-1574
[134] 维亚皮亚尼,P。;Faltings,B。;Pu,P.,《使用示例-评论和建议的基于偏好的搜索》,J.Artif。智力。Res.,27,465-503(2006)·Zbl 1182.68066号
[135] 维亚皮亚尼,P。;Kroer,C.,使用最大效用准则对建议集进行稳健优化,(第三届算法决策理论国际会议论文集。第三届国际算法决策理论会议论文集,ADT-13(2013)),411-424·Zbl 1406.91091号
[136] Wald,A.,《统计决策函数》(1950),威利出版社:威利纽约·兹比尔0040.36402
[137] Wang,H。;Wang,N。;Yeung,D.-Y.,推荐系统的协作深度学习,(第二十届ACM SIGKDD国际知识发现和数据挖掘会议论文集。第二十届AMM SIGKDD国际知识发现与数据挖掘会议文献集,KDD-15,澳大利亚悉尼(2015)),1235-1244
[138] Wang,Y。;欧阳,H。;王,C。;陈,J。;阿萨莫夫,T。;Chang,Y.,《全页面推荐的高效有序组合半强盗》,(《第三十一届AAAI人工智能会议论文集》,第三十届AAAI-17会议论文集,美国加利福尼亚州旧金山(2017)),2746-2753
[139] 翁,P。;Zanuttini,B.,《未知报酬下马尔可夫决策过程的交互式值迭代》,(第二十届国际人工智能联合会议论文集,第二十届人工智能联合大会论文集,IJCAI-13,中国北京(2013)),2415-2421
[140] 威廉,M。;Ramanathan,A。;博诺莫,A。;Jain,S。;Chi,E.H。;Gillenwater,J.,《YouTube上关于确定性点过程的实用多元化建议》,(第27届ACM信息和知识管理国际会议论文集。第27届AC M信息和信息管理国际会议文献集,CIKM-18,意大利都灵(2018)),2165-2173
[141] 吴春云。;艾哈迈德,A。;Beutel,A。;Smola,A.J。;Jing,H.,Recurrent recommender networks,(第十届ACM网络搜索和数据挖掘国际会议论文集。第十届APM网络搜索与数据挖掘国际大会论文集,WSDM-17,英国剑桥(2017)),495-503
[142] Yager,R.R.,《关于多准则决策中的有序加权平均聚合算子》,IEEE Trans。系统。人类网络。,18, 183-190 (1998) ·Zbl 0637.90057号
[143] 张杰。;Pu,P.,会话推荐系统中复合批评生成的比较研究,(第四届自适应超媒体和自适应基于Web的系统国际会议论文集。第四届自适应超媒体和自适应基于Web的系统国际会议论文集,AH-06,都柏林,爱尔兰(2006)),234-243
[144] X.赵。;夏,L。;张,L。;丁,Z。;尹,D。;Tang,J.,面向页面推荐的深度强化学习,(第12届ACM推荐系统会议论文集。第12届AC推荐系统会议文献集,RecSys-18,加拿大不列颠哥伦比亚省温哥华(2018)),95-103
[145] 齐格勒,C。;麦克尼,S.M。;Konstan,J.A。;Lausen,G.,通过主题多样化改进建议列表,(第十四届万维网国际会议论文集。第十四届国际万维网会议论文集,WWW-05,日本千叶(2005)),22-32
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。