×

图上有偏随机游动的设计及其在协作推荐中的应用。 (英语) Zbl 07485924号

摘要:这项工作研究了一种基于路径的统计物理形式主义,它受bagof-pash框架的启发,用于在转移概率(策略)偏向于某些节点特征的图上设计随机游动。更准确地说,给定一个加权有向图(G)和分配给每条边的非负代价,有偏随机游走被定义为在保持恒定相对熵率的同时最小化沿游走的期望代价率的策略。对于标准路径袋和随机最短路径框架,该模型将Gibbs-Boltzmann分布指定给无限游动集,并允许从从不同角度推导的文献中恢复已知结果。感兴趣的数量示例包括系统的分配函数、成本率、最优转移概率等。此外,同样的形式允许对预期节点访问率引入容量约束,并开发了一种计算受此类容量约束的最优策略的算法。仿真结果表明,该方法可以有效地用于定义一个马尔可夫链,将行走驱动到具有某些特定属性的节点,如资历、教育水平或低节点度(hub-avoid walk)。提出了一个依赖于最后一个属性的应用程序,作为提高协作推荐中偶然性的工具,并在MovieLens数据上进行了测试。

MSC公司:

82至XX 统计力学,物质结构
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Ibe,O.,《随机游走和扩散过程的要素》(2013),Wiley·Zbl 1294.60002号
[2] 北马苏达州。;波特,M。;Lambiotte,R.,网络上的随机行走和扩散,Phys。代表,716-717,1-58(2017)·Zbl 1377.05180号
[3] Rudnick,J。;Gaspari,G.,《随机行走的要素》(2004),剑桥大学出版社·Zbl 1086.60003号
[4] Sarkar,P。;Moore,A.,《社交网络中的随机漫步及其应用:一项调查》(Aggarwal,C.,社交网络数据分析(2011),Springer),43-77
[5] 王,Z。;郭,L。;王,S。;Chen,L。;Wang,H.,图像处理中的随机行走综述,Arch。计算。方法工程,26,1,17-34(2017)
[6] 夏,F。;刘杰。;聂,H。;Fu,Y。;Wan,L。;Kong,X.,《随机行走:算法和应用综述》,IEEE Trans。Emerg.顶部。计算。智力。,1-13 (2019)
[7] Norris,J.R.,《马尔可夫链》(1997),剑桥大学出版社·Zbl 0873.60043号
[8] Ross,S.,概率模型导论(2010),学术出版社·邮编:1184.60002
[9] Taylor,H.M。;Karlin,S.,《随机建模导论》(1998),学术出版社·Zbl 0946.60002号
[10] Page,L。;布林,S。;Motwani,R。;Winograd,T.,《Pagerank引文排名:为网络带来秩序1999-66年技术报告》
[11] 德尔文,J.-C。;Libert,A.-S.,《复杂网络的中心度测量和热力学公式》,《物理学》。E版,第83、4条,第046117页(2011年)
[12] 兰比奥特,R。;德尔文,J.-C。;Barahona,M.,《随机行走、马尔可夫过程和复杂网络的多尺度模块化组织》,IEEE Trans。Netw公司。科学。工程,1,276-90(2014)
[13] Todorov,E.,线性可解马尔可夫决策问题,(神经信息处理系统进展19。神经信息处理系统进展19,NIPS 2006(2007),麻省理工学院出版社,1369-1375
[14] Parry,W.,《内在马尔可夫链》,Trans。阿默尔。数学。Soc.,112,1,55-66(1964年)·Zbl 0127.35301号
[15] Ruelle,D.,热力学形式主义(1978),Addison-Wesley·Zbl 0401.28016号
[16] Jaynes,E.T.,信息理论和统计力学,物理学。修订版,106,620-630(1957)·兹比尔0084.43701
[17] Kardar,M.,《粒子统计物理学》(2007),剑桥大学出版社·Zbl 1148.82001号
[18] Reichl,L.E.,《统计物理现代课程》(1998年),威利·Zbl 0913.00015号
[19] Francoisse,K。;基维马基,I。;Mantrach,A。;罗西,F。;Saerens,M.,网络数据分析的bag-of-path框架,神经网络。,90, 90-111 (2017) ·Zbl 1434.68535号
[20] Mantrach,A。;Yen,L。;Callut,J。;弗朗索瓦,K。;辛博,M。;Saerens,M.,《和过路径协方差核:有向图节点之间的新协方差》,IEEE Trans。模式分析。机器。智力。,32, 6, 1112-1126 (2010)
[21] Saerens,M。;Achbany,Y。;福斯,F。;Yen,L.,随机最短路径问题:两个相关模型,神经计算。,21, 8, 2363-2404 (2009) ·Zbl 1192.90031号
[22] L.Yen,A.Mantrach,M.Shimbo,M.Saerens,概括最短路径和通勤时间距离的节点间差异度量系列,收录于:第14届ACM SIGKDD知识发现和数据挖掘国际会议论文集,KDD’08,2008年,第785-793页。
[23] 赤松,T.,循环流,马尔可夫过程和随机交通分配,交通。B号决议,30、5、369-386(1996年)
[24] Burda,Z。;杜达,J。;Luck,J。;Waclaw,B.,最大熵随机游动的局部化,物理学。修订稿。,第102、16条,第160602页(2009年)
[25] Courtain,S。;Leleux,P。;基维马基,I。;盖克斯,G。;Saerens,M.,《具有净流量和容量约束的随机最短路径》,Inform。科学。,556, 341-360 (2021) ·兹比尔1484.68157
[26] 盖克斯,G。;基维马基,I。;Saerens,M.,《图上的随机最优运输:框架和新距离度量》,Netw。科学。,7, 1, 88-122 (2019)
[27] Bavaud,F。;Guex,G.,《随机游走和最短路径之间的插值:一种路径函数方法》,(Aberer,K.;Flache,A.;Jager,W.;Liu,L.;Tang,J.;Gueret,C.,《第四届社会信息学国际会议论文集》,SocInfo’12。第四届社会信息学国际会议记录。《第四届社会信息学国际会议论文集》,SocInfo’12,《计算机科学讲稿》,第7710卷(2012),Springer),68-81
[28] 基维马基,I。;Lebichot,B。;Saramäki,J。;Saerens,M.,基于随机最短路径的两个中间性中心性度量,科学报告,6,srep19668(2016)
[29] Dial,R.,一种避免路径枚举的概率多路径分配模型,Transp。研究,583-111(1971)
[30] Oyama,Y。;Hato,E.,解决马尔可夫流量分配问题的基于棱镜的路径集限制,Transp。B号决议,122,528-546(2019年)
[31] 基维马基,I。;辛博,M。;Saerens,M.,随机最短路径理论的发展与图节点距离的比较,Physica a,393600-616(2014)·Zbl 1395.05153号
[32] 福斯,F。;Saerens,M。;Shimbo,M.,《网络数据和链接分析的算法和模型》(2016),剑桥大学出版社
[33] 阿诺德,L。;Gundlach,V.M。;德米特里厄斯,L.,正随机矩阵乘积的进化形式主义,《应用年鉴》。可能性。,4, 3, 859-901 (1994) ·Zbl 0818.15015号
[34] 比昂迪,F。;Legay,A。;尼尔森,B.F。;Wasowski,A.,最大化马尔可夫过程的熵,J.Log。代数方法程序。,83, 5, 384-399 (2014) ·Zbl 1371.68175号
[35] Y.Chen,T.T.Georgiou,M.Pavon,Ruelle-Bowen连续时间随机行走,摘自:2018年第23届网络与系统数学理论国际研讨会论文集,第496-499页。
[36] 德米特里厄斯。;Manke,T.,《鲁棒性和网络演化——熵原理》,《物理学A》,346,3,682-696(2005)
[37] Justesen,J。;Hoholdt,T.,最大熵马尔可夫链,IEEE Trans。通知。理论,30,4665-667(1984)·兹标0545.60064
[38] 辛纳屈,R。;Gómez-Gardeñes,J。;兰比奥特,R。;尼科西亚,V。;Latora,V.,《信息有限的复杂网络中的最大熵随机游动》,Phys。E版,83,第030103条,pp.(2011)
[39] Kleinberg,J.M.,超链接环境中的权威资源,J.Assoc.Compute。机器。,46, 5, 604-632 (1999) ·Zbl 1065.68660号
[40] 陈,Y。;Georgiou,T.T。;Pavon,M。;Tannenbaum,A.,《网络鲁棒传输》,IEEE Trans。自动化。控制,62,9,4675-4682(2017)·Zbl 1390.90058号
[41] 陈,Y。;Georgiou,T.T。;帕冯,M。;Tannenbaum,A.,《单一商品网络流的高效稳健路由》,IEEE Trans。自动化。控制,63,7,2287-2294(2017)·Zbl 1423.90029号
[42] Pavon,M。;Ticozzi,F.,《离散时间经典和量子马尔科夫进化:路径空间上的最大熵问题》,J.Math。物理。,第51、4条,第042104页(2010年)·Zbl 1310.81105号
[43] Todorov,E.,最优行动的有效计算,Proc。国家。阿卡德。科学。,106, 28, 11478-11483 (2009) ·Zbl 1203.68327号
[44] 佩罗蒂,J。;Billoni,O.,《聪明的随机漫步者:知道路径的代价》,Phys。E版,86,第011120条pp.(2012)
[45] Kappen,H.J.,最优控制理论的路径积分和对称破缺,J.Stat.Mech。理论实验,2005,11,P11011(2005)·Zbl 1456.49027号
[46] Busic,A。;Meyn,S.,带Kullback-Leibler成本的行动约束Markov决策过程,(第31届学习理论会议论文集。第31届学术理论会议论文录,COLT(2018),PMLR 75),1431-1444
[47] R.Fox,A.Pakman,N.Tishby,《G-learning:通过软更新控制强化学习中的噪音》,载于《第22届人工智能不确定性会议论文集》,UAI 2016年,2001年,第202-211页。
[48] Kappen,H.J。;Gómez,V。;Opper,M.,作为图形模型推理问题的最优控制,马赫数。学习。,87, 2, 159-182 (2012) ·Zbl 1243.93133号
[49] 诺伊,G。;琼森,A。;Gómez,V.,熵正则化马尔可夫决策过程的统一观点(2017),arXiv预印本arXiv:1705.07798
[50] 鲁宾,J。;O.沙米尔。;蒂什比,N.,《MDP中的交易价值和信息》,(《不完善决策者的决策》(2012),施普林格柏林-海德堡:施普林格-柏林-海德堡-柏林,海德堡),第57-74页·Zbl 1229.91106号
[51] E.A.Theodorou,D.Krishnamurthy,E.Todorov,《从信息论二重性到路径积分和Kullback-Leibler控制:连续和离散时间公式》,载于《第十六届耶鲁大学自适应和学习系统研讨会》,2013年。
[52] Theodorou,E.A。;Todorov,E.,相对熵和自由能二重性:与路径积分和KL控制的联系,(第51届IEEE决策和控制会议论文集。第51届EEE决策和控制大会论文集,CDC 2012(2012),IEEE),1466-1473
[53] Winder,P.,强化学习。智能代理的工业应用(2020),O'Reilly
[54] Y.Savas,M.Ornik,M.Cubuktepe,U.Topcu,约束Markov决策过程的熵最大化,收录于:IEEE第56届通信、控制和计算年度Allerton会议论文集,ICML’98,2018年,第515-521页·Zbl 07256276号
[55] Ahuja,R.K。;Magnanti,T.L。;Orlin,J.B.,网络流:理论、算法和应用(1993),Prentice Hall·Zbl 1201.90001号
[56] 丁,X。;Smith,S.L。;贝尔塔,C。;Rus,D.,具有线性时序逻辑约束的马尔可夫决策过程的最优控制,IEEE Trans。自动化。控制,59,5,1244-1257(2014)·Zbl 1360.90276号
[57] Fronczak,A。;Fronczak,P.,《复杂网络中的有偏随机漫步:局部导航规则的作用》,Phys。E版,80,第016107条,pp.(2009)
[58] 博纳文图拉,M。;尼科西亚,V。;Latora,V.,复杂网络上有偏随机游动的特征时间,物理学。E版,89,第012803条,pp.(2014)
[59] Backstrom,L。;Leskovec,J.,《监督随机漫步:预测和推荐社交网络中的链接》,(《第四届ACM网络搜索和数据挖掘国际会议论文集》,《第四次ACM网络检索和数据挖掘会议论文集,WSDM’11(2011),ACM),635-644
[60] Benigni,B。;加洛蒂,R。;De Domenico,M.,互联系统上的潜在驱动随机游动,Phys。版本E,104,2,第024120条pp.(2021)
[61] Riascos,A。;Mateos,L.,《加权网络上的随机游动:局部和非局部动力学研究》,J.Complex Netw。,9, 5, 1-39 (2021) ·Zbl 1481.90097号
[62] 盖,T.M。;Thomas,J.A.,《信息理论要素》(2006),威利·Zbl 1140.94001号
[63] Kapur,J.N.,《科学与工程中的最大熵模型》(1989),新时代国际·Zbl 0746.00014号
[64] 塞内尔,M。;García-Díez,S。;曼特拉赫,A。;希姆博,M。;Saerens,M。;Fouss,F.,《总和密度指数:识别图中的稠密区域》,IEEE Trans。模式分析。机器。智力。,36, 6, 1268-1274 (2014)
[65] Ekroot,L。;Cover,T.,马尔可夫轨迹的熵,IEEE Trans。通知。理论,39,4,1418-1421(1993)·Zbl 0802.60067号
[66] Gómez Gardenes,J。;Latora,V.,复杂网络上扩散过程的熵率,物理学。E版,78,6,第065102条,pp.(2008)
[67] 卡夫西,M。;Grossglauser,M。;Thiran,P.,条件马尔可夫轨迹的熵,IEEE Trans。通知。理论,59,9,5577-5583(2013)·Zbl 1364.94242号
[68] Basilevsky,A.,《统计科学中的应用矩阵代数》(1983),北荷兰·Zbl 0601.15001号
[69] Seber,G.,《统计学家矩阵手册》(2008),威利·Zbl 1143.15001号
[70] Meyer,C.D.,矩阵分析和应用线性代数(2000),工业和应用数学学会·Zbl 0962.15001号
[71] 马格纳斯,J。;Neudecker,H.,《矩阵微分学在统计学和计量经济学中的应用》(2007),威利
[72] 富兰克林,J.,矩阵理论(1968),普伦斯·霍尔·Zbl 0174.31501号
[73] García-Díez,S。;福斯,F。;辛博,M。;Saerens,M.,《占所有序列比对编辑距离的总和路径扩展》,《模式识别》。,44, 6, 1172-1182 (2011) ·Zbl 1209.68454号
[74] Bertsekas,D.P.,《非线性规划》(1999),雅典娜科学出版社·兹比尔1015.90077
[75] 博伊德,S。;Vandenberghe,L.,《凸优化》(2004),剑桥大学出版社·Zbl 1058.90049号
[76] I·格里瓦。;纳什,S。;Sofer,A.,线性和非线性优化(2008),SIAM
[77] Jebara,T.,《机器学习:歧视性和生成性》(2004),Kluwer学术出版社·兹比尔1030.68073
[78] 箭头,K。;Hurwicz,L。;Uzawa,H.,《线性和非线性规划研究》(1958),斯坦福大学出版社·Zbl 0091.16002号
[79] Rockafellar,R.,hestenes和Powell的乘数法应用于凸规划,J.Optim。理论应用。,12, 6, 555-562 (1973) ·Zbl 0254.90045号
[80] M.Gori,A.Pucci,ItemRank:推荐引擎的一种基于随机游走的评分算法,收录于:《第20届国际人工智能联合会议论文集》,IJCAI’07,2007年,第2766-2771页。
[81] T.Haveliwala,Topic-sensitive PageRank,载《第11届国际万维网会议论文集》,WWW’02,2002年,第517-526页。
[82] 南帕克。;Lee,W。;Choe,B。;Lee,S.-G.,个性化PageRank计算算法调查,IEEE Access,7163049-163062(2019)
[83] H.Tong,C.Faloutsos,J.-Y.Pan,带重启的快速随机行走及其应用,摘自:第六届IEEE数据挖掘国际会议论文集,2006年ICDM,第613-622页。
[84] 科特科夫,D。;王,S。;Veijalainen,J.,《推荐系统中的意外发现调查》,Knowl-基于系统。,111, 180-192 (2016)
[85] 拉塔比,M。;马尼根,C。;Del Vecchio,N.,《大型双模网络分析的基本概念》,《社交网络》,第30、1、31-48页(2008年)
[86] Meyer,C.D.,《随机互补、解耦马尔可夫链和几乎可约系统理论》,SIAM Rev.,31,2,240-272(1989)·Zbl 0685.65129号
[87] Tong,H。;法卢索斯,C。;Pan,J.-Y.,《重新启动的随机漫步:快速解决方案和应用程序》,Knowl。信息系统。,14, 3, 327-346 (2008) ·Zbl 1161.68701号
[88] 西格尔,S。;Castellan,J.,《行为科学的非参数统计》(1988),McGraw-Hill
[89] 福斯,F。;Pilotte,A。;伦德斯,J.-M。;Saerens,M.,图中节点之间相似性的随机遍历计算,以及协作推荐的应用,IEEE Trans。知识。数据工程,19,3,355-369(2007)
[90] M.Ge,C.Delgado,D.Jannach,《超越准确性:通过覆盖率和偶然性评估推荐系统》,载《第四届ACM推荐系统会议论文集》,RecSys,2010年,第257-260页。
[91] Herlocker,J。;Konstan,J。;Terveen,L。;Riedl,J.,评估协同过滤推荐系统,ACM Trans。信息系统。,22, 1, 5-53 (2004)
[92] 亚昆塔,L。;德杰米斯,M。;Lops,P。;塞梅拉罗,G。;菲兰尼诺,M。;Molino,P.,《在基于内容的推荐系统中引入意外发现》,(2008年第八届混合智能系统国际会议(2008),IEEE),168-173
[93] 卡普尔,K。;库马尔,V。;Terveen,L。;Konstan,J.A。;Schrater,P.,我有时喜欢探索:适应动态用户新奇偏好,(第九届ACM推荐系统会议论文集(2015),ACM),19-26
[94] S.Vargas,P.Castells,推荐系统新颖性和多样性度量的等级和相关性,见《第五届ACM推荐系统会议论文集》,2011年,第109-116页。
[95] Adamopoulos,P。;Tuzhilin,A.,《推荐系统中的意外:或如何更好地预期意外》,ACM Trans。智力。系统。技术。(TIST),第5、4、54页(2015年)
[96] 村上春树,T。;Mori,K。;Orihara,R.,《评估推荐列表偶然性的指标》,(日本人工智能学会年会(2007),施普林格),40-46
[97] Radovanović,M。;Nanopoulos,A。;Ivanović,M.,《空间中心:高维数据中常见的最近邻》,J.Mach。学习。研究,11,2487-2531(2010)·Zbl 1242.62056号
[98] M.Radovanovć,A.Nanopoulos,M.Ivanović,《关于向量空间模型中顽固结果的存在》,载于:《第33届ACM SIGIR信息检索研究与开发年会论文集》,SIGIR’10,2010年,第186-193页。
[99] I.Suzuki,K.Hara,M.Shimbo,Y.Matsumoto,M.Saerens,《研究拉普拉斯核在轮毂缩减中的有效性》,载《第26届AAAI人工智能会议论文集》,AAAI’12,2012年,第1112-1118页。
[100] 托马塞夫,N。;Radovanovic,M。;Mladenic,D。;Ivanovic,M.,hubness在高维数据聚类中的作用,IEEE Trans。知识。数据工程,26,3,739-751(2014)
[101] K.Hara,I.Suzuki,M.Shimbo,K.Kobayashi,K.Fukumizu,M.Radovanovic,《局部化中心化:减少大样本数据中的模糊性》,载于:《第29届AAAI人工智能会议论文集》,AAAI’15,2015年,第2645-2651页。
[102] S.García-Díez,E.Vandenbussche,M.Saerens,离散随机最短路径的连续状态版本,载于:第50届IEEE国际决策与控制会议论文集,CDC’11,2011年,第6570-6577页。
[103] 切特里特,R。;Touchette,H.,基于大偏差的非平衡马尔可夫过程,Ann.Henri Poincaré,16,9,2005-2057(2014)·Zbl 1330.82039号
[104] 马朱姆达尔,S.N。;Orland,H.,约束随机过程的有效langevin方程,J.Stat.Mech。理论实验,2015,6,P06039(2015)·Zbl 1456.82777号
[105] Bolhuis,P.G。;钱德勒,D。;德拉戈,C。;Geissler,P.L.,《过渡路径采样:在黑暗中,在崎岖的山口上扔绳子》,Annu。物理版。化学。,53, 1, 291-318 (2002)
[106] Das,A。;罗丝,哥伦比亚特区。;Garrahan,J.P。;Limmer,D.T.,《罕见扩散动力学的强化学习》(2021),arXiv预印本arXiv:2105.04321
[107] Kappen,H.J。;Ruiz,H.C.,控制和推理的自适应重要性抽样,J.Stat.Phys。,162, 5, 1244-1266 (2016) ·Zbl 1338.93166号
[108] Ray,U。;Chan,G.K.-L。;Limmer,D.T.,《非平衡稳态大偏差采样的重要性》。一、 化学杂志。物理。,148,12,第124120条第(2018)页
[109] Torrie,G.M。;Valleau,J.P.,《蒙特卡罗自由能估计中的非物理抽样分布:伞形抽样》,J.Compute。物理。,23, 2, 187-199 (1977)
[110] Doob,J.L.,条件布朗运动与调和函数的边界极限,Bull。社会数学。法国,85,431-458(1957)·Zbl 0097.34004号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。