×

通过时间效应的算法偏差放大:进化网络中PageRank的案例。 (英语) Zbl 1475.68030号

摘要:偏差会削弱算法的有效性。例如,广泛使用的PageRank算法的年龄偏差会削弱其在不断增长的网络中对节点进行有效排序的能力。现有的分析结果无法完全解释PageRank的时间偏差,这些分析结果预测了预期PageRank得分与给定节点的indegree之间的线性关系。我们表明,在演化网络中,在平均场近似下,节点的预期PageRank得分可以表示为节点的indegree和以前被忽略的年龄因子的乘积,该年龄因子可以“放大”indegere的年龄偏差。我们使用两个著名的经验网络来表明,我们的分析结果解释了观察到的PageRank的年龄偏差,并且当存在年龄偏差放大时,它们能够对节点PageRank得分进行估计,这比仅基于局部结构信息的估计更准确。一个具有可调分类的增长定向网络模型表明,在度相关网络中,精度增益更大。我们的方法可以用于分析研究其他类型的排名偏差。

MSC公司:

68英里11 互联网主题
68瓦05 非数值算法
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 恩图西,E。;法法里奥斯,P。;Gadiraju,美国。;碘缺乏症,V。;内杰德尔,W。;维达尔,M.-E.,《数据驱动人工智能系统中的偏见——介绍性调查》,威利跨学科评论:数据最小知识发现,10,3,文章e1356 pp.(2020)
[2] 张,S。;梅多,M。;吕,L。;Mariani,M.S.,《成长网络中排名算法的长期影响》,《信息科学》,488257-271(2019)
[3] Sêrbu,A。;佩德莱斯基,D。;Giannotti,F。;Kertész,J.,《算法偏差放大了意见分裂和两极分化:有界置信模型》,《公共科学图书馆综合》,第14、3期,第0213246页(2019年)
[4] Voosen,P.,《人工智能侦探》,《科学》,357,22-27(2017)
[5] 拉旺,I。;塞布里安,M。;Obradovich,N。;邦加德,J。;Bonnefon,J.-F。;Breazeal,C.,《机器行为》,《自然》,568,7753,477-486(2019)
[6] Friedkin,N.E.,《中心性度量的理论基础》,《美国社会学杂志》,96,6,1478-1504(1991)
[7] 布林,S。;Page,L.,《大型超文本网络搜索引擎剖析》,《计算网络ISDN系统》,30,1,107-117(1998)
[8] A.N.兰维尔。;Meyer,C.D.,《谷歌的PageRank及其以外:搜索引擎排名科学》(2011),普林斯顿大学出版社·Zbl 1270.68005号
[9] 陈,P。;谢浩。;马斯洛夫,S。;Redner,S.,用谷歌的PageRank算法寻找科学宝藏,J Informetr,1,1,8-15(2007)
[10] Dunaiski,M。;盖尔登胡伊斯,J。;Visser,W.,《作者等级评定》,J Informetr,12,3,679-702(2018)
[11] 江,B。;赵,S。;Yin,J.,《预测交通流量的自组织自然道路:敏感性研究》,《统计力学理论实验杂志》,2008,07,P07008(2008)
[12] Gleich,D.F.,《网页之外的网页排名》,SIAM Rev,57,3,321-363(2015)·Zbl 1336.05122号
[13] Franceschet,M.,PageRank:《站在巨人的肩膀上》,《ACM社区》,54、6、92-101(2011)
[14] Walker,D。;谢浩。;严,K.-K。;Maslov,S.,使用网络流量模型对科学出版物进行排名,J Stat Mech Theory Exp,2007,06,P06010(2007)
[15] Mariani,M.S。;梅多,M。;Zhang,Y.-C,《不断增长的网络中的节点排名:当PageRank失败时》,Sci Rep,516181(2015)
[16] 廖,H。;马里亚尼,M.S。;梅多,M。;Zhang,Y.-C。;Zhou,M.-Y.,《进化复杂网络排名》,Phys Rep,689,1-54(2017)·Zbl 1366.91124号
[17] 卡里米,F。;Génois,M。;瓦格纳,C。;辛格,P。;Strohmaier,M.,“嗜同性影响少数群体在社交网络中的排名”,科学代表,8,1,1-12(2018)
[18] Vaccario,G。;梅多,M。;加宽,N。;Mariani,M.S.,《在大型引文网络中量化和抑制排名偏差》,J Informetr,11,3,766-782(2017)
[19] Mariani,M.S。;梅多,M。;张永川,通过时间平衡网络中心性识别里程碑论文,J Informetr,10,4,1207-1223(2016)
[20] Mariani,M.S。;梅多,M。;Lafond,F.,《重要专利的早期识别:引文网络指标的设计和验证》,Technol Forecast Soc Change,146,644-654(2019)
[21] 徐,S。;Mariani,M.S。;吕,L。;Medo,M.,《排名指标的无偏评估揭示了科学技术引文数据的一致表现》,J Informetr,14,1,Article 101005 pp.(2020)
[22] Mariani,M.S。;Lü,L.,《社会系统中基于网络的排名:三大挑战》,《物理复杂性杂志》,第1、1期,第011001条,pp.(2020)
[23] 霍尔姆,P。;Saramäki,J.,《时态网络》,Phys Rep,519,3,97-125(2012)
[24] 福图纳托,S。;波哥尼亚,M。;弗拉米尼,A。;Menczer,F.,从学位中近似PageRank,(web-graph算法和模型国际研讨会(2006),Springer),59-71·Zbl 1142.68311号
[25] 福图纳托,S。;波哥尼亚,M。;弗拉米尼,A。;Menczer,F.,《关于PageRank的局部估计:平均场方法》,《互联网数学》,4,2-3,245-266(2007)·Zbl 1291.60091号
[26] 德多梅尼科,M。;利马,A。;穆格尔,P。;Musolesi,M.,《科学谣言的剖析》,科学代表,3,1,1-9(2013)
[27] Barabási,A.-L.,《网络科学》(2016),剑桥大学出版社·兹比尔1353.94001
[28] Ren,Z.-M。;Mariani,M.S。;Zhang,Y.-C。;Medo,M.,《用尊重时间的零模型随机化增长网络》,Phys Rev E,97,5,文章052311 pp.(2018)
[29] 曾,A。;沈,Z。;周,J。;吴杰。;范,Y。;Wang,Y.,《科学的科学:从复杂系统的角度》,Phys Rep,714,1-73(2017)·Zbl 1377.91146号
[30] 里克尔梅,F。;González-Cantergiani,P.,《衡量用户对推特的影响:一项调查》,Inf Process Manage,52,5,949-975(2016)
[31] 郭,Q。;周,T。;刘建国。;Bai,W.-J。;Wang,B.-H。;Zhao,M.,用可调分类系数成长无标度小世界网络,Physica A,371,2814-822(2006)
[32] 吕,L。;周,T。;张庆明。;Stanley,H.E.,网络节点的H指数及其与度和核心度的关系,《自然通讯》,7,1,1-7(2016)
[33] 莫隆,F。;Makse,H.A.,《通过优化渗流实现复杂网络的影响最大化》,《自然》,524,7563,65-68(2015)
[34] 德多梅尼科,M。;Solé-Ribalta,A。;Omodei,E。;Gómez,S。;Arenas,A.,《互联多层网络排名揭示了多功能节点》,《自然通讯》,6,1,1-6(2015)
[35] 巴蒂斯顿,F。;Cencetti,G。;Iacopini,I。;拉托拉,V。;卢卡斯,M。;Patania,A.,《超越两两相互作用的网络:结构和动力学》,Phys Rep(2020)·Zbl 1472.05143号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。