×

估计大型特征丰富图中潜在的特征-特征交互作用。 (英语) Zbl 1491.68167号

概述:现实世界复杂网络描述对象之间的连接;在现实中,这些物体往往被赋予某种特征。这些功能的存在与否如何与网络链接结构相互作用?虽然这里描述的情况确实无处不在,但处理此类大型图的研究数量有限。以前的许多工作都认为同质性是将节点特征转换为链接的唯一可能的传输机制。相反,其他作者开发了更复杂的模型,这些模型能够处理复杂的特征交互,但不适合扩展到非常大的网络。我们扩展了MGJ模型,其中特征对之间的交互可以促进或阻止链接形成。在这项工作中,我们将研究如何估计该模型中潜在的特征-特征交互作用。我们将提出两种解决方案:第一种方案假设特征独立,本质上基于朴素贝叶斯;第二种基于感知器,放松了独立性假设。事实上,我们表明可以将模型方程转换为感知器的预测规则。我们分析了感知器的经典结果在这种背景下是如何解释的;然后,我们为这个任务定义了一个快速简单的感知器类算法,它可以在几分钟内处理(10^8)个链接。然后,我们将这两种技术进行了比较,首先是与遵循我们模型的合成数据集进行比较,从而获得证据表明,天真独立假设在实践中是有害的。其次,我们考虑一个真实的大规模引文网络,其中每个节点(即论文)可以用不同类型的特征进行描述;在那里,我们的算法可以评估每个特征集解释链接的能力,从而找到有意义的潜在特征-特征交互。

MSC公司:

68T05型 人工智能中的学习和自适应系统
05C82号 小世界图形、复杂网络(图形理论方面)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Edoardo M.Airoldi、David M.Blei、Stephen E.Fienberg和Eric P.Xing,混合成员随机块模型,J.Mach。学习。第9号决议(2008年6月),1981-2014年·Zbl 1225.68143号
[2] S.O Aral、J.P.Hughes、B.Stoner、W.Whittington、H.H.Handsfield、R.M.Anderson和K.K.Holmes,淋菌和衣原体感染传播中的性别混合模式。,《美国公共卫生杂志》89(1999),第6期,825-833。
[3] Halil Bisgin、Nitin Agarwal和Xiaowei Xu,《社交媒体上的亲同性研究》,万维网15(2012),第2期,213-232。
[4] C.M.Bishop,模式识别和机器学习(信息科学和统计),Springer-Verlag New York,Inc.,2006年·Zbl 1107.68072号
[5] Paolo Boldi、Irene Crimaldi和Corrado Monti,《以具有竞争的潜在属性结构为特征的网络模型》,《信息科学》(2016),-·Zbl 1398.91477号
[6] Ronald L.Breiger,《个人和群体的双重性》,《社会力量》53(1974),第2期,181-190。
[7] Guido Caldarelli、Andrea Capocci、Paolo De Los Rios和Miguel A Munoz,《不同顶点内在适合度的无标度网络》,《物理评论》89(2002),第25期,第258702页。
[8] V.R.Carvalho和W.W.Cohen,单程在线学习:性能、投票方案和在线功能选择,Proc。第12届acm sigkdd,2006年,第548-553页。
[9] Nicolo Cesa Bianchi、Alex Conconi和Claudio Gentile,《在线学习算法的泛化能力》,IEEE信息理论汇刊50(2004),第9期,2050-2057·Zbl 1295.68182号
[10] 尼科洛·塞萨·比安奇和加博尔·卢戈西,《预测、学习和游戏》,剑桥大学出版社,2006年·Zbl 1114.91001号
[11] J.Chang和D.M.Blei,《文档网络的关系主题模型》,人工智能和统计国际会议,2009年,第81-88页。
[12] Michel Chein和Marie-Laure Mugnier,基于图的知识表示:概念图的计算基础,Springer科学与商业媒体,2008年·Zbl 1168.68043号
[13] K.Crammer、O.Dekel、J.Keshet、S.Shalev-Shwartz和Y.Singer,《在线被动攻击算法》,J.Mach。学习。第7号决议(2006年),551-585·Zbl 1222.68177号
[14] Nello Cristianini和John Shawe-Taylor,《支持向量机和其他基于核的学习方法简介》,剑桥大学出版社,2000年·Zbl 0994.68074号
[15] Nilesh Dalvi和Dan Suciu,概率数据库的高效查询评估,VLDB Journal 16(2007),第4期,523-544·Zbl 1281.68095号
[16] 杰西·戴维斯(Jesse Davis)和马克·戈德里奇(Mark Goadrich),《精确再调用和roc曲线之间的关系》,第23届机器学习国际会议论文集,2006年,第233-240页。
[17] Janardhan Rao Doppa、Jun Yu、Prasad Tadepali和Lise Getoor,基于机会约束的链接预测学习算法,机器学习和数据库知识发现联合欧洲会议,2010年,第344-360页。
[18] B Everett,《潜在变量模型简介》,Springer Science&Business Media,2013年。
[19] C.Gentile,一种新的近似最大边缘分类算法,J.Mach。学习。第2号决议(2002年),213-242·Zbl 1037.68124号
[20] 查尔斯·盖尔(Charles J.Geyer)和明尼苏达大学(明尼阿波利斯统计学院),马尔可夫链蒙特卡罗最大似然。,国防技术信息中心,1992年。
[21] Neil Zhenqiang Gong、Wenchang Xu、Ling Huang、Pratek Mittal、Emil Stefanov、Vyas Sekar和Dawn Song,《社会属性网络的演变:使用google+的测量、建模和含义》,2012年acm网络测量会议论文集,第131-144页。
[22] Leo A Goodman,使用可识别和不可识别模型进行探索性潜在结构分析,《生物特征61》(1974),第2期,215-231·Zbl 0281.62057号
[23] Thomas L.Griffiths和Zoubin Ghahramani,《无限潜在特征模型与印度自助餐过程》,神经信息处理系统进展,2005年,第475-482页。
[24] Mark Hall、Eibe Frank、Geoffrey Holmes、Bernhard Pfahringer、Peter Reutemann和Ian H Witten,《weka数据挖掘软件:更新》,ACM SIGKDD探索通讯11(2009),第1期,第10-18页·Zbl 1242.68001号
[25] K.Henderson和T.Eliassi-Rad,将潜在dirichlet分配应用于大型图中的群发现,Proc。2009年acm应用计算研讨会,2009年,第1456-1461页。
[26] Neil W Henry,《潜在结构分析》,《统计科学百科全书》(1983年)。
[27] N.Hens、N.Goeyvaerts、M.Aerts、Z.Shkedy、P.Van Damme和P.Beutels,基于比利时为期两天的人口调查挖掘传染病模型的社会混合模式,BMC传染病9(2009),第1、5期。
[28] 约翰·赫兹(John Hertz)、安德斯·克罗格(Anders Krogh)和理查德·帕尔默(Richard G Palmer),《神经计算理论导论》,第一卷,基础图书,1991年。
[29] P.D.Hoff,用于描述和预测社交网络的乘法潜在因素模型。,《交换与数学组织理论》15(2009),第4期,261-272页。
[30] Jake M Hofman和Chris H Wiggins,网络模块化的贝叶斯方法,《物理评论》100(2008),第25期,258701页。
[31] Lorenzo Isella、Mariateresa Romano、Alain Barrat、Ciro Cattuto、Vittoria Colizza、Wouter Van den Broeck等,《儿科病房中的亲密接触:使用可穿戴传感器测量面对面的距离和混合方式》,《公共科学图书馆·综合》第6卷(2011年),第2期,第17144页。
[32] N.Japkowicz和S.Stephen,《阶级失衡问题:系统研究》,《智能数据分析》第6期(2002年),第5期,第429-449页·Zbl 1085.68628号
[33] Charles Kemp、Joshua B Tenenbaum、Thomas L Griffiths、Takeshi Yamada和Naonori Ueda,《具有无限关系模型的概念学习系统》,Aaai,2006年,第5页。
[34] Arijit Khan和Lei Chen,《关于不确定图建模和查询》,《VLDB En-dowment学报》8(2015),第12期,2042-2043。
[35] Myunghwan Kim和Jure Leskovec,使用多重属性图模型对具有节点属性的社交网络进行建模,arXiv预印本arXiv:1106.5053(2011)·Zbl 1253.68049号
[36] 《真实网络的乘法属性图模型》,《互联网数学》8(2012),第1-2期,第113-160页·Zbl 1245.05119号
[37] 《动态网络的非参数多群成员模型》,神经信息处理系统进展,2013年,第1385-1393页。
[38] Silvio Lattanzi和D.Sivakumar,附属网络,Proc。第四十一届acm计算理论研讨会,2009年,第427-434页·Zbl 1304.05127号
[39] Paul F Lazarsfeld,《潜在结构分析》,《心理学:科学研究》3(1959),476-543。
[40] Jure Leskovec、Deepayan Chakrabarti、Jon Kleinberg、Christos Faloutsos和Zoubin Ghahramani,《克罗内克图:网络建模方法》,《机器学习研究杂志》11(2010),第2期,985-1042·Zbl 1242.05256号
[41] Y.Liu、A.Niculescu-Mizil和W.Gryc,《主题链接lda:主题和作者社区的联合模型》,Proc。第26届机器学习国际年会,2009年,第665-672页。
[42] Miller McPherson、Lynn Smith-Lovin和James M Cook,《物以类聚:社交网络中的同性恋》,《社会学年度评论》27(2001),第1期,第415-444页。
[43] Frank McSherry和Marc Najork,《在分数相同的情况下高效计算信息检索性能度量》,欧洲信息检索会议,2008年,第414-421页。
[44] Edward Meeds、Zoubin Ghahramani、Radford M Neal和Sam T Roweis,用二进制潜在因素建模二元数据,神经信息处理系统进展,2006年,第977-984页。
[45] Jörg Menche、Amitabh Sharma、Maksim Kitsak、Susan Dina Ghiassian、Marc Vidal、Joseph Loscalzo和Albert LászlóBarabási,《通过不完全相互作用组揭示疾病-疾病关系》,《科学》347(2015),第6224期,第1257601页。
[46] Aditya Krishna Menon和Charles Elkan,通过矩阵分解进行链接预测,机器学习和数据库知识发现联合欧洲会议,2011年,第437-452页。
[47] K.T.Miller、T.L.Griffiths和M.I.Jordan,链路预测的非参数潜在特征模型。,在nips,2009年,第1276-1284页。
[48] Corrado Monti、A.Rozza、G.Zappella、M.Zignani、A.Arvidsson和E.Colleoni,《从推特数据中模拟政治不满》,Proc。《第二国际智慧》,2013年,第3页。
[49] J.Mossong,N.Hens,M.Jit等人,《与传染病传播相关的社会接触和混合模式》,《公共科学图书馆·医学》第5期(2008年),第3期,e74。
[50] Krzysztof Nowicki和Tom A B Snijders,随机块体结构的估计和预测,《美国统计协会杂志》96(2001),第455期,第1077-1087页·Zbl 1072.62542号
[51] Joseph J Pfeiffer III、Sebastian Moreno、Timothy La Fond、Jennifer Neville和Brian Gallagher,分配图模型:用相关属性建模网络结构,第23届国际互联网会议论文集,2014年,第831-842页。
[52] Michalis Potamias、Francesco Bonchi、Aristides Gionis和George Kollios,《非中心图中的K近邻》,《VLDB捐赠论文集3》(2010),第1-2期,997-1008。
[53] Frank Rosenblatt,感知器:大脑中信息存储和组织的概率模型。,《心理学评论》65(1958),第6期,第386页。
[54] ,《神经动力学原理》。感知器和大脑机制理论,DTIC文件,1961年。
[55] Stuart Russell和Peter Norvig,《人工智能:现代方法》。2010年,普伦蒂斯·霍尔,2010年·Zbl 0835.68093号
[56] D Sculley,用于快速标签高效垃圾邮件过滤的在线主动学习方法,Ceas,2007,第143页。
[57] Arnab Sinha、Zhihong Shen、Yang Song、Hao Ma、Darrin Eide、Bo-june Paul Hsu和Kuansan Wang,《微软学术服务和应用概述》,第24届万维网国际会议论文集,2015年,第243-246页。
[58] Tom A.B.Snijders和Krzysztof Nowicki,具有潜在块结构的图的随机块模型的估计和预测,分类杂志14(1997),第1期,75-100·兹伯利0896.62063
[59] Samuel A Stouffer、Louis Guttman、Edward A Suchman、Paul F Lazarsfeld、Shirley A Star和John A Clausen,《测量与预测》。(1950).
[60] Lloyd N Trefethen和David Bau III,《数值线性代数》,第50卷,暹罗,1997年·Zbl 0874.65013号
[61] Ho Chung Wu、Robert Wing Pong Luk、Kam Fai Wong和Kui Lam Kwok,《将tf-idf术语权重解释为做出相关性决策》,ACM信息系统交易(TOIS)26(2008),第3、13期。
[62] 赵旭、Volker Tresp、Kai Yu和Hans-Peter Kriegel,《学习无限隐藏关系模型》,《人工智能中的不确定性》(UAI2006)(2006)。
[63] Yang Yang、Ryan N Lichtenwalter和Nitesh V Chawla,《评估链接预测方法》,《知识与信息系统》45(2015),第3期,第751-782页。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。