×

大型增长网络中基于模型聚类的在线推理策略。 (英语) Zbl 1194.62096号

总结:我们采用在线评估策略在大型网络上执行基于模型的聚类。我们的工作集中在两个算法上,第一个基于随机近似EM(SAEM)算法,第二个基于变分方法。在模拟数据和实际数据上,将这两种策略与现有方法进行了比较。在2008年美国政治竞选期间,我们使用该方法解读了政治网站的连接结构。我们表明,当在随机图环境中估计混合分布的参数时,我们的基于EM的在线算法在精度和速度之间进行了很好的权衡。

MSC公司:

62L20型 随机近似
62页99 统计学的应用
91F10层 历史、政治学
65C60个 统计中的计算问题(MSC2010)
05C80号 随机图(图形理论方面)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Adamic,L.和Glance,N.(2005年)。政治博客圈与2004年美国大选:分裂博客。第三届Link Discovery 36-43国际研讨会论文集。纽约ACM出版社。
[2] Airoldi,E.、Blei,D.、Fienberg,S.和Xing,E.(2007年)。将随机块模型和混合隶属度相结合用于统计网络分析。统计网络分析:模型、问题和新方向。计算机科学课堂讲稿4503 57-74。柏林施普林格。
[3] Airoldi,E.、Blei,D.、Fienberg,S.和Xing,E.(2008)。混合成员随机块模型。J.马赫。学习。1981-2014年第9号决议·Zbl 1225.68143号
[4] Airoldi,E.、Blei,D.、Xing,E.和Fienberg,S.(2005)。关系数据的潜在混合成员模型。第三届链接发现、问题、方法和应用国际研讨会;第11届国际ACM SIGKDD会议82-89。纽约ACM出版社。
[5] Bickel,P.和Chen,A.(2009年)。网络模型和Newman-Girvan及其他模块的非参数视图。程序。国家。阿卡德。科学。美国106 21068-21073·Zbl 1359.62411号
[6] Broder,A.、Kumar,R.、Maghoul,F.、Raghavan,P.、Rajagopalan,S.、Stata,R.,Tomkins,A.和Wiener,J.(2000)。web中的图形结构。计算机网络33 309-320。
[7] Celeux,G.和Govaert,G.(1992年)。用于聚类的分类EM算法和两个随机版本。计算。统计师。数据分析。14 315-332. ·Zbl 0937.62605号 ·doi:10.1016/0167-9473(92)90042-E
[8] Daudin,J.、Picard,F.和Robin,S.(2008)。随机图的混合模型。统计师。计算。18 1-36. ·doi:10.1007/s11222-007-9046-7
[9] Davison,B.D.(2000)。Web中的主题位置。SIGIR’00:第23届国际ACM SIGIR信息检索研究与开发会议记录272-279。纽约ACM出版社。
[10] Delyon,B.、Lavielle,M.和Moulines,E.(1999)。EM算法的随机近似版本的收敛性。安。统计师。27 94-128. ·兹比尔0932.62094 ·doi:10.1214/aos/1018031103
[11] Dempster,A.P.、Laird,N.M.和Rubin,D.B.(1977年)。通过EM算法从不完整数据中获得最大似然。J.罗伊。统计师。Soc.B 39 1-39·Zbl 0364.62022号
[12] Drugeon,T.(2005)。法国网络合法存款的技术方法。第五届国际网络存档研讨会(IWAW05),维也纳。
[13] Fouetilou,G.(2007)。Le Web et Le traitéconstitunnel européen,écoloie d'une localitéthématique。雷索144 279-304。
[14] Ghitalla,F.、Boullier,D.、Gkouskou,P.、Le Douarin,L.和Neau,A.(2003)。外部结构:操纵器,(s)批准器,网络接口。蓬皮杜公共信息中心。
[15] Handcock,M.、Raftery,A.和Tantrum,J.(2007年)。基于模型的社交网络聚类。J.罗伊。统计师。Soc.序列号。甲170 301-354·doi:10.1111/j.1467-985X.2007.00471.x
[16] Hubert,L.和Arabie,P.(1985)。比较分区。J.分类2 193-218·Zbl 0587.62128号
[17] Jordan,M.、Ghahramani,Z.、Jaakkola,T.和Saul,L.(1999)。介绍图形模型的变分方法。机器。学习。37 183-233. ·Zbl 0945.68164号 ·doi:10.1023/A:1007665907178
[18] Kleinberg,J.(1999)。超链接环境中的权威源。美国医学会期刊46 604-632·Zbl 1065.68660号 ·doi:10.1145/324133.324140
[19] Latouche,P.、Birmele,E.和Ambroise,C.(2008)。图聚类的贝叶斯方法。系统生物学统计,第17号技术报告。
[20] Liu,Z.、Almhana,J.、Choulakian,V.和McGorman,R.(2006)。在线EM算法混合应用于互联网流量建模。计算。统计师。数据分析。50 1052-1071. ·Zbl 1431.62338号
[21] MacQueen,J.(1967)。对多变量观测进行分类和分析的一些方法。程序中。伯克利第五交响乐团。数学。统计师。普罗巴伯。1 281-296. 加利福尼亚大学出版社,加利福尼亚州伯克利·Zbl 0214.46201号
[22] 纽曼,M.(2006)。网络中的模块化和社区结构。程序。国家。阿卡德。科学。美国103 8577-8582。
[23] Newman,M.和Leicht,E.(2007年)。网络中的混合模型和探索性分析。程序。国家。阿卡德。科学。美国104 9564-9569·Zbl 1155.91026号 ·doi:10.1073/pnas.0610537104
[24] Ng,A.、Jordan,M.和Weiss,Y.(2002年)。关于光谱聚类:分析和算法。在神经信息处理系统14 849-856中。麻省理工学院出版社,马萨诸塞州剑桥。
[25] Nowicki,K.和Snijders,T.A.B.(2001)。随机块体结构的估计和预测。J.Amer。统计师。协会96 1077-1090·Zbl 1072.62542号 ·doi:10.1198/016214501753208735
[26] Opper,M.(1999)。在线学习的贝叶斯方法。神经网络中的在线学习16 363-378。剑桥大学出版社,马萨诸塞州剑桥·Zbl 0966.68178号
[27] Picard,F.、Miele,V.、Daudin,J.、Cottret,L.和Robin,S.(2009年)。使用MixNet解密生物网络的连接性结构。BMC生物信息学10 1-11。
[28] Salton,G.、Wong,A.和Yang,C.(1975年)。用于自动索引的向量空间模型。Commun公司。ACM 18 613-620·Zbl 0313.68082号 ·数字对象标识代码:10.1145/361219.361220
[29] Sampson,F.S.(1968年)。变革时期的新手:社会关系的实验和案例研究。康奈尔大学博士论文。
[30] Shannon,P.、Markiel,A.、Ozier,O.、Baliga,N.、Wang,J.、Ramage,D.、Amin,N.,Schwikowski,B.和Ideker,T.(2003)。Cytoscape:一个用于生物分子相互作用网络集成模型的软件环境。基因组研究13 2498-2504。
[31] Snijders,T.A.B.和Nowicki,K.(1997年)。具有潜在块结构的图的随机块结构的估计和预测。J.分类14 75-100·兹伯利0896.62063 ·数字对象标识代码:10.1007/s003579900004
[32] Titterington,D.M.(1984)。使用不完整数据的递归参数估计。J.罗伊。统计师。Soc.序列号。乙46 257-267·Zbl 0556.62061号
[33] Wang,S.和Zhao,Y.(2006)。有限混合模型Titterington递推估计的几乎必然收敛性。统计师。普罗巴伯。莱特。76 2001-2006. ·兹比尔1104.62022 ·doi:10.1016/j.spl.2006.05.017
[34] Zanghi,H.、Ambroise,C.和Miele,V.(2008)。基于Erdős-Rényi混合的快速在线图聚类。模式识别41 3592-3599·Zbl 1151.68623号 ·doi:10.1016/j.patcog.2008.06.019
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。