雨果·赞吉;弗兰克·皮卡德;文森特·米勒;克里斯托夫·安布罗斯 大型增长网络中基于模型聚类的在线推理策略。 (英语) Zbl 1194.62096号 附录申请。斯达。 4,第2期,687-714(2010). 总结:我们采用在线评估策略在大型网络上执行基于模型的聚类。我们的工作集中在两个算法上,第一个基于随机近似EM(SAEM)算法,第二个基于变分方法。在模拟数据和实际数据上,将这两种策略与现有方法进行了比较。在2008年美国政治竞选期间,我们使用该方法解读了政治网站的连接结构。我们表明,当在随机图环境中估计混合分布的参数时,我们的基于EM的在线算法在精度和速度之间进行了很好的权衡。 引用于10文件 MSC公司: 62L20型 随机近似 62页99 统计学的应用 91F10层 历史、政治学 65C60个 统计中的计算问题(MSC2010) 05C80号 随机图(图形理论方面) 关键词:图聚类;EM算法;在线战略;web图结构分析 软件:Mixnet公司;细胞景观 PDF格式BibTeX公司 XML格式引用 \textit{H.Zanghi}等人,Ann.Appl。Stat.4,No.2,687--714(2010;Zbl 1194.62096) 全文: 内政部 参考文献: [1] Adamic,L.和Glance,N.(2005年)。政治博客圈与2004年美国大选:分裂博客。第三届Link Discovery 36-43国际研讨会论文集。纽约ACM出版社。 [2] Airoldi,E.、Blei,D.、Fienberg,S.和Xing,E.(2007年)。将随机块模型和混合隶属度相结合用于统计网络分析。统计网络分析:模型、问题和新方向。计算机科学课堂讲稿4503 57-74。柏林施普林格。 [3] Airoldi,E.、Blei,D.、Fienberg,S.和Xing,E.(2008)。混合成员随机块模型。J.马赫。学习。1981-2014年第9号决议·Zbl 1225.68143号 [4] Airoldi,E.、Blei,D.、Xing,E.和Fienberg,S.(2005)。关系数据的潜在混合成员模型。第三届链接发现、问题、方法和应用国际研讨会;第11届国际ACM SIGKDD会议82-89。纽约ACM出版社。 [5] Bickel,P.和Chen,A.(2009年)。网络模型和Newman-Girvan及其他模块的非参数视图。程序。国家。阿卡德。科学。美国106 21068-21073·Zbl 1359.62411号 [6] Broder,A.、Kumar,R.、Maghoul,F.、Raghavan,P.、Rajagopalan,S.、Stata,R.,Tomkins,A.和Wiener,J.(2000)。web中的图形结构。计算机网络33 309-320。 [7] Celeux,G.和Govaert,G.(1992年)。用于聚类的分类EM算法和两个随机版本。计算。统计师。数据分析。14 315-332. ·Zbl 0937.62605号 ·doi:10.1016/0167-9473(92)90042-E [8] Daudin,J.、Picard,F.和Robin,S.(2008)。随机图的混合模型。统计师。计算。18 1-36. ·doi:10.1007/s11222-007-9046-7 [9] Davison,B.D.(2000)。Web中的主题位置。SIGIR’00:第23届国际ACM SIGIR信息检索研究与开发会议记录272-279。纽约ACM出版社。 [10] Delyon,B.、Lavielle,M.和Moulines,E.(1999)。EM算法的随机近似版本的收敛性。安。统计师。27 94-128. ·兹比尔0932.62094 ·doi:10.1214/aos/1018031103 [11] Dempster,A.P.、Laird,N.M.和Rubin,D.B.(1977年)。通过EM算法从不完整数据中获得最大似然。J.罗伊。统计师。Soc.B 39 1-39·Zbl 0364.62022号 [12] Drugeon,T.(2005)。法国网络合法存款的技术方法。第五届国际网络存档研讨会(IWAW05),维也纳。 [13] Fouetilou,G.(2007)。Le Web et Le traitéconstitunnel européen,écoloie d'une localitéthématique。雷索144 279-304。 [14] Ghitalla,F.、Boullier,D.、Gkouskou,P.、Le Douarin,L.和Neau,A.(2003)。外部结构:操纵器,(s)批准器,网络接口。蓬皮杜公共信息中心。 [15] Handcock,M.、Raftery,A.和Tantrum,J.(2007年)。基于模型的社交网络聚类。J.罗伊。统计师。Soc.序列号。甲170 301-354·doi:10.1111/j.1467-985X.2007.00471.x [16] Hubert,L.和Arabie,P.(1985)。比较分区。J.分类2 193-218·Zbl 0587.62128号 [17] Jordan,M.、Ghahramani,Z.、Jaakkola,T.和Saul,L.(1999)。介绍图形模型的变分方法。机器。学习。37 183-233. ·Zbl 0945.68164号 ·doi:10.1023/A:1007665907178 [18] Kleinberg,J.(1999)。超链接环境中的权威源。美国医学会期刊46 604-632·Zbl 1065.68660号 ·doi:10.1145/324133.324140 [19] Latouche,P.、Birmele,E.和Ambroise,C.(2008)。图聚类的贝叶斯方法。系统生物学统计,第17号技术报告。 [20] Liu,Z.、Almhana,J.、Choulakian,V.和McGorman,R.(2006)。在线EM算法混合应用于互联网流量建模。计算。统计师。数据分析。50 1052-1071. ·Zbl 1431.62338号 [21] MacQueen,J.(1967)。对多变量观测进行分类和分析的一些方法。程序中。伯克利第五交响乐团。数学。统计师。普罗巴伯。1 281-296. 加利福尼亚大学出版社,加利福尼亚州伯克利·Zbl 0214.46201号 [22] 纽曼,M.(2006)。网络中的模块化和社区结构。程序。国家。阿卡德。科学。美国103 8577-8582。 [23] Newman,M.和Leicht,E.(2007年)。网络中的混合模型和探索性分析。程序。国家。阿卡德。科学。美国104 9564-9569·Zbl 1155.91026号 ·doi:10.1073/pnas.0610537104 [24] Ng,A.、Jordan,M.和Weiss,Y.(2002年)。关于光谱聚类:分析和算法。在神经信息处理系统14 849-856中。麻省理工学院出版社,马萨诸塞州剑桥。 [25] Nowicki,K.和Snijders,T.A.B.(2001)。随机块体结构的估计和预测。J.Amer。统计师。协会96 1077-1090·Zbl 1072.62542号 ·doi:10.1198/016214501753208735 [26] Opper,M.(1999)。在线学习的贝叶斯方法。神经网络中的在线学习16 363-378。剑桥大学出版社,马萨诸塞州剑桥·Zbl 0966.68178号 [27] Picard,F.、Miele,V.、Daudin,J.、Cottret,L.和Robin,S.(2009年)。使用MixNet解密生物网络的连接性结构。BMC生物信息学10 1-11。 [28] Salton,G.、Wong,A.和Yang,C.(1975年)。用于自动索引的向量空间模型。Commun公司。ACM 18 613-620·Zbl 0313.68082号 ·数字对象标识代码:10.1145/361219.361220 [29] Sampson,F.S.(1968年)。变革时期的新手:社会关系的实验和案例研究。康奈尔大学博士论文。 [30] Shannon,P.、Markiel,A.、Ozier,O.、Baliga,N.、Wang,J.、Ramage,D.、Amin,N.,Schwikowski,B.和Ideker,T.(2003)。Cytoscape:一个用于生物分子相互作用网络集成模型的软件环境。基因组研究13 2498-2504。 [31] Snijders,T.A.B.和Nowicki,K.(1997年)。具有潜在块结构的图的随机块结构的估计和预测。J.分类14 75-100·兹伯利0896.62063 ·数字对象标识代码:10.1007/s003579900004 [32] Titterington,D.M.(1984)。使用不完整数据的递归参数估计。J.罗伊。统计师。Soc.序列号。乙46 257-267·Zbl 0556.62061号 [33] Wang,S.和Zhao,Y.(2006)。有限混合模型Titterington递推估计的几乎必然收敛性。统计师。普罗巴伯。莱特。76 2001-2006. ·兹比尔1104.62022 ·doi:10.1016/j.spl.2006.05.017 [34] Zanghi,H.、Ambroise,C.和Miele,V.(2008)。基于Erdős-Rényi混合的快速在线图聚类。模式识别41 3592-3599·Zbl 1151.68623号 ·doi:10.1016/j.patcog.2008.06.019 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。