×

从采样数据中进行随机块体模型的变分推理。 (英语) Zbl 1437.62072号

摘要:本文讨论网络抽样过程中未观察到的二元数以及随机块模型(SBM)推断中的连续问题。我们回顾了抽样设计,并恢复了SBM的随机缺失(MAR)和非随机缺失(NMAR)条件。我们引入了可变EM算法的变体,用于在各种抽样设计(MAR和NMAR)下推断SBM,所有这些都作为R包提供。推导了基于综合分类似然的模型选择准则,用于选择块数和抽样设计。我们通过仿真研究了这些算法的准确性和适用范围。我们从民族学(种子循环网络)和生物学(蛋白质相互作用网络)两个方面探索了两个现实世界的网络,其中的解释在很大程度上取决于所考虑的抽样设计。

理学硕士:

62D10号 缺少数据
68T20型 人工智能背景下的问题解决(启发式、搜索策略等)
62K10型 统计块设计
2015年1月62日 贝叶斯推断
65K10码 数值优化和变分技术
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 艾彻,C。;雅各布斯。;Clauset,A.,“加权网络中学习潜在块结构”,《复杂网络杂志》,3,221-248(2014)·Zbl 1397.68151号 ·doi:10.1093/comnet/cnu026
[2] Airoldi,E.M。;布莱,D.M。;菲恩伯格,S.E。;Xing,E.P.,“混合成员随机块模型”,《机器学习研究杂志》,1981-2014年9月(2008年)·Zbl 1225.68143号
[3] 阿什伯恩,M。;鲍尔,C.A。;布莱克,J.A。;博茨坦,D。;巴特勒,H。;Cherry,J.M。;Davis,A.P。;Dolinski,K。;德怀特,S.S。;埃皮格,J.T。;Harris,M.A.,“基因本体:生物学统一的工具”,《自然遗传学》,25,25(2000)·doi:10.1038/75556
[4] 巴拉昌德兰,P。;Kolaczyk,E.D。;Viles,W.D.,“关于大型网络中低速率测量误差对子图计数的传播”,《机器学习研究杂志》,18,1-33(2017)·Zbl 1440.62226号
[5] 巴比隆,P。;唐纳,S。;拉泽加,E。;Bar-Hen,A.,“多路网络的随机块模型:研究人员网络的应用”,《皇家统计学会杂志》,A辑,180,295-314(2015)·doi:10.1111/rssa.12193
[6] 比克尔,P。;Choi,D。;Chang,X。;Zhang,H.,“随机块模型最大似然的渐近正态性及其变分逼近”,《统计年鉴》,411922-1943(2013)·Zbl 1292.62042号 ·doi:10.1214/13-AOS1124
[7] 比尔纳基,C。;Celeux,G。;Govaert,G.,“用综合完成可能性评估聚类的混合模型”,IEEE模式分析和机器智能汇刊,22719-725(2000)·doi:10.1109/34.865189
[8] 塞利斯,A。;Daudin,J.-J。;Pierre,L.,“随机块模型中最大似然和变分估计的一致性”,《电子统计杂志》,61847-1899(2012)·Zbl 1295.62028号 ·doi:10.1214/12-EJS729
[9] Chatterjee,S.,“基于通用奇异值阈值的矩阵估计”,《统计年鉴》,第43期,第177-214页(2015年)·Zbl 1308.62038号 ·doi:10.1214/14-AOS1272
[10] Daudin,J.-J。;皮卡德,F。;Robin,S.,“随机图的混合模型”,统计学与计算,18173-183(2008)·doi:10.1007/s11222-007-9046-7
[11] Davenport,医学硕士。;平面图,Y。;范登伯格,E。;Wootters,M.,“1位矩阵完成”,《信息与推断》,3189-223(2014)·Zbl 1309.62124号 ·doi:10.1093/imaiai/iau006
[12] O·弗兰克。;Harary,F.,“利用经验图中的传递指数进行聚类推断”,《美国统计协会杂志》,77,835-840(1982)·Zbl 0505.62043号 ·doi:10.1080/01621459.1982.10477895
[13] Goldenberg,A。;郑亚欣。;菲恩伯格,S.E。;Airoldi,E.M.,“统计网络模型调查”,机器学习中的基础和趋势®,2,129-233(2010)·Zbl 1184.68030号 ·doi:10.1561/2200000005
[14] Handcock,M.S.公司。;Gile,K.J.,“从抽样数据建模社会网络”,《应用统计年鉴》,2010年第4期,第5-25页·Zbl 1189.62187号 ·doi:10.1214/08-AOAS221
[15] 荷兰,P.W。;Laskey,K.B。;Leinhardt,S.,“随机块模型:第一步”,《社交网络》,5109-137(1983)·doi:10.1016/0378-8733(83)90021-7
[16] M.I.乔丹。;加赫拉马尼,Z。;Jaakkola,T.S。;Saul,L.K.,《图形模型学习》,“图形模型变分方法简介”,105-161(1998),多德雷赫特:施普林格·Zbl 0910.68175号
[17] 卡勒,B。;Newman,M.E.J.,“网络中的随机块模型和社区结构”,《物理评论》E,83,016107(2011)·doi:10.1103/PhysRevE.83.016107
[18] Kolaczyk,E.D.,《网络数据、方法和模型的统计分析》(2009),纽约:施普林格出版社,纽约·Zbl 1277.62021号
[19] 拉贝里,V。;Deu,M。;巴纳德,A。;Calatayud,C。;Buiron,M。;Wambugu,P。;曼内尔,S。;Glassmann,J.-C。;Leclerc,C.,“民族语言多样性对肯尼亚东部自给农业系统高粱遗传模式的影响”,《公共科学图书馆·综合》,第9期,e92178页(2014年)·doi:10.1371/journal.pone.0092178
[20] 拉贝里,V。;托马斯,M。;Muthamia,Z.K。;Leclerc,C.,“种子交换网络、种族性和高粱多样性”,《美国国家科学院院刊》,113,98-103(2016)·doi:10.1073/pnas.1513238112
[21] 拉图什,P。;比梅莱,埃及。;Ambroise,C.,“重叠随机块模型在法国政治博客圈中的应用”,《应用统计年鉴》,5309-336(2011)·Zbl 1220.62083号 ·doi:10.1214/10-AOAS382
[22] 拉图什,P。;Birmelé,É。;Ambroise,C.,“随机块模型的变分贝叶斯推断和复杂性控制”,《统计建模》,第12期,第93-115页(2012年)·Zbl 1420.62114号
[23] 拉图什,P。;罗宾,S。;Ouadah,S.,随机图的Logistic模型的拟合优度(2017)
[24] Little,R.J。;Rubin,D.B.,《缺失数据的统计分析》(2014年),新泽西州霍博肯:新泽西州威利
[25] Mariadassou,M。;罗宾,S。;Vacher,C.,“揭示有值图中的潜在结构:变分方法”,《应用统计学年鉴》,4715-742(2010)·Zbl 1194.62125号 ·doi:10.1214/10-AOAS361
[26] 马蒂亚斯,C。;Miele,V.,“通过动态随机块模型对时间网络进行统计聚类”,《皇家统计学会杂志》,B辑,791119-1141(2016)·Zbl 1373.62312号 ·doi:10.1111/rssb.12200
[27] 马蒂亚斯,C。;Robin,S.,“通过潜在空间模型建模随机图中的异质性:选择性综述”,ESAIM:Proceedings and Surveys,47,55-74(2014)·Zbl 1335.05002号 ·doi:10.1051/proc/201447004
[28] Molenberghs,G。;Beunckens,C。;索托,C。;Kenward,G.M.,“每一个非随机模型的缺失都有一个同等拟合的随机对应缺失”,《皇家统计学会期刊》,B辑,70,371-388(2008)·Zbl 1148.62046号 ·doi:10.1111/j.1467-9868.2007.00640.x
[29] 诺维基,K。;Snijders,T.A.B.,“随机区块结构的估计和预测”,《美国统计协会杂志》,961077-1087(2001)·Zbl 1072.62542号 ·doi:10.1198/016214501753208735
[30] Priebe,C.E。;苏斯曼,D.L。;唐,M。;Vogelstein,J.T.,“错误观测图的统计推断”,《计算与图形统计杂志》,24930-953(2015)·doi:10.1080/10618600.2014.951049
[31] Rand,W.M.,“聚类方法评估的客观标准”,《美国统计协会杂志》,66,846-850(1971)·doi:10.1080/01621459.1971.10482356
[32] 鲁宾,D.B.,“推断和缺失数据”,《生物特征》,63,581-592(1976)·Zbl 0344.62034号 ·doi:10.1093/生物技术/63.3581
[33] Snijders,T.A.,“社会网络的统计模型”,《社会学年度评论》,第37期,第131-153页(2011年)·doi:10.1146/annurev.soc.012809.102709
[34] Snijders,T.A。;Nowicki,K.,“具有潜在块结构的图的随机块模型的估计和预测”,分类杂志,14,75-100(1997)·Zbl 0896.62063号 ·数字对象标识代码:10.1007/s003579900004
[35] Szklarczyk,D。;弗朗西斯科尼,A。;Wyder,S。;Forslund,K。;海勒,D。;韦尔塔·塞帕斯,J。;西蒙诺维奇,M。;Roth,A。;桑托斯,A。;Tsafou,K.P。;Kuhn,M.,“字符串v10:蛋白质相互作用网络,在生命树上集成”,《核酸研究》,43,D447-D452(2015)·数字对象标识代码:10.1093/nar/gku1003
[36] 汤普森,S.K。;Frank,O.,“基于模型的估计与链追踪抽样设计”,《调查方法》,26,87-98(2000)
[37] 汤普森,S.K。;Seber,G.,《自适应采样》(1996),纽约:威利出版社,纽约·Zbl 0860.6208号
[38] Vinayak,R.K。;Oymak,S。;Hassibi,B.,《神经信息处理进展》,“缺失数据的图形聚类:凸算法与分析”(2014)
[39] 文森特,K。;Thompson,S.,用雪球采样估计网络种群的规模和分布(2015)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。