×

基于变分EM的成分数据的潜在网络估计和变量选择。 (英语) Zbl 07546467号

摘要:网络估计和变量选择在统计文献中得到了广泛的研究,但直到最近这两个挑战才被同时解决。在本文中,我们寻求开发一种新的方法来同时估计计数数据,特别是具有固定和约束的成分数据的相关协变量的网络交互和关联。我们使用具有潜在层的分层贝叶斯模型,并使用尖峰-平顶先验来进行边缘和协变量选择。对于后验推理,我们开发了一种新的带有期望最大化步长的变分推理方案,以实现有效的估计。通过仿真研究,我们证明了该模型在网络恢复精度方面优于现有方法。我们通过微生物组数据的应用展示了我们模型的实用性。研究表明,人体微生物组对人体的许多功能都有贡献,也与许多疾病有关。在我们的应用中,我们试图更好地理解微生物和相关协变量之间的相互作用,以及微生物之间的相互作用。我们将我们的算法称为网络和协变量的同步推理,并提供了一个Python实现,该实现可以在线获得。

MSC公司:

62至XX 统计
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Barbieri,M.M。;Berger,J.O.,“最佳预测模型选择”,《统计年鉴》,32870-897(2004)·Zbl 1092.62033号 ·doi:10.1214/009053604000000238
[2] 布莱,D.M。;Kucukelbir,A。;McAuliffe,J.D.,“变量推断:统计学家评论”,《美国统计协会杂志》,第112期,第859-877页(2017年)·doi:10.1080/01621459.2017.1285773
[3] Brown,P.J。;Vannucci,M。;Fearn,T.,“多元贝叶斯变量选择和预测,皇家统计学会期刊,B辑,60627-641(1998)·Zbl 0909.62022号 ·doi:10.1111/1467-9868.00144
[4] Carbonetto,P。;Stephens,M.,“回归中贝叶斯变量选择的可缩放变量推断及其在遗传关联研究中的准确性,贝叶斯分析,773-108(2012)·Zbl 1330.62089号 ·doi:10.1214/12-BA703
[5] 陈,J。;Li,H.,“稀疏Dirichlet多元回归的变量选择及其在微生物组数据分析中的应用,应用统计年鉴,7418-42(2013)·Zbl 1454.62317号 ·doi:10.1214/12-AOAS592
[6] 洛杉矶大卫。;莫里斯,C.F。;卡莫迪,R.N。;Gootenberg,D.B。;巴顿,J.E。;沃尔夫,B.E。;Ling,A.V。;德夫林,A.S。;瓦尔马,Y。;Fischbach,文学硕士。;Biddinger,S.B。;杜顿,R.J。;Turnbaugh,P.J.,“饮食快速且可繁殖地改变人类肠道微生物组,自然,50559-563(2014)·doi:10.1038/nature18220
[7] Dempster,A.,“协方差选择,生物统计学,28157-175(1972)·doi:10.2307/2528966
[8] 南卡罗来纳州德斯潘德。;Ročková,V。;George,E.I.,“用多元尖峰-拉索同时选择变量和协方差,计算与图形统计杂志,28921-931(2019)·Zbl 07499036号 ·doi:10.1080/10618600.2019.1593179
[9] Edwards,V.L。;史密斯,S.B。;E.J.McComb。;Tamarelle,J。;马,B。;汉弗莱斯,M.S。;Gajer,P。;Gwilliam,K。;Schaefer,A.M。;赖,S.K。;Terplan,M。;马克·K·S。;布罗特曼,R.M。;福尼·L·J。;巴伏尔,P.M。;Ravel,J.,“宫颈阴道微生物宿主相互作用调节沙眼衣原体感染,MBio,10,e01548-19(2019)·doi:10.1128/mBio.01548-19
[10] 范,J。;Li,R.,“通过非证实惩罚可能性及其Oracle属性进行变量选择,美国统计协会杂志,96,1348-1360(2001)·Zbl 1073.62547号 ·doi:10.1198/016214501753382273
[11] 方,H。;黄,C。;赵,H。;Deng,M.,“gCoda:成分数据的条件依赖网络推断,计算生物学杂志,24,699-708(2017)·doi:10.1089/cmb.2017.0054
[12] 费特威斯,J.M。;塞拉诺,M.G。;布鲁克斯,J.P。;爱德华兹·D·J。;Girerd,P.H。;帕里赫,H.I。;黄,B。;Arodz,T.J。;Edupuganti,L。;Glascock,A.L。;徐,J。;希门尼斯,N.R。;南卡罗来纳州维瓦德利。;Fong,S.S。;谢斯,联合国。;Jean,S。;李,V。;Bokhari,Y.A。;Lara,A.M。;Mistry,S.D。;Duckworth,R.A.3rd;布拉德利,S.P。;科帕德,V.N。;奥伦达,X.V。;米尔顿,S.H。;Rozycki,S.K。;马特维耶夫(A.V.Matveyev)。;Wright,M.L。;Huzurbazar,S.V。;Jackson,E.M。;Smirnova,E。;Korlach,J。;蔡永川。;Dickinson,M.R。;布鲁克斯,J.L。;Drake,J.I。;查芬,D.O。;Sexton,A.L。;格雷维特,M.G。;鲁本斯,C.E。;Wijesooriya,北卡罗来纳州。;亨德里克斯·穆尼奥斯,K.D。;杰斐逊,K.K。;施特劳斯,J.F.第三;Buck,G.A.,“阴道微生物组与早产,自然医学,251012-1021(2019)·doi:10.1038/s41591-019-0450-2
[13] 弗里德曼,J。;哈斯蒂,T。;Tibshirani,R.,“用图形拉索进行稀疏逆协方差估计,生物统计学,9,432-441(2008)·Zbl 1143.62076号 ·doi:10.1093/biostatistics/kxm045
[14] E.I.乔治。;McCulloch,R.E.,“贝叶斯变量选择方法,中国统计,7339-373(1997)·Zbl 0884.62031号
[15] Girvan,M。;Newman,M.E.,“社会和生物网络中的社区结构,国家科学院学报,7821-7826(2002)·Zbl 1032.91716号 ·doi:10.1073/pnas.122653799
[16] 格洛尔,G.B。;麦克莱姆,J.M。;Pawlowsky-Glahn,V。;Egozcue,J.J.,“微生物组数据集是组成的:这不是可选的,微生物学前沿,8,22-24(2017)·doi:10.3389/fmicb.2017.02224
[17] Huang,X.、Wang,J.和Liang,F.(2016),“贝叶斯变量选择的变分算法”,arXiv:1602.07640。
[18] Jiang,H.,Fei,X.,Liu,H.、Roeder,K.、Lafferty,J.、Wasserman,L.、Li,X.和Zhao,T.(2019),巨著:高维无向图估计。R软件包版本1.3.3。
[19] Kook,J.H。;沃恩,K.A。;DeMaster,D.M。;Ewing-Cobbs,L。;Vannucci,M.,“BVAR-连接:大脑连接网络推断的多主体向量自回归模型的变分贝叶斯方法”,神经信息学,19,39-56(2021)·doi:10.1007/s12021-020-09472-w
[20] 科斯洛夫斯基,M。;Vannucci,M.,“MicroBVS:Dirichlet-Tree多项式回归模型与贝叶斯变量选择——R包”,BMC生物信息学,21,301(2020)·doi:10.1186/s12859-020-03640-0
[21] Z.D.库尔茨。;缪勒,C.L。;米拉尔迪,E.R。;Littman,D.R。;M.J.Blaser。;Bonneau,R.A.,“微生物生态网络的稀疏和组成稳健推断,PLOS计算生物学,11,1-25(2015)·doi:10.1371/journal.pcbi.1004226
[22] Lenkoski,A。;Dobra,A.,“基于G-Wishart先验的高斯图形模型中与推理相关的计算方面,计算与图形统计杂志,20,140-157(2011)·文件编号:10.1198/jcgs.2010.08181
[23] 李振瑞。;McComick,T.H。;Clark,S.J.,“使用贝叶斯潜在高斯图形模型推断口头尸检中的症状关联,贝叶斯分析,15781-807(2020)·Zbl 1459.62096号 ·doi:10.1214/19-ba1172
[24] 李振瑞。;McCormick,T.H.,“高斯图形模型的期望条件最大化方法,计算与图形统计杂志,28,767-777(2019)·Zbl 07499025号 ·doi:10.1080/10618600.2019.1609976
[25] 明绍森,N。;Bühlmann,P.,“Lasso的高维图和变量选择”,《统计学年鉴》,341436-1462(2006)·Zbl 1113.62082号
[26] 苗,Y。;Kook,J.H。;卢,Y。;金达尼,M。;Vannucci,M。;Yanan,F。;史密斯,M。;诺特·D。;Dortet-Berandet,J.,灵活贝叶斯回归模型,计数数据的可缩放贝叶斯变量选择回归模型,187-219(2020),伦敦:Elsevier,伦敦
[27] 米切尔·T·J。;Beauchamp,J.J.,“线性回归中的贝叶斯变量选择,美国统计协会杂志,83,1023-1032(1988)·Zbl 0673.62051号 ·doi:10.1080/01621459.1988.10478694
[28] Ntzoufras,I。;Dellaportas,P。;Forster,J.J.,“广义线性模型的贝叶斯变量和链接确定,统计规划和推断杂志,111,165-180(2003)·Zbl 1033.62026号 ·doi:10.1016/S0378-3758(02)00298-7
[29] Raftery,A.E.,“近似贝叶斯因子和广义线性模型中模型不确定性的解释,生物特征,83,251-266(1996)·Zbl 0864.62049号 ·doi:10.1093/biomet/83.2.251
[30] 雷·K。;Szabo,B.,“稀疏先验高维线性回归的变分贝叶斯”,《美国统计协会杂志》(2021年)
[31] 理查森,S。;Bottolo,L.,贝叶斯统计,9,高维数据稀疏回归分析的贝叶斯模型,539-569(2010),牛津大学出版社
[32] Rothman,A.J。;莱维纳,E。;Zhu,J.,“具有协方差估计的稀疏多元回归,计算与图形统计杂志,19947-962(2010)·doi:10.1198/jcgs.2010.09188
[33] Roverato,A.,“非可分解图的超逆Wishart分布及其在高斯图形模型贝叶斯推断中的应用”,《斯堪的纳维亚统计杂志》,29,391-411(2002)·兹比尔1036.62027 ·doi:10.1111/1467-9469.00297
[34] 罗奇科娃,V。;George,E.I.,“Emvs:贝叶斯变量选择的EM方法,美国统计协会期刊,109,828-846(2014)·Zbl 1367.62049号 ·doi:10.1080/01621459.2013.869223
[35] 塞拉诺,M.G。;帕里赫,H.I。;布鲁克斯,J.P。;爱德华,D.J。;Arodz,T.J。;Edupuganti,L。;黄,B。;Girerd,P.H。;博卡里,Y.A。;Bradley,S.P.,“怀孕期间阴道微生物组动态的种族多样性,自然医学,251001-1011(2019)·doi:10.1038/s41591-019-0465-8
[36] Sha,N。;Vannucci,M。;Tadesse,M.G。;Brown,P.J。;德拉戈尼,I。;戴维斯,N。;罗伯茨,T.C。;可竞争性,A。;鲑鱼,M。;巴克利,C。;Falciani,F.,“在多项式Probit模型中选择贝叶斯变量以识别疾病阶段的分子特征,生物统计学,60,812-819(2004)·Zbl 1274.62428号 ·doi:10.1111/j.0006-341X.2004.00233.x
[37] Stingo,F。;陈,Y。;Vannucci,M。;屏障,M。;Mirkes,P.,“微RNA调控网络推断的贝叶斯图形建模方法”,《应用统计学年鉴》,2024-2048(2010)·Zbl 1220.62142号
[38] Talhouk,A。;Doucet,A。;Murphy,K.,“具有稀疏逆相关矩阵的多元概率模型的有效贝叶斯推断,计算与图形统计杂志,21739-757(2012)·doi:10.1080/10618600.2012.679239
[39] Tang,Y。;马,L。;Nicolae,D.,“微生物组数据Dirichlet-Tree多项式模型的系统发育扫描测试”,《应用统计年鉴》,第12期,第1-26页(2018年)·兹比尔1393.62102
[40] Tibshirani,R.,“通过拉索进行回归收缩和选择,皇家统计学会期刊,B辑,58,267-288(1996)·Zbl 0850.62538号 ·doi:10.1111/j.2517-6161.1996.tb02080.x
[41] Titsias,M.K。;Lázaro-Gredilla,M.,《神经信息处理系统的进展,多任务和多核学习的尖峰和平板变分推断》,2339-2347(2011),纽约州红钩市:纽约州红勾市Curran Associates Inc
[42] 瓦伦蒂,P。;罗莎,L。;Capobianco,D。;Lepanto,M.S。;Schiavi,E。;Cutone,A。;帕萨诺,R。;Mastromarino,P.,“乳杆菌和乳铁蛋白在粘膜宫颈阴道防御中的作用,免疫学前沿,9,376(2018)·doi:10.3389/fimmu.2018.00376
[43] 芬奇,G。;文图拉,V。;史密斯,M。;Kass,R.,“潜在图形模型中的调整正则化:应用于多神经元峰值计数数据,应用统计年鉴,121068-1095(2018)·Zbl 1405.62210号
[44] Wadsworth,W.D。;Argiento,R。;Guindani,M。;Galloway-Pena,J。;谢尔本,S.A。;Vannucci,M.,“用于分析微生物组数据中分类丰度的综合贝叶斯-狄里克勒多元回归模型,BMC生物信息学,18,94(2017)·doi:10.1186/s12859-017-1516-0
[45] Wang,H.,“贝叶斯图形拉索模型和有效后验计算,贝叶斯分析,771-790(2012)·Zbl 1330.62041号 ·doi:10.1214/12-BA729
[46] Wang,H.,“扩大规模:图形模型中的随机搜索结构学习,贝叶斯分析,10,351-377(2015)·Zbl 1335.62068号
[47] Yang,Y。;陈,N。;Chen,T.,“使用分层贝叶斯统计模型从宏基因组数据推断环境因素-微生物和微生物-微生物关联,细胞系统,4,129-137(2017)·doi:10.1016/j.cels.2016.12.012
[48] 袁,M。;Lin,Y.,“高斯图形模型中的模型选择和估计,生物特征,94,19-35(2007)·Zbl 1142.62408号 ·doi:10.1093/biomet/asm018
[49] Zou,H.,“适应性套索及其甲骨文属性”,《美国统计协会杂志》,第101期,第1418-1429页(2006年)·Zbl 1171.62326号 ·doi:10.1198/016214500000735
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。