任伯玉;塞尔吉奥·巴卡拉多;Stefano法瓦罗;托米·瓦塔宁;柯蒂斯·赫滕豪威尔;洛伦佐·特里帕 微生物数据分析中零膨胀成分的贝叶斯混合效应模型。 (英语) Zbl 1439.62225号 附录申请。斯达。 14,第1期,494-517(2020年). 摘要:检测微生物组成和样品特征之间的相关性是微生物组学研究中最重要的任务之一。大多数现有方法将单变量模型分别应用于单个微生物物种,并对多个假设检验进行调整。针对这种应用,我们提出了一种广义混合效应线性模型的贝叶斯分析。每个微生物成分的边际优势是一个Dirichlet过程,通过单个协变量(如疾病生物标记物或受试者的年龄)和潜在因素的线性组合,可以诱导成分之间的依赖性。潜在因素捕获剩余可变性,并通过完全贝叶斯过程从数据中学习其维数。该模型在零膨胀组分的数据分析和模拟研究中进行了测试。在这些设置和每个样品中,每个微生物物种的计数很大一部分等于零。在我们的贝叶斯模型中,缺少微生物物种的成分的概率是严格正的。我们提出了一种有效的算法,从模型参数的后验和可视化中进行采样,以揭示协变量和微生物组成之间的关联。我们在模拟研究中评估了提出的方法,然后分析了1型糖尿病婴儿的微生物组数据集,该数据集在样本特定的微生物成分中包含很大比例的零。 引用于4文件 MSC公司: 62页第10页 统计学在生物学和医学科学中的应用;元分析 62D20型 观察性研究的因果推断 62H20个 关联度量(相关性、典型相关性等) 关键词:截断相关Dirichlet过程;潜在因素模型;1型糖尿病 软件:生物导体;边缘R;DEseq公司;MIMIX公司 PDF格式BibTeX公司 XML格式引用 \textit{B.Ren}等人,Ann.Appl。Stat.14,No.1,494--517(2020;Zbl 1439.62225) 全文: 内政部 arXiv公司 欧几里得 参考文献: [1] Albert,J.H.和Chib,S.(1993年)。二进制和多光子响应数据的贝叶斯分析。J.Amer。统计师。协会88 669-679·Zbl 0774.62031号 ·doi:10.1080/01621459.1993.10476321 [2] Anders,S.和Huber,W.(2010年)。序列计数数据的差异表达分析。基因组生物学。11 R106。 [3] Arbel,J.、Mengersen,K.和Rousseau,J.(2016)。部分复制数据的贝叶斯非参数依赖模型:燃料泄漏对物种多样性的影响。附录申请。《美国联邦法律大全》第10卷第1496-1516页·Zbl 1391.62198号 ·doi:10.1214/16-AOAS944 [4] Bhattacharya,A.和Dunson,D.B.(2011年)。稀疏贝叶斯无限因子模型。生物特征98 291-306·Zbl 1215.62025号 ·doi:10.1093/biomet/asr013 [5] Borg,I.和Groenen,P.J.F.(2005)。《现代多维尺度:理论与应用》,第二版,《统计学中的斯普林格系列》。纽约州施普林格·Zbl 1085.62079号 [6] Brooks,S.P.和Gelman,A.(1998年)。监测迭代模拟收敛性的一般方法。J.计算。图表。统计师。7 434-455. [7] Chen,J.和Li,H.(2013)。稀疏Dirichlet多项式回归的变量选择及其在微生物组数据分析中的应用。附录申请。《法律总汇》第7卷第418-42页·Zbl 1454.62317号 ·doi:10.1214/12-AOAS592 [8] Fanaro,S.、Chierici,R.、Guerrini,P.和Vigi,V.(2003)。婴儿早期肠道菌群:组成和发育。医学学报。92 48-55. [9] Ferguson,T.S.(1973)。一些非参数问题的贝叶斯分析。Ann.Statist公司。1 209-230. ·Zbl 0255.62037号 ·doi:10.1214/aos/1176342360 [10] Gevers,D.,Kugathasan,S.,Denson,L.A.,Vázquez-Baeza,Y.,Van Treuren,W.,Ren,B.,Schwager,E.,Knights,D.,Song,S.J.等人(2014年)。新发克罗恩病的治疗初期微生物组。细胞宿主和微生物15 382-392。 [11] Grantham,N.S.、Guan,Y.、Reich,B.J.、Borer,E.T.和Gross,K.(2019年)。MIMIX:设计实验中微生物组数据的贝叶斯混合效应模型。J.Amer。统计师。关联0 1-16·Zbl 1445.62267号 [12] Greenblum,S.、Turnbaugh,P.J.和Borenstein,E.(2012)。人类肠道微生物组的宏基因组系统生物学揭示了与肥胖和炎症性肠病相关的拓扑变化。程序。国家。阿卡德。科学。美国109 594-599。 [13] Griffin,J.E.、Kolossiatis,M.和Steel,M.F.J.(2013)。使用相依归一化随机度量混合来比较分布。J.R.统计社会服务。B.统计方法。75 499-529. ·兹比尔1411.62083 ·doi:10.1111/rssb.12002 [14] 人类微生物组项目联盟(2012年)。健康人体微生物组的结构、功能和多样性。自然486 207-214。 [15] Ishwaran,H.和Zarepour,M.(2002年)。Dirichlet过程的精确和近似和表示。加拿大。J.统计。30 269-283. ·Zbl 1035.60048号 ·doi:10.2307/3315951 [16] James,L.F.、Likoi,A.和Prünster,I.(2009年)。具有独立增量的归一化随机测度的后验分析。扫描。《美国法律总汇》第36卷第76-97页·Zbl 1190.62052号 [17] Johnson,D.S.、Ream,R.R.、Towell,R.G.、Williams,M.T.和Leon Guerrero,J.D.(2013)。用于推断和降维的动物丰度趋势的贝叶斯聚类。《农业杂志》。生物与环境。统计数字18 299-313·Zbl 1303.62078号 ·doi:10.1007/s13253-013-0143-0 [18] Kohavi,R.(1995)。精度估计和模型选择的交叉验证和引导研究。第14届国际人工智能联合会议论文集,第2卷。IJCAI’95 1137-1143年。Morgan Kaufmann Publishers Inc.,加利福尼亚州旧金山。 [19] Kostic,A.D.、Gevers,D.、Siljander,H.、Vatanen,T.、Hyötyläinen,T.,Hämälälinen,A.-m.、Peet,A.、Tillmann,V.、PöHö,P.等人(2015年)。人类婴儿肠道微生物组在1型糖尿病发展和进展中的动态。细胞宿主和微生物17 260-273。 [20] Ledoux,M.和Talagrand,M.(2011年)。巴拿赫空间中的概率:等高线和过程。数学经典。柏林施普林格。1991年版重印·Zbl 1226.60003号 [21] Li,H.(2015)。微生物组、宏基因组学和高维成分数据分析。年。修订状态申请。2 73-94. [22] Ligoi,A.、Nipoti,B.和Prünster,I.(2014)。具有相依归一化完全随机测度的贝叶斯推理。伯努利20 1260-1291·兹比尔1309.60048 ·文件编号:10.3150/13-BEJ521 [23] Lindley,D.V.和Smith,A.F.M.(1972年)。线性模型的贝叶斯估计。J.罗伊。统计师。Soc.序列号。B 34 1-41·Zbl 0246.62050号 ·doi:10.1111/j.2517-6161.1972.tb00885.x [24] Lozupone,C.、Lladser,M.E.、Knights,D.、Stombaugh,J.和Knight,R.(2011)。UniFrac:微生物群落比较的有效距离度量。ISME期刊5 169-172。 [25] MacEachern,S.N.(2000年)。相关的Dirichlet过程。俄亥俄州立大学统计系技术报告。 [26] Morgan,X.C.、Tickle,T.L.、Sokol,H.、Gevers,D.、Devaney,K.L.、Ward,D.V.、Reyes,J.A.、Shah,S.A.、LeLeiko,N.等人(2012年)。炎症性肠病中肠道微生物组的功能失调及其治疗。基因组生物学。13 R79。 [27] Müller,P.、Quintana,F.和Rosner,G.L.(2011年)。协变量回归的产品分割模型。J.计算。图表。统计师。20 260-278. 在线提供补充材料。 [28] Paulson,J.N.、Stine,O.C.、Bravo,H.C.和Pop,M.(2013)。微生物标记基因调查的差异丰度分析。自然方法10 1200-1202。 [29] Qin,J.、Li,R.、Raes,J.,Arumugam,M.、Burgdorf,K.S.、Manichanh,C.、Nielsen,T.、Pons,N.、Levenez,F.等人(2010年)。通过宏基因组测序建立的人类肠道微生物基因目录。自然464 59-65。 [30] Quince,C.、Lundin,E.E.、Andreasson,A.N.、Greco,D.、Rafter,J.、Talley,N.J.、Agreus,L.、Andersson,A.F.、Engstrand,L.等人(2013年)。克罗恩病基因对健康人体肠道微生物群的影响:一项初步研究。肠道62 952-954。 [31] Ren,B.,Bacallado,S.,Favaro,S..,Holmes,S.和Trippa,L.(2017年)。微生物群落分析的贝叶斯非参数排序。J.Amer。统计师。协会112 1430-1442。 [32] Ren,B.,Bacallado,S.,Favaro,S..,Vatanen,T.,Huttenhower,C.和Trippa,L.(2020年)。补充“微生物数据分析中零膨胀成分的贝叶斯混合效应模型”https://doi.org/10.1214/19-AOAS1295SUPA网站,https://doi.org/10.1214/19-AOAS1295SUPPB。·Zbl 1439.62225号 [33] Robert,P.和Escoufer,Y.(1976年)。线性多元统计方法的统一工具:RV系数。J.R.统计社会服务。C.申请。《法律总汇》第25卷第257-265页。 [34] Robinson,M.D.、McCarthy,D.J.和Smyth,G.K.(2010年)。edgeR:用于数字基因表达数据差异表达分析的Bioconder软件包。生物信息学26 139-140。 [35] Rodríguez,A.和Dunson,D.B.(2011年)。通过probit stick-breaking过程的非参数贝叶斯模型。贝叶斯分析。6 145-177. ·Zbl 1330.62120号 ·doi:10.1214/11-BA605 [36] Segata,N.、Börnigen,D.、Morgan,X.C.和Huttenhower,C.(2013)。PhyloPhlAn是一种改进微生物系统发育和分类位置的新方法。国家公社。4 2304. [37] Teh,Y.W.、Jordan,M.I.、Beal,M.J.和Blei,D.M.(2006年)。分层Dirichlet过程。美国统计协会期刊101 1566-1581·Zbl 1171.62349号 ·doi:10.1198/016214500000302 [38] Vatanen,T.、Kostic,A.D.、D'Hennezel,E.、Siljander,H.、Franzosa,E.A.、Yassour,M.、Kolde,R.、Vlamakis,H.和Arthur,T.D.等人(2016)。微生物组LPS免疫原性的变化有助于人类的自身免疫。手机165 842-853。 [39] Vehtari,A.、Gelman,A.和Gabri,J.(2015)。帕雷托平滑了重要性抽样。arXiv预打印arXiv:1507.02646。 [40] Vehtari,A.、Gelman,A.和Gabri,J.(2017)。使用leave-on-out交叉验证和WAIC进行实用贝叶斯模型评估。统计计算。27 1413-1432. ·Zbl 1505.62408号 ·doi:10.1007/s11222-016-9696-4 [41] Wadsworth,W.D.、Argiento,R.、Guindani,M.、Galloway Pena,J.、Shelburne,S.A.和Vannucci,M.(2017)。用于分析微生物组数据中分类丰度的综合贝叶斯-狄里克勒多项式回归模型。BMC生物信息。18 94. [42] Xia,F.、Chen,J.、Fung,W.K.和Li,H.(2013)。微生物组分数据分析的logistic正态多项式回归模型。生物统计学69 1053-1063·Zbl 1288.62171号 ·doi:10.1111/biom.12079 [43] Xu,L.、Paterson,A.D.、Turpin,W.和Xu,W.(2015)。评估和选择零膨胀微生物组数据的竞争模型。公共科学图书馆·综合10 1-30。 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。