×

用于微生物数据分析的具有非对称非局部先验的贝叶斯稀疏多元回归。 (英语) 兹比尔1459.62208

摘要:我们提出了一种贝叶斯稀疏多元回归方法来为微生物组数据建模微生物丰度与环境因素之间的关系。我们用负二项分布对操作分类单元(OTU)的丰度计数进行建模,并通过回归将协变量与计数联系起来。我们扩展了传统的非局部先验,构造了回归系数的非对称非局部先例,以有效识别相关协变量及其影响方向。我们构建了一个层次化模型,以便于跨OTU汇集信息,从而以更高的准确性产生简约的结果。我们进行了仿真研究,将该模型下的变量选择性能与具有不对称和对称局部先验和两个频率模型的贝叶斯稀疏回归模型下的性能进行了比较。仿真结果表明,与备选方案相比,该模型识别了重要的协变量,并给出了具有良好精度的系数估计。该模型用于分析随时间收集的海洋微生物群数据集,以研究有害藻类水华条件与微生物群落的关联。

MSC公司:

62页第10页 统计学在生物学和医学中的应用;元分析
62甲12 多元分析中的估计
62J05型 线性回归;混合模型
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Aguiar-Pulido,V.、Huang,W.、Suarez-Ulloa,V.,Cickovski,T.、Mathee,K.和Narasimhan,G.(2016)。《微生物组分析的宏基因组学、亚转录组学和代谢组学方法:补充版:生物信息学方法和大宏基因组数据的应用》,《进化生物信息学》,12s1:EBO。S36436.网址https://doi.org/10.4137/EBO.S36436。
[2] Bates,S.S.、Douglas,D.J.、Doucette,G.J.和Leger,C.(1995)。“通过将细菌重新引入硅藻多序列假尼茨基藻的无菌培养物,提高软骨藻酸的产生”,《天然毒素》,3(6):428-435。
[3] Benjamini,Y.和Hochberg,Y.(1995年)。《控制错误发现率:一种实用而有力的多重测试方法》,《皇家统计学会杂志》。B系列(方法学),57(1):289-300。统一资源定位地址http://www.jstor.org/stable/2346101。 ·Zbl 0809.62014号 ·doi:10.1111/j.2517-6161.1995.tb02031.x
[4] Bidle,K.D.和Azam,F.(2001年)。“硅藻碎屑硅再生的细菌控制:细菌外水解酶和物种鉴定的意义”,《湖沼学与海洋学》,46(7):1606-1623。
[5] Brier,G.(1950)。“以概率表示的预测验证”,《每月天气评论》,78:1。
[6] Casella,G.(1985年)。“经验贝叶斯数据分析简介”,《美国统计学家》,39(2):83-87。统一资源定位地址https://amstat.tandfonline.com/doi/abs/10.1080/00031305.1985.10479400。
[7] Chen,J.和Li,H.(2013)。“稀疏Dirichlet-多项式回归的变量选择及其在微生物组数据分析中的应用”,《应用统计学年鉴》第7卷第1期·Zbl 1454.62317号 ·doi:10.1214/12-AOAS592
[8] Clooney,A.G.、Fouhy,F.、Sleator,R.D.、O’Driscoll,A.、Stanton,C.、Cotter,P.D.和Claesson,M.J.(2016)。《苹果和橙子的比较?:下一代测序及其对微生物组分析的影响》,PLOS ONE,11(2):e01482028。统一资源定位地址https://doi.org/10.1371/journal.pone.0148028。
[9] Dempster,A.P.(1972年)。“协方差选择”,《生物统计学》,157-175。
[10] Geisser,S.(1993)。预测推理,第55卷。CRC出版社·Zbl 0824.62001号
[11] Geisser,S.和Eddy,W.F.(1979年)。“模型选择的预测方法”,《美国统计协会杂志》,74(365):153-160。统一资源定位地址http://www.jstor.org/stable/2286745。 ·Zbl 0401.62036号 ·doi:10.1080/016214519979.10481632
[12] Gelfand,A.E.和Dey,D.K.(1994年)。《贝叶斯模型选择:渐近和精确计算》,《皇家统计学会杂志》。B系列(方法学),501-514·Zbl 0800.62170号 ·doi:10.1111/j.2517-6161.1994.tb01996.x
[13] Gelfand,A.E.、Dey,D.K.和Chang,H.(1992年)。“使用预测分布确定模型,并通过基于抽样的方法实现”,斯坦福大学技术报告。
[14] Gneiting,T.和Raftery,A.E.(2007年)。“严格正确的评分规则、预测和估计”,《美国统计协会杂志》,102(477):359-378·Zbl 1284.62093号 ·doi:10.1198/0162145000001437
[15] Grantham,N.S.、Reich,B.J.、Borer,E.T.和Gross,K.(2017年)。“MIMIX:设计实验微生物组数据的贝叶斯混合效应模型”,arXiv预印本arXiv:1703.07747。
[16] Higdon,D.(2002年)。“使用过程卷积的空间和时空建模”,《当前环境问题的定量方法》,37-56。斯普林格。统一资源定位地址http://link.springer.com/10.1007/978-1-4471-0657-9_2。 ·Zbl 1255.86016号
[17] Johnson,V.E.和Rossell,D.(2012年)。“高维环境下的贝叶斯模型选择”,《美国统计协会杂志》,107(498):https://doi.org/10.1080/01621459.2012.682536。统一资源定位地址http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3867525/。 ·Zbl 1261.62024号 ·doi:10.1080/01621459.2012.682536
[18] Knight,R.、Callewaert,C.、Marotz,C.、Hyde,E.R.、Debelius,J.W.、McDonald,D.和Sogin,M.L.(2017)。《微生物学和人类生物学》,《基因组学和人类遗传学年度评论》,18(1):65-86。统一资源定位地址https://doi.org/10.1146/annurev-genom-083115-022438。
[19] Lee,H.K.H.、Higdon,D.M.、Calder,C.A.和Holloman,C.H.(2005)。“通过内在过程卷积的相关数据的有效模型”,《统计建模》,5(1):53-74·Zbl 1071.62089号 ·doi:10.1191/1471082X05st085oa
[20] Lee,J.和Sison Mangus,M.(2018)。《微生物组数据联合分析的贝叶斯半参数回归模型》,《微生物学前沿》,9:522。统一资源定位地址http://www.ncbi.nlm.nih.gov/pmc/articles/PMC5879107/。
[21] Li,Q.、Guindani,M.、Reich,B.J.、Bondell,H.D.和Vannucci,M.(2017)。“均值约束下用于聚类和特征发生率选择的贝叶斯混合模型”,《统计分析与数据挖掘:美国统计局数据科学期刊》,10(6):393-409·Zbl 07260723号
[22] Mao,J.、Chen,Y.和Ma,L.(2017)。“微生物组数据的贝叶斯图形成分回归”,arXiv预印本arXiv:1712.04723。
[23] Paulson,J.N.、Stine,O.C.、Bravo,H.C.和Pop,M.(2013)。“微生物标记基因调查的差异丰度分析”,《自然方法》,10:1200。统一资源定位地址http://dx.doi.org/10.1038/nmeth.2658, https://www.nature.com/articles/nmeth.2658#补充-信息。
[24] Ren,B.,Bacallado,S.,Favaro,S..,Holmes,S.和Trippa,L.(2017a)。“微生物群落分析的贝叶斯非参数排序”,《美国统计协会杂志》,112(520):1430-1442。
[25] Ren,B.,Bacallado,S.,Favaro,S..,Vatanen,T.,Huttenhower,C.和Trippa,L.(2017b)。《微生物组数据分析中的贝叶斯非参数混合效应模型》,arXiv预印本arXiv:1711.01241·Zbl 1439.62225号 ·doi:10.1214/19-AOAS1295
[26] Robinson,M.D.、McCarthy,D.J.和Smyth,G.K.(2010年)。“edgeR:用于数字基因表达数据差异表达分析的生物导体包。”《生物信息学》,26(1):139-140。
[27] Robinson,M.D.和Oshlack,A.(2010年)。“RNA-seq数据差异表达分析的尺度归一化方法”,《基因组生物学》,11(3):R25。
[28] Rossell,D.和Telesca,D.(2017年)。“高维估计的非局部先验”,《美国统计协会杂志》,112(517):254-265。
[29] Scott,J.G.和Berger,J.O.(2010年)。“变量选择问题中的贝叶斯和经验贝叶斯多重性调整”,《统计年鉴》,2587-2619·Zbl 1200.62020年 ·doi:10.1214/10-AOS792
[30] Shin,M.、Bhattacharya,A.和Johnson,V.E.(2018年)。“超高维设置中使用非局部先验密度的可缩放贝叶斯变量选择”,《统计》,28(2):1053-1078。统一资源定位地址http://www.ncbi.nlm.nih.gov/pmc/articles/PMC5891168/。 ·Zbl 1390.62125号
[31] Shuler,K.、Sison-Mangusy,M.和Lee,J.(2019年)。“补充材料:微生物组数据分析中具有非对称非局部先验的贝叶斯稀疏多元回归”,贝叶斯分析。
[32] Sison-Mangus,M.P.、Jiang,S.、Kudela,R.M.和Mehic,S.(2016)。“有毒硅藻爆发和非爆发事件期间的浮游植物相关细菌群落组成和演替”,《微生物学前沿》,7:1433。统一资源定位地址https://www.frontiersin.org/article/10.3389/fmicb.2016.01433。
[33] Spiegelhalter,D.J.、Best,N.G.、Carlin,B.P.和Van Der Linde,A.(2002)。“模型复杂性和拟合的贝叶斯度量”,《皇家统计学会杂志:B辑(统计方法)》,64(4):583-639·兹比尔1067.62010 ·数字对象标识代码:10.1111/1467-9868.00353
[34] Wadsworth,W.D.、Argiento,R.、Guindani,M.、Galloway-Pena,J.、Shelburne,S.A.和Vannucci,M.(2017)。“用于分析微生物组数据中分类丰度的综合贝叶斯-狄利克雷多项式回归模型。”BMC生物信息学,18(1):94。统一资源定位地址https://doi.org/10.1186/s12859-017-1516-0。
[35] Witten,D.M.(2011年)。“使用泊松模型对测序数据进行分类和聚类”,《应用统计年鉴》,5(4):2493-2518·Zbl 1234.62150号 ·doi:10.1214/11-AOAS493
[36] 吴海华(2016)。“广义线性模型和广义线性混合模型中贝叶斯变量选择的非局部先验及其在生物数据中的应用”,密苏里大学博士论文。
[37] Xia,F.、Chen,J.、Fung,W.K.和Li,H.(2013)。“微生物组分数据分析的logistic正态多项式回归模型”,《生物计量学》,69(4):1053-1063·Zbl 1288.62171号 ·doi:10.1111/biom.12079
[38] 肖S.(2015)。“某些时间点过程类的贝叶斯非参数建模”,加州大学圣克鲁斯分校博士论文。统一资源定位地址https://search.proquest.com/docview/1674523183?accountid=14523, http://ucelinks.cdlib.org:8888/sfx_local?url_ver=Z39.88-2004&rft_val_fmt=info:ofi/fmt:kev:mtx:disperson&gener=论文+
[39] X·张。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。