×

一种非参数空间测试,用于确定形成微生物组的因素。 (英语) Zbl 1435.62400号

摘要:高通量测序技术的出现使得来自DNA材料的数据随时可用,导致微生物组相关研究激增,建立了微生物组健康标记与特定结果之间的联系。然而,要利用微生物群落的力量,我们不仅必须了解它们如何影响我们,而且还必须了解它们可以如何受到影响以改善结果。这一领域一直被一些方法所主导,这些方法将社区构成简化为汇总指标,而这些方法可能无法充分利用社区数据的复杂性。最近,人们开发了一些方法来模拟群落中分类群的丰度,但这些方法可能需要大量计算,并且不能考虑微生物聚落的空间效应。这些空间效应在微生物群落环境中尤其重要,因为我们预计距离较近的群落比距离较远的群落更相似。在本文中,我们为存在-缺失指标提出了一个灵活的贝叶斯尖峰-实验室变量选择模型,该模型考虑了分类群之间的空间依赖性和相互依赖性,同时降低了两个方向的维数。我们通过仿真表明,在存在空间相关性的情况下,流行的基于距离的假设检验方法无法保持其宣传的大小,并且该方法改进了变量选择。最后,我们介绍了我们的方法在美国邻接地区家庭内发现的室内真菌群落中的应用。

MSC公司:

62页第10页 统计学在生物学和医学中的应用;元分析
62G10型 非参数假设检验
62H25个 因子分析和主成分;对应分析
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Anderson,M.J.(2001年)。一种新的非参数多元方差分析方法。澳大利亚生态学26 32-46。
[2] Banerjee,S.(2005)。空间建模中的大地测量距离计算。生物统计学61 617-625。
[3] Barberán,A.,Dunn,R.R.,Reich,B.J.,Pacifici,K.,Laber,E.B.,Menninger,H.L.,Morton,J.M.,Henley,J.B.,Leff,J.W.等人(2015)。家庭灰尘中微观生命的生态学。程序。英国皇家学会。,生物科学B。282 212-220之间。
[4] Bray,J.R.和Curtis,J.T.(1957年)。威斯康星州南部山地森林群落的排序。经济。单声道。27 325-349.
[5] Castillo,I.和van der Vaart,A.(2012年)。大海捞针:可能稀疏序列的后向集中。Ann.Statist公司。40 2069-2101. ·Zbl 1257.62025号 ·doi:10.1214/12-AOS1029
[6] Chen,J.和Li,H.(2013)。稀疏Dirichlet多项式回归的变量选择及其在微生物组数据分析中的应用。附录申请。统计数字7 418-442·Zbl 1454.62317号 ·doi:10.1214/12-AOAS592
[7] Clark,J.S.、Nemergut,D.、Seyednasrollah,B.、Turner,P.J.和Zhang,S.(2017)。生物多样性分析的广义联合属性建模:中位零,多元,多种数据。经济。单声道。87 34-56.
[8] Clarke,K.R.(1993)。社区结构变化的非参数多元分析。澳大利亚。《经济学杂志》。18 117-143。
[9] Craven,P.和Wahba,G.(1978年)。使用样条函数平滑噪声数据。数字。数学。31 377-403. ·Zbl 0377.65007号 ·doi:10.1007/BF01404567
[10] Dannemiller,K.C.、Gent,J.F.、Leaderer,B.P.和Peccia,J.(2016)。住房特征对哮喘儿童家中细菌和真菌群落的影响。室内空气26 179-192。
[11] Dunn,R.R.、Fierer,N.、Henley,J.B.、Leff,J.W.和Menninger,H.L.(2013)。家庭生活:构成家庭内部和家庭之间细菌多样性的因素。公共科学图书馆ONE 8 e64133。
[12] Ferguson,T.S.(1973)。一些非参数问题的贝叶斯分析。Ann.Statist公司。1 209-230. ·Zbl 0255.62037号 ·doi:10.1214/aos/1176342360
[13] Flores,G.E.、Henley,J.B.和Fierer,N.(2012年)。一种直接PCR方法,用于加速人类相关微生物群落的分析。《公共科学图书馆·综合》7 e44563。
[14] Fry,J.A.、Xian,G.、Jin,S.、Dewitz,J.A、Homer,C.G.、Limin,Y.、Barnes,C.A.、Herold,N.D.和Wickham,J.D.(2011年)。完成2006年与美国接壤的国家土地覆盖数据库。照片。工程遥感器77 858-864。
[15] Gelfand,A.E.、Kottas,A.和MacEachern,S.N.(2005年)。基于Dirichlet过程混合的贝叶斯非参数空间建模。J.Amer。统计师。协会100 1021-1035·Zbl 1117.62342号 ·doi:10.1198/0162145000002078
[16] George,E.I.和McCulloch,R.E.(1993)。通过吉布斯采样选择变量。J.Amer。统计师。协会88 881-889。
[17] Grantham,N.S.、Reich,B.J.、Pacifici,K.、Laber,E.B.、Menninger,H.L.、Henley,J.B.、BarberáN,A.、Leff,J.W.、Fierer,N.等人(2015)。真菌鉴定了灰尘样品的地理来源。公共图书馆·综合频道10 e0122605。
[18] Grantham,N.S.、Reich,B.J.、Borer,E.T.和Gross,K.(2017年)。MIMIX:设计实验中微生物组数据的贝叶斯混合效应模型。手稿正在审核中·Zbl 1445.62267号
[19] 霍尔·P、米勒·H·G和姚·F(2008)。利用潜在高斯过程对稀疏广义纵向观测进行建模。J.R.统计社会服务。B.统计方法。70 703-723. ·Zbl 05563365号 ·doi:10.1111/j.1467-9868.2008.00656.x
[20] Hamada,N.和Fujita,T.(2002年)。空调对真菌污染的影响。大气。环境。36 5443-5448.
[21] Harris,I.、Jones,P.D.、Osborn,T.J.和Lister,D.H.(2014)。更新了每月气候观测的高分辨率网格——CRU TS3.10数据集。国际气候杂志。34 623-642.
[22] Hastie,T.、Tibshirani,R.和Friedman,J.(2009)。《统计学习的要素:数据挖掘、推断和预测》,第二版,《统计学中的斯普林格系列》。纽约州施普林格·Zbl 1273.62005年
[23] Heather,J.M.和Chain,B.(2016年)。测序仪的序列:DNA测序的历史。基因组学107 1-8。
[24] 人类微生物组项目联盟(2012年)。健康人体微生物组的结构、功能和多样性。自然486 207-214。
[25] Kettleson,E.M.、Adhikari,A.、Vesper,S.、Coombs,K.、Indugula,R.和Reponen,T.(2015)。家庭中真菌和细菌微生物组的关键决定因素。环境。第138 130-135号决议。
[26] Kuo,L.和Mallick,B.(1998年)。回归模型的变量选择。Sankhya B 60 65-81·Zbl 0972.62016号
[27] Lee,S.、Huang,J.Z.和Hu,J..(2010)。二进制数据的稀疏逻辑主成分分析。附录申请。《美国联邦法律大全》第4卷第1579-1601页·Zbl 1202.62084号 ·doi:10.1214/10-AOAS327
[28] Lorenz,E.N.(1956年)。经验正交函数和统计天气预报。
[29] McArdle,B.H.和Anderson,M.J.(2001)。多元模型与社区数据的拟合:基于距离的冗余分析评论。生态学82 290-297。
[30] Mitchell,T.J.和Beauchamp,J.J.(1988)。线性回归中的贝叶斯变量选择。J.Amer。统计师。协会83 1023-1036。James Berger和C.L.Mallows的评论以及作者的回复·Zbl 0673.62051号 ·doi:10.1080/01621459.1988.10478694
[31] Nelsen,R.B.(1999)。Copulas简介。统计学讲义139。纽约州施普林格·Zbl 0909.62052号
[32] Ovaskainen,O.、Hottola,J.和Siitonen,J.(2010年)。通过多元logistic回归对物种共现进行建模,产生了关于真菌相互作用的新假设。生态学91 2514-2521。
[33] O.Ovaskainen、D.B.Roy、R.Fox和B.J.Anderson(2016)。利用空间显式联合物种分布模型揭示物种群落中隐藏的空间结构。方法经济学。进化。7 428-436.
[34] Ovaskainen,O.、Tikhonov,G.、Norberg,A.、Guillaume Blanchet,F.、Duan,L.、Dunson,D.、Roslin,T.和Abrego,N.(2017)。如何从社区数据中获取更多信息?概念框架及其作为模型和软件的实现。经济。莱特。20 561-576.
[35] Petrone,S.、Guindani,M.和Gelfand,A.E.(2009年)。功能数据的混合Dirichlet混合模型。J.R.统计社会服务。B.统计方法。71 755-782. ·Zbl 1248.62079号 ·文件编号:10.1111/j.1467-9868.2009.00708.x
[36] 秦J.、李Y.、蔡Z.、李S.、朱J.、张F.、梁S.、张W.、关Y.等人(2012)。2型糖尿病患者肠道微生物群的全基因组关联研究。自然490 55-60。
[37] Ravel,J.、Gajer,P.、Abdo,Z.、Schneider,G.M.、Koenig,S.S.K.、McCulle,S.L.、Karlebach,S.、Gorle,R.、Russell,J.等人(2011年)。育龄妇女阴道微生物群。程序。国家。阿卡德。科学。美国108 4680-4687。
[38] Reich,B.J.和Fuentes,M.(2007年)。飓风表面风场的多元半参数贝叶斯空间建模框架。附录申请。统计数字1 249-264·兹比尔1129.62114 ·doi:10.1214/07-AOAS108
[39] Reuter,J.A.、Spacek,D.V.和Snyder,M.P.(2015)。高通量测序技术。分子细胞58 586-597。
[40] Ročková,V.和George,E.I.(2018年)。尖刺加拉索。J.Amer。统计师。协会113 431-444·Zbl 1398.62186号 ·doi:10.1080/016214519.2016.1260469
[41] Rodríguez,A.、Dunson,D.B.和Gelfand,A.E.(2010年)。潜在的破坏过程。J.Amer。统计师。协会105 647-659·Zbl 1392.60050号 ·doi:10.1198/jasa.2010.tm08241
[42] Round,J.L.和Mazmanian,S.K.(2009年)。肠道微生物群在健康和疾病期间形成肠道免疫反应。Nat.Rev.,免疫学。9 313-323。
[43] Serban,N.、Staicu,A.-M.和Carroll,R.J.(2013)。多级交叉相关二进制纵向数据。生物统计学69 903-913·Zbl 1419.62440号 ·doi:10.1111/biom.12083
[44] Sethuraman,J.(1994)。Dirichlet先验的构造性定义。统计师。Sinica 4 639-650号·Zbl 0823.62007号
[45] Shirota,S.、Gelfand,A.E.和Banerjee,S.(2017年)。使用Dirichlet过程的空间联合物种分布建模·Zbl 1421.62154号
[46] Singh,S.P.、Staicu,A.、Dunn,R.R.、Fierer,N.和Reich,B.J.(2019年)。补充“识别微生物组形成因素的非参数空间测试”DOI:10.1214/19-AOAS1262SUPP·Zbl 1435.62400号
[47] Stein,M.L.(1999)。空间数据插值:克里格的一些理论。统计学中的斯普林格系列。纽约州施普林格·Zbl 0924.62100号
[48] Thorson,J.T.、Scheuerell,M.D.、Shelton,A.O.、See,K.E.、Skaug,H.J.和Kristensen,K.(2015)。空间因子分析:一种用于估计物种范围内联合物种分布和相关性的新工具。方法经济学。进化。6 627-637.
[49] Turnbaugh,P.J.、Hamady,M.、Yatsunenko,T.、Cantarel,B.L.、Duncan,A.、Ley,R.E.、Sogin,M.L.、Jones,W.J.、Roe,B.A.等人(2009年)。肥胖和瘦双胞胎的核心肠道微生物群。自然457 480-484。
[50] Wadsworth,W.D.、Argiento,R.、Guindani,M.、Galloway-Pena,J.、Shelburne,S.A.和Vannucci,M.(2017)。用于分析微生物组数据中分类丰度的综合贝叶斯-狄里克勒多项式回归模型。BMC生物信息。1894。
[51] Wang,T.和Zhao,H.(2017)。将膳食营养素与肠道微生物联系起来的Dirichlet-tree多项式回归模型。生物计量学73 792-801·Zbl 1522.62251号
[52] Warton,D.I.(2011)。使用广义估计方程分析高维数据的正则三明治估计。生物统计学67 116-123·Zbl 1216.62186号 ·doi:10.1111/j.1541-0420.2010.01438.x
[53] Warton,D.I.、Wright,S.T.和Wang,Y.(2012)。基于距离的多元分析混淆了位置和分散效应。方法经济学。进化。3 89-101.
[54] Zhao,N.、Chen,J.、Carroll,I.M.、Ringel-Kulka,T.、Epstein,M.P.、Zhou,H.、Zhuo,J.和Ringel,Y.、Li,H.等人(2015)。使用MiRKAT进行微生物组构分析研究的测试,这是一种基于微生物组回归的核关联测试。Am.J.Hum.遗传学。96 797-807.
[55] Zhou,J.、Bhattacharya,A.、Herring,A.H.和Dunson,D.B.(2015)。大稀疏张量的贝叶斯分解。J.Amer。统计师。协会110 1562-1576·Zbl 1373.62282号 ·doi:10.1080/01621459.2014.983233
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。