×

IFAA:微生物组分析中绝对丰度的稳健关联识别和推断。 (英语) Zbl 1506.62447号

小结:微生物组分析中推断的目标通常是相对丰度(RA),因为样品(例如粪便)中的RA可以被视为整个生态系统(例如肠道)中RA的近似值。然而,RA的推论受到这样一个事实的影响,即RA是通过将绝对丰度(AA)除以公分母(CD)来计算的,公分母是所有AA的总和(即库大小)。因此,一个分类单元的扰动将导致CD的改变,从而导致所有其他分类单元RA的错误变化,这些错误变化可能导致假阳性/阴性结果。我们提出了一种新的分析方法(IFAA)来对生态系统的AA进行稳健推断,从而避免了由CD问题和RA组成结构引起的问题。IFAA还可以解决过度分散的问题,并处理零膨胀数据结构。IFAA在第1阶段识别与协变量相关的微生物分类群,并通过在第2阶段使用独立的参考分类群来估计关联参数。给出了两个实际的数据应用程序,广泛的模拟表明,在库大小不平衡的情况下,IFAA的性能大大优于其他现有方法。

MSC公司:

62页第10页 统计学在生物学和医学中的应用;元分析
92立方厘米32 病理学、病理生理学
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] M.J.安德森。;Legendre,P.,“线性模型中偏回归系数检验的置换方法的经验比较,统计计算与模拟杂志,62727-303(1999)·Zbl 1055.62525号 ·网址:10.1080/00949659908811936
[2] M.J.安德森。;Robinson,J.,“线性模型的置换测试,澳大利亚和新西兰统计杂志,43,75-88(2001)·Zbl 0992.62043号
[3] 亚瑟·J·C。;Gharaibeh,R.Z。;Uronis,J.M。;Perez-Chanona,E。;沙·W。;Tomkovich,S。;穆尔鲍尔,M。;Fodor,A.A。;Jobin,C.,“VSL#3益生菌可改变粘膜微生物成分但不能减少结肠炎相关结直肠癌,科学报告,32868(2013)
[4] Bráten,L.S。;瑟丁,M。;Paulsen,J.E。;Snipen,L.G。;Rudi,K.,“大肠癌小鼠模型中盲肠微生物群与肿瘤负荷的关系,健康和疾病中的微生物生态学,28,1352433(2017)·doi:10.1080/16512235.2017.1352433
[5] Cai,T.T。;Guo,Z.,“高维线性回归的置信区间:极小极大率和适应性”,《统计年鉴》,45615-646(2017)·Zbl 1371.62045号 ·doi:10.1214/16-AOS1461
[6] Castellarin,M。;Warren,R.L。;弗里曼,J.D。;Dreolini,L。;Krzywinski,M。;施特劳斯,J。;巴恩斯,R。;沃森,P。;Allen-Vercoe,E。;摩尔·R·A。;Holt,R.A.,“有核梭杆菌感染在人类结直肠癌中普遍存在,基因组研究,22299-306(2012)·doi:10.1101/gr.126516.111
[7] 陈,C。;格伦南,K。;巴德纳,J。;张,D。;Gershon,E。;Jin,L。;Liu,C.,“在表达微阵列数据分析中消除批量效应:六种批量调整方法的评估”,PLOS ONE,6,e17238(2011)·doi:10.1371/journal.pone.0017238
[8] 陈,J。;Li,H.,“稀疏Dirichlet多元回归的变量选择及其在微生物组数据分析中的应用,应用统计年鉴,7418-442(2013)·Zbl 1454.62317号 ·doi:10.1214/12-AOAS592
[9] 陈,Y。;Blaser,M.J.,“幽门螺杆菌与哮喘和过敏的反向关联,内科文献,167,821-827(2007)·doi:10.1001/archente.67.821
[10] 科尔,J.R。;王,Q。;Cardenas,E。;菲什,J。;Chai,B。;Farris,R.J。;Kulam-Syed-Mohideen,A.S。;McGarrell,D.M。;马什,T。;Garrity,G.M。;Tiedje,J.M.,“核糖体数据库项目:rRNA分析的改进比对和新工具,核酸研究,37,D141-D145(2009)·doi:10.1093/nar/gkn879
[11] 戴,Z。;Wong,S.H。;余,J。;Wei,Y.,“利用Dirichlet多元回归对微生物组数据进行批量效应校正,生物信息学,35,807-814(2018)·doi:10.1093/bioinformatics/bty729
[12] 范,J。;Li,R.,“通过非证实惩罚可能性及其Oracle属性进行变量选择”,《美国统计协会杂志》,96,1348-1360(2001)·兹比尔1073.62547 ·doi:10.1198/016214501753382273
[13] Farzan,S.F。;Gossai,A。;陈,Y。;Chasan-Taber,L。;贝克,E。;Karagas,M.,“新罕布什尔州出生队列研究中的母亲砷暴露与妊娠糖尿病和葡萄糖不耐受,环境健康:全球获取科学来源,15,106(2016)·doi:10.1186/s12940-016-0194-0
[14] Farzan,S.F。;Korrick,S。;李,Z。;Enelow,R。;甘道夫,A。;Madan,J。;Nadeau,K。;Karagas,M.,“美国队列中子宫内砷暴露和婴儿感染:前瞻性研究,环境研究,126,24-30(2013)·doi:10.1016/j.envres.2013.05.001
[15] 弗里德曼博士。;Lane,D.,“报告显著性水平的非随机解释”,《商业与经济统计杂志》,1292-298(1983)
[16] 吉本斯,S.M。;杜瓦莱特,C。;Alm,E.J.,“校正病例对照微生物组研究中的批效应,公共科学图书馆计算生物学,14,e1006102(2018)·doi:10.1371/journal.pcbi.1006102
[17] Hoen,A.G。;李,J。;洛杉矶莫尔顿。;奥图尔,G.A。;Housman,M.L。;科斯特勒特区。;吉尔,M.F。;摩尔,J.H。;希伯德,P.L。;莫里森·H·G。;Sogin,M.L.,“早期生活中肠道微生物定植与囊性纤维化呼吸结局之间的关系”,《儿科杂志》,167,138-147(2015)·doi:10.1016/j.jpeds.2015.02.049
[18] 爪哇马德,A。;Montanari,A.,“高维回归的置信区间和假设检验”,《机器学习研究杂志》,第15期,第2869-2909页(2014年)·Zbl 1319.62145号
[19] La Rosa,P.S。;布鲁克斯,J.P。;Deych,E。;Boone,E.L。;爱德华兹·D·J。;王,Q。;索德格伦,E。;温斯托克,G。;Shannon,W.D.,“基于分类的人类微生物组数据的假设测试和功率计算,PLOS ONE,7,e52078(2012)·doi:10.1371/journal.pone.0052078
[20] Li,H.,“微生物学、宏基因组学和高维成分数据分析,统计及其应用年度回顾,273-94(2015)·doi:10.1146/annurev-statistics-010814-020351
[21] 李,Z。;Lee,K。;卡拉加斯,M.R。;Madan,J.C。;Hoen,A.G。;奥马利,A.J。;Li,H.,“基于微生物相对丰度数据的多元零膨胀Logistic-Normal模型的条件回归,生物科学统计,10,587-608(2018)·doi:10.1007/s12561-018-9219-2
[22] Li,Z.、Liyange,J.、O'Malley,J.、Datta,S.、Gharaibeh,R.、Jobin,C.、Coker,M.、Hoen,A.、Christensen,B.、Madan,J.和Karagas,M.(2019),“零膨胀介体的中介分析及其在微生物组数据中的应用”,arXiv编号1906.09175。
[23] Lin,W。;Shi,P。;冯,R。;Li,H.,“成分协变量回归中的变量选择,生物特征,101785-797(2014)·兹比尔1306.62164 ·doi:10.1093/biomet/asu031
[24] 刘,H。;Xu,X。;Li,J.J.,“构建高维稀疏线性模型参数置信区间的Bootstrap Lasso+部分岭方法”,《统计学》(2019)·兹比尔1453.62581 ·doi:10.5705/ss.202018.0131
[25] Lloyd-Price,J。;Mahurkar,A。;Rahnavard,G。;Crabtree,J。;Orvis,J。;霍尔,A.B。;Brady,A。;Creasy,H.H。;McCracken,C。;Giglio,M.G。;McDonald,D.,“扩大人类微生物组项目中的菌株、功能和动力学”,《自然》,550,61-66(2017)·doi:10.1038/nature23889
[26] 爱,M.I。;Huber,W。;Anders,S.,“利用DESeq2对RNA-seq数据的折叠变化和扩散进行适度估计,基因组生物学,15,550(2014)·doi:10.1186/s13059-014-0550-8
[27] Lozupone,C。;Knight,R.,“UniFrac:一种比较微生物群落、应用和环境微生物学的新系统发育方法,71,8228-8235(2005)·doi:10.1128/AEM.71.12.8228-8235.2005年
[28] 卢卡斯,D。;Liwia,R。;Aleksandra,M。;Aleksandra,S.,“异构化砷酸盐还原细菌介导的砷矿物溶解:砷动员的生理潜力评估”,国际生物医药研究,2014,841892(2014)·doi:10.1155/2014/841892
[29] Madan,J.C。;Hoen,A.G。;Lundgren,S.N。;Farzan,S.F。;科廷厄姆,K.L。;莫里森·H·G。;Sogin,M.L。;李,H。;摩尔,J.H。;Karagas,M.R.,“剖腹产和配方奶粉补充与6周龄婴儿肠道微生物组的相关性,JAMA儿科,170,212-219(2016)·doi:10.1001/牙买加儿科.2015.3732
[30] Madan,J.C。;萨拉里共和国。;Saxena博士。;戴维森,L。;奥图尔,G.A。;摩尔,J.H。;Sogin,M.L。;福斯特·J·A。;爱德华兹·W·H。;Palumbo,P。;Hibbed,P.L.,“早产儿肠道微生物定植预测新生儿败血症,儿童胎儿和新生儿疾病档案,97,F456-F462(2012)·doi:10.1136/fetalneonatal-2011-301373
[31] 曼达尔,S。;Van Treuren,W。;怀特,R.A。;Eggesbö,M。;奈特·R。;Peddada,S.D.,“微生物组分分析:研究微生物组分的新方法”,《健康与疾病中的微生物生态学》,26,27663(2015)
[32] Manly,B.F.J.,《生物学中的随机、自举和蒙特卡罗方法》,《统计科学丛书》(1997),伦敦:查普曼和霍尔出版社,伦敦·Zbl 0918.62081号
[33] Martinez,M.N。;Bartholomew,M.J.,“它的‘含义’是什么?不同类型均值和标准差的解释和计算综述,药剂学,9,14(2017)·doi:10.3390/药剂学9020014
[34] P.J.麦克默迪。;Holmes,S.,“不浪费,不想浪费:为什么不允许使用大量微生物组数据,PLOS计算生物学,10,e1003531(2014)·doi:10.1371/journal.pcbi.1003531
[35] Nadeau,K.C。;李,Z。;Farzan,S。;Koestler,D。;罗宾斯,D。;Fei,D.L。;马利帕特洛拉,M。;Maecker,H。;Enelow,R。;Korrick,S。;Karagas,M.R.,“美国妊娠队列中子宫砷暴露和胎儿免疫储备,临床免疫学,155,188-197(2014)·doi:10.1016/j.clim.2014.09.004
[36] 鲍尔森,J.N。;斯汀,O.C。;布拉沃,H.C。;Pop,M.,“微生物标记基因调查的差异丰度分析,自然方法,10,1200-1202(2013)·doi:10.1038/nmeth.2658
[37] Reikvam博士。;埃罗菲耶夫,A。;Sandvik,A。;格里奇,V。;詹森,F.L。;Gaustad,P。;McCoy,K.D。;麦克弗森,A.J。;洛杉矶梅扎·泽佩达。;Johansen,F.-E.,“小鼠肠道微生物群的消耗:对肠道粘膜和上皮基因表达的影响,PLOS ONE,6,e17996(2011)·doi:10.1371/journal.pone.0017996
[38] 里索,D。;Ngai,J。;速度,T.P。;Dudoit,S.,“使用控制基因或样本的因子分析对RNA-seq数据进行标准化,《自然生物技术》,32,896-902(2014)·doi:10.1038/nbt.2931
[39] 里奇,M.E。;Phipson,B。;Wu,D。;胡,Y。;法律,C.W。;Shi,W。;Smyth,G.K.,“limma为RNA测序和微阵列研究提供差异表达分析,核酸研究,43,e47(2015)·doi:10.1093/nar/gkv007
[40] 医学博士罗宾逊。;麦卡锡,D.J。;Smyth,G.K.,“edgeR:数字基因表达数据差异表达分析的生物导体包,生物信息学,26,139-140(2010)·doi:10.1093/bioinformatics/btp616
[41] Rudi,K。;Ludvigsen,J。;Dirven,H。;Steffensen,I.-L.,“在小鼠肠道肿瘤发生模型中,基因和饮食诱导肥胖与肠道微生物不同相关,环境疾病,245-54(2017)
[42] 唐,Z.-Z。;Chen,G.,“微生物组分数据分析的零膨胀广义Dirichlet多项式回归模型,生物统计学,4698-713(2019)·doi:10.1093/biostatistics/kxy025
[43] ter Braak,C。;Jöckel,K.H.等人。;Rothe,G。;Sendler,W.,Bootstrapping and Related Techniques,多元回归和方差分析中的置换与Bootstrapping显著性检验,79-85(1992),柏林,海德堡:施普林格,柏林,海德堡
[44] 人类微生物组联盟,人类微生物组研究框架,《自然》,486215-221(2012)
[45] Tibshirani,R.,“通过套索进行回归收缩和选择:回顾”,《皇家统计学会杂志》,B辑,73,273-282(2011)·兹比尔1411.62212 ·doi:10.1111/j.1467-9868.2011.00771.x
[46] 特拉桑德,L。;布鲁斯坦,J。;刘,M。;科尔文,E。;考克斯·L·M。;Blaser,M.J.,“婴儿抗生素暴露与早期体重,国际肥胖杂志,37,16-23(2013)·doi:10.1038/ijo.2012.132
[47] Tringe,S.G。;Rubin,E.M.,“宏基因组学:环境样品的DNA测序,《自然评论遗传学》,6805-814(2005)·doi:10.1038/nrg1709
[48] Turnbaugh,P.J。;Ley,R.E。;哈马迪,M。;弗雷泽·利格特,C.M。;奈特·R。;Gordon,J.I.,“人类微生物组项目,自然,449804(2007)·doi:10.1038/nature06244
[49] Turnbaugh,P.J。;Ley,R.E。;Mahowald,医学硕士。;马格里尼,V。;Mardis,E.R。;Gordon,J.I.,“一种能量获取能力增强的肥胖相关肠道微生物组,自然,444,1027-1031(2006)·doi:10.1038/nature05414
[50] Weiss,S。;徐,Z.Z。;佩达达,S。;Amir,A。;Bittinger,K。;冈萨雷斯,A。;Lozupone,C。;Zaneveld,J.R。;Vázquez-Baeza,Y。;A.伯明翰。;海德,E.R。;Knight,R.,《归一化和微生物差异丰度策略取决于数据特征》,微生物学,5,27(2017)·doi:10.1186/s40168-017-0237-y
[51] Zhang,C.-H.,“最小凹板惩罚下的几乎无偏变量选择,统计年鉴,38894-942(2010)·Zbl 1183.62120号 ·doi:10.1214/09-AOS729
[52] 张,C.-H。;Zhang,S.S.,“高维线性模型中低维参数的置信区间”,《皇家统计学会杂志》,B辑,76,217-242(2014)·兹比尔1411.62196 ·doi:10.1111/rssb.12026
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。