×

成分计数数据差异丰度测试,并应用于微生物组研究。 (英语) Zbl 1498.62194号

小结:确定微生物群中与感兴趣特征相关的分类群对促进科学和健康至关重要。然而,鉴定具有挑战性,因为(通过扩增子测序)测量的分类群计数矢量是成分的,所以微生物群中一个分类群丰度的变化会导致所有分类群中测序计数的数量发生变化。数据通常是稀疏的,由于生物差异或有限的测序深度,出现了许多零计数。我们研究了克罗恩病的病例,微生物负荷随着疾病的发生而发生显著变化。对于这个具有代表性的高成分环境的例子,我们展示了现有的用于识别差异丰富分类群的方法可能存在大量的假阳性。我们引入了一种新的非参数方法,即使零计数的分数很大,也能提供有效的推断。我们的方法使用了一组非差异丰富的参考分类群,可以从数据或外部信息中进行估计。我们的方法还允许进行一种新型测试:对分类群的一个集中子集进行差异丰度的多元测试。基因级多元测试通过避免分类群的聚集,发现了差异丰富的其他属。

MSC公司:

62页第10页 统计学在生物学和医学中的应用;元分析
62H15型 多元分析中的假设检验
62克10 非参数假设检验
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 艾奇森(1982)。成分数据的统计分析。J.罗伊。统计师。Soc.序列号。B44 139-177. ·Zbl 0491.62017号
[2] 艾奇森(1986)。成分数据的统计分析.统计学和应用概率专著CRC出版社,伦敦·Zbl 0688.62004号 ·doi:10.1007/978-94-009-4109-0
[3] AMIR,A.、MCDONALD,D.、NAVAS-MOLINA,J.A.、KOPYLOVA,E.、MORTON,J.T.、XU,Z.Z.、KIGHTLEY,E.P.、THOMPSON,L.R.、HYDE,E.R.等人(2017年)。Deblur快速解决单核苷酸社区序列模式。m系统2 e00191-16。
[4] 安德森M.(2001)。一种新的非参数多元方差分析方法。澳大利亚生态学26 32-46.
[5] Benjamini,Y.和Hochberg,Y.(1995年)。控制错误发现率:一种实用且强大的多重测试方法。J.罗伊。统计师。Soc.序列号。B57 289-300. ·Zbl 0809.62014号
[6] BRILL,B.、AMIR,A.和HELLER,R.(2022)。补充“成分计数数据中差异丰度的测试,以及微生物研究的应用”https://doi.org/10.1214/22-AOAS1607SUPA网站, https://doi.org/10.1214/22-AOAS1607SUPPB, https://doi.org/10.1214/22-AOAS1607SUPC网站, https://doi.org/10.1214/22-AOAS1607SUPD网站, https://doi.org/10.1214/22-AOAS1607SUPP网站
[7] CALGARO,M.、ROMUALDI,C.、WALDRON,L.、RISSO,D.和VITULO,N.(2020年)。微生物组数据的单细胞rna-seq统计方法评估。生物研究。
[8] Callahan,B.J.、McMurdie,P.J.、Rosen,M.J.、Han,A.W.、Johnson,A.J.A.和Holmes,S.P.(2016)。DADA2:基于Illumina扩增子数据的高分辨率样本推断。自然方法13 581-583.
[9] DESANTIS,T.Z.、HUGENHOLTZ,P.、LARSEN,N.、ROJAS,M.、BRODIE,E.L.、KELLER,K.、HUBER,T.、DALEVI,D.、HU,P.等人(2006年)。Greengenes,一个嵌合体检测的16S rRNA基因数据库和与ARB兼容的工作台。申请。环境。微生物。72 5069-5072.
[10] FERNANDES,A.D.、MACKLAIM,J.M.、LINN,T.G.、REID,G.和GLOOR,G.B.(2013年)。混合群体RNA-seq的ANOVA样差异表达(ALDEx)分析。公共科学图书馆8 e67019。
[11] FORBES,C.、EVANS,M.、HASTINGS,N.和PEACOCK,B.(2011年)。统计分布新泽西州霍博肯威利·Zbl 1258.62012号
[12] GEVERS,D.、KNIGHT,R.、PETROSINO,J.F.、HUANG,K.、MCGUIRE,A.L.、BIRREN,B.W.、NELSON,K.E.、WHITE,O.、METHE,B.A.等人(2012年)。人类微生物组项目:健康人类微生物组的社区资源。《公共科学图书馆·生物》。10 e1001377。
[13] GLOOR,G.B.、MACKLAIM,J.M.、PAWLOWSKY-GLAHN,V.和EGOZCUE,J.J.(2017)。微生物组数据集是合成的:这不是可选的。前面。微生物。8 2224.
[14] GOODRICH,J.K.、DI RIENZI,S.C.、POOLE,A.C.、KOREN,O.、WALTERS,W.A.、CAPORASO,J.G.、KNIGHT,R.和LEY,R.E.(2014)。进行微生物组研究。单元格158 250-262.
[15] GRETTON,A.、FUKUMIZU,K.、TEO,C.、SONG,L.、SCHLKOPF,B.和SMOLA,A.(2008)。独立性的核心统计测试。神经信息处理系统研究进展20,Red Hook,NY,USA 585-592。Max-Planck-Gesellschaft,库伦。
[16] 郭旭、张旭、秦毅、刘玉霞、张继杰、张诺、吴坤、QU、B.、HE、Z.等人(2020年)。寄主相关定量丰度分析揭示了根系微生物群的微生物负荷变化。工厂公用设施。1 100003。
[17] HAMADY,M.和KNIGHT,R.(2009年)。人类微生物组项目的微生物群落分析:工具、技术和挑战。基因组研究。19 1141-1152.
[18] HAWINKEL,S.、MATTIELLO,F.、BIJNENS,L.和THAS,O.(2019年)。失信:微生物组差异丰度方法无法控制错误发现率。简介。生物信息。20 210-221.
[19] Heller,R.、Heller,Y.和Gorfine,M.(2013)。基于距离等级的一致多元关联测试。生物特征100 503-510. ·Zbl 1284.62332号 ·doi:10.1093/biomet/ass070
[20] HOMMEL,G.和KROPF,S.(2005年)。使用数据驱动的顺序或假设权重测试基因表达的差异。生物。J。47 554-562. ·Zbl 1442.62412号 ·doi:10.1002/bimj.200410118
[21] JIAN,C.、LUUKKONEN,P.、YKI-JáRVINEN,H.、SALONEN,A.和KORPELA,K.(2020年)。定量pcr为微生物群定量分析提供了一种简单易行的方法。公共科学图书馆15 e0227285。
[22] JIANG,L.、AMIR,A.、MORTON,J.T.、HELLER,R.、ARIAS CASTRO,E.和KNIGHT,R.(2017年)。离散假发现率提高了对差异丰富微生物的识别。m系统2 e00092-17。
[23] 蒋,S.-Q.,于,Y.-N.,高,R.-W.,王,H.,张,J.,李,R.,龙,X.-H.,沈,Q.-R.,陈,W.等人(2019)。高通量绝对定量测序揭示了不同施肥对番茄种植的沿海盐碱地细菌群落的影响。科学。总环境。687 601-609。
[24] KALIVODOVA,A.、HRON,K.、FILZMOSER,P.、NAJDEKR,L.、JANECKOVA,H.和ADAM,T.(2015)。PLS-DA用于代谢组学的成分数据。《化学杂志》。29 21-28.
[25] KAUL,A.、MANDAL,S.、DAVIDOV,O.和PEDDADA,S.D.(2017年)。在存在多余零点的情况下分析微生物组数据。前面。微生物。8 2114.
[26] KONG,J.、LIU,X.、WANG,L.、HUANG,H.、OU,D.、GUO,J.,LAWS,E.A.和HUANG(2021)。用高通量定量测序法估计了亚热带西北太平洋表层海水中海洋细菌相对丰度和数量丰度的模式。前面。微生物。11 599614.
[27] KUMAR,M.S.、SLUD,E.V.、OKRAH,K.、HICKS,S.C.、HANNENHALLI,S.和BRAVO,H.C.(2018年)。稀疏序列计数数据中成分偏差的分析和校正。BMC基因组学19 799。
[28] Love,M.I.、Huber,W.和Anders,S.(2014)。利用DESeq2对RNA-seq数据的折叠变化和离散度进行适度估计。基因组生物学。15 550. ·doi:10.1186/s13059-014-0550-8
[29] LUZ,C.M.(2019)。宏基因组数据的统计分析。基因组信息。17 e6。
[30] MANDAL,S.、TREUREN,W.V.、WHITE,R.A.、EGGESBØ,M.、KNIGHT,R.和PEDDADA,S.D.(2015)。微生物组分分析:一种研究微生物组分的新方法。微量。经济。健康疾病。26 27663.
[31] MCDONALD,D.,HYDE,E.,DEBELIUS,J.W.,MORTON,J.T.,GONZALEZ,A.,ACKERMANN,G.,AKSENOV,A.A.,BEHSAZ,B.,BRENNAN,C.等人(2018年)。美国肠道:公民科学微生物组研究的开放平台。m系统3 e00031-18。
[32] MCMURDIE,P.J.和HOLMES,S.(2014)。不浪费,不想浪费:为什么稀有微生物数据是不可接受的。公共科学图书馆计算。生物。10 e1003531。
[33] MORTON,J.T.、MAROTZ,C.、WASHBURNE,A.、SILVERMAN,J.、ZARAMELA,L.S.、EDLUND,A.、ZENGLER,K.和KNIGHT,R.(2019年)。建立具有参考框架的微生物成分测量标准。国家公社。10 2719.
[34] NELSON,M.C.、MORRISON,H.G.、BENJAMINO,J.、GRIM,S.L.和GRAF,J.(2014)。分析、优化和验证Illumina生成的16S RRNA基因扩增子调查。公共科学图书馆9电子94249。
[35] Paul,J.N.、POP,M.和BRAVO,H.C.(2013年)。metagenomeSeq:稀疏高通量序列的统计分析。生物导体包。
[36] PAULSON,J.N.、STINE,O.C.、BRAVO,H.C.和POP,M.(2013)。微生物标记基因调查的差异丰度分析。自然方法10 1200-1202.
[37] QUINN,T.P.、ERB,I.、GLOOR,G.、NOTREDAME,C.、RICHARDSON,M.F.和CROWLEY,T.M.(2019年)。任意对象数据成分分析的现场指南。Giga科学8吉兹107。
[38] Risso,D.、Perraudeau,F.、Gribkova,S.、Dudoit,S.和Vert,J.-P.(2018年)。从单细胞RNA-seq数据中提取信号的通用灵活方法。国家公社。9 284. ·doi:10.1038/s41467-017-02554-5
[39] 罗森巴姆,P.R.(2010)。观察研究设计.统计学中的施普林格系列纽约州施普林格·Zbl 1308.62005号 ·doi:10.1007/978-1-4419-1213-8
[40] Simes,R.J.(1986)。一种改进的Bonferroni程序,用于多项显著性测试。生物特征73 751-754. ·Zbl 0613.62067号 ·doi:10.1093/biomet/73.3.751
[41] STAEMMLER,F.、GLAESNER,J.、HIERGEIST,A.、HOLLER,E.、WEBER,D.、OEFNER,P.J.、GESSNER,A.和SPANG,R.(2016)。根据尖峰细菌的微生物负荷差异调整微生物组学特征。微生物组4 28.
[42] SUNAGAWA S.、COELHO L.P.、CHAFFRON S.、KULTIMA J.R.、LABADIE K.、SALAZAR G.、DJAHANSCHIRI B.、ZELLER G.、MENDE D.R.等人(2015年)。全球海洋微生物组的结构和功能。科学类348 1261359.
[43] Székely,G.J.和Rizzo,M.L.(2009)。布朗距离协方差。附录申请。统计。3 1236-1265. ·Zbl 1196.62077号 ·doi:10.1214/09-AOAS312
[44] TKACZ,A.、HORTALA,M.和POOLE,P.S.(2018年)。环境样品中微生物丰度的绝对定量。微生物组6 110.
[45] 托格森·W·S(1952)。多维缩放。一、理论与方法。心理测量学17 401-419·Zbl 0049.37603号 ·doi:10.1007/BF02288916
[46] TSAGRIS,M.、ALENAZI,A.、VERROU,K.-M.和PANDIS,N.(2020年)。两个总体的假设检验意味着:参数检验还是非参数检验?J.统计计算。模拟。90 252-270. ·Zbl 07194284号 ·doi:10.1080/00949655.2019.1677659
[47] VANDEPUTTE,D.、KATHAGEN,G.、D'HOE,K.、VIEIRA-SILVA,S.、VALLES-COLOMER,M.、SABINO,J.、WANG,J.,TITO,R.Y.、DE COMMER,L.等人(2017年)。定量微生物组分分析将肠道群落变化与微生物负荷联系起来。自然551 507-511.
[48] VAN DEN BERGE,K.、PERRAUDEAU,F.、SONESON,C.、LOVE,M.I.、RISSO,D.、VERT,J.-P.、ROBINSON,M.D.、DUDOIT,S.和CLEMENT,L.(2018年)。观测砝码解锁批量RNA-seq工具,用于零充气和单细胞应用。基因组生物学。19 24。
[49] VIEIRA,M.C.(2020年)。适应能力的演变以及对流感和艾滋病毒的免疫反应。芝加哥大学博士论文。
[50] VIEIRA-SILVA,S.、SABINO,J.、VALLES-COLOMER,M.、FALONY,G.、KATHAGEN,G.和CAENEPEEL,C.、CLEYNEN,I.、VAN DER MERWE,S.和VERMEIRE,S.等人(2019年)。定量微生物组分分析揭示了PSC/IBD诊断中炎症和胆管梗阻相关微生物群的变化。自然微生物。4 1826-1831.
[51] WANG,Q.、GARRITY,G.M.、TIEDJE,J.M.和COLE,J.R.(2007)。朴素贝叶斯分类器,用于将rRNA序列快速分配到新的细菌分类中。申请。环境。微生物。73 5261-5267.
[52] WEISS,S.、XU,Z.Z.、PEDDADA,S.,AMIR,A.、BITTINGER,K.、GONZALEZ,A.、LOZUPONE,C.、ZANEVELD,J.R.、VAZQUEZ-BAEZA,Y.等人(2017年)。归一化和微生物差异丰度策略取决于数据特征。微生物组5 27.
[53] WU,J.R.、MACKLAIM,J.M.、GENGE,B.L.和GLOOR,G.B.(2017)。找到中心:纠正高通量测序数据集中的不对称性。可从arXiv:1704.01841获取。
[54] XU,L.、PATERSON,A.D.、TURPIN,W.和XU,W.(2015)。评估和选择零膨胀微生物组数据的竞争模型。公共科学图书馆10电子0129606
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。