×

兹马思-数学第一资源

微生物丰度和失调的β二项回归模型。(英语) Zbl 1439.62223
摘要:使用一个群体的样本来估计具有某个类别标签的人群的比例是一个非常重要的问题。在微生物组学研究的背景下,当研究人员希望使用一个微生物群体的样本来估计一个特定分类单元(即分类单元)的种群比例时,就会出现这个问题相对丰度. 在本文中,我们提出了一个贝塔二项式模型。与现有模型一样,我们的模型允许一个分类单元的相对丰度与相关的协变量相关联。然而,与现有模型不同,我们的提议也允许分类单元计数的过度分散与相关的协变量相关联。我们利用这一模型,不仅要对差异相对丰度进行检验,而且要对差异变异性进行检验。鉴于以下推测,后者尤其有价值:失调,在某些疾病条件下,来自正常微生物组的扰动可能表现为与每个分类单元相关的计数的稳定性丧失或变异性增加。我们通过模拟研究和土壤微生物数据的应用来证明我们提出的模型的性能。
理学硕士:
第62页 统计学在生物学和医学科学中的应用;元分析
第62页 统计学在环境及相关议题上的应用
62小时 关联度量(相关、典型相关等)
PDF格式 BibTeX公司 XML 引用
参考文献:
[1] Aerts,M.,Molenberghs,G.,Geys,H.和Ryan,L.M.(2002年)。集群数据建模的主题。CRC出版社/CRC,博卡拉顿,佛罗里达州·Zbl 1084.62513
[2] 艾奇森,J.(1986年)。成分数据的统计分析。统计学和应用概率论专著。伦敦CRC出版社。·中银0688.62004
[3] Albert,A.和Anderson,J.A.(1984年)。logistic回归模型中极大似然估计的存在性。生物计量学71 1-10。·Zbl 0543.62020
[4] Bastedo,M.N.和Jaquette,O.(2011年)。运行到位:低收入学生与高等教育分层的动力。教育。评估。政策分析。33318-339。
[5] Benjamini,Y.和Hochberg,Y.(1995年)。控制错误发现率:一种实用而有效的多重测试方法。J、 罗伊。统计学家。Soc。爵士。乙57 289-300。·Zbl 0809.62014
[6] Callahan,B.J.,DiGiulio,D.B.,Goltsman,D.S.A.,Sun,C.L.,Costello,E.K.,Jeganathan,P.,Biggio,J.R.,Wong,R.J.,Druzin,M.L.等人(2017年)。在两个不同种族的美国妇女队列中复制和完善早产的阴道微生物特征。程序。自然。阿卡德。科学。美国114 9966-9971。
[7] Cao,Y.,Zhang,A.和Li,H.(2017年)。从稀疏计数数据估计微生物组成。预印本。可从arXiv获取:1706.02380。
[8] Chai,H.,Jiang,H.,Lin,L.和Liu,L.(2018年)。微生物组分数据的边缘化两部分β回归模型。公共科学图书馆计算机。生物。14号e1006329。
[9] Chen,J.和Li,H.(2013年)。稀疏Dirichlet多项式回归的变量选择及其在微生物组数据分析中的应用。安。申请。状态7 418-442。·中银06171278
[10] Chen,E.Z.和Li,H.(2016年)。用于分析纵向微生物组分数据的两部分混合效应模型。生物信息学32 2611-2617。
[11] Chen,L.,Reeve,J.,Zhang,L.,Huang,S.,Wang,X.和Chen,J.(2018年)。GMPR:一种稳健的零膨胀计数数据归一化方法及其在微生物组测序数据中的应用。皮尔6 e4600。
[12] Dethlefsen,L.和Relman,D.A.(2011年)。人类远端肠道菌群对反复抗生素干扰的不完全恢复和个体化反应。程序。自然。阿卡德。科学。美国108 4554-4561。
[13] DiGiulio,D.B.,Callahan,B.J.,McMurdie,P.J.,Costello,E.K.,Lyell,D.J.,Robaczewska,A.,Sun,C.L.,Goltsman,D.S.A.,Wong,R.J.等人(2015年)。妊娠期人体微生物群的时空变化。程序。自然。阿卡德。科学。美国112 11060-11065。
[14] Dolzhenko,E.和Smith,A.D.(2014年)。在多因素全基因组亚硫酸氢盐测序实验中应用β二项回归进行高精度甲基化差异分析。BMC生物信息。15 215。
[15] 埃德加,R.C.(2013年)。UPARSE:从微生物扩增子读取的高度精确的OTU序列。纳特。方法10 996-998。
[16] Fang,R.,Wagner,B.D.,Harris,J.K.和菲永,S.A.(2016年)。零膨胀负二项混合模型:应用于食道炎的两种微生物。埃皮迪米尔。感染。144 2447-2455。
[17] Faust,K.,Lahti,L.,Gonze,D.,de Vos,W.M.和Raes,J.(2015年)。宏基因组学与时间序列分析:解开微生物群落动力学。货币。奥平。微生物学。2556-66。
[18] Fiacco,A.V.和McCormick,G.P.(1968年)。无约束非线性规划技术。威利,纽约。·Zbl 0193.18805
[19] 弗莱彻,R.(1987年)。实用优化方法,第2版,威利,奇切斯特。·Zbl 0905.65002
[20] Gerber,G.K.(2014年)。动态微生物群。联邦储备银行。5831-418号。
[21] Gevers,D.,Kugathasan,S.,Denson,L.A.,Vázquez Baeza,Y.,Van Treuren,W.,Ren,B.,Schwager,E.,Knights,D.,Song,S.J.等人(2014年)。新发克罗恩病的治疗方法。392-382细胞宿主微生物。
[22] Geyer,C.J.(2015年)。信任:信任区域优化。R程序包版本0.1-7。
[23] Grice,E.A.(2014年)。皮肤微生物群:皮肤疾病新诊断和治疗方法的潜力。神。库坦。医学。苏格。3398年。国家卫生院公共访问。
[24] Harvarson,J.,布里斯草坪,C.J.,Lamendela,R.,Vázquez Baeza,Y.,Walters,W.A.,Bramer,L.M.,D'Amato,M.,Bonfiglio,F.,McDonald,D.等人(2017年)。炎症性肠病中人体肠道微生物群的动态变化。纳特。微生物学。17004年。
[25] Heinze,G.(2006年)。分离数据和近似分离数据logistic回归方法的比较研究。医学统计。25 4216-4226。
[26] Heinze,G.和Schemper,M.(2002年)。logistic回归中分离问题的解决方案。医学统计。212409-2419。
[27] Hill Burns,E.M.,Debelius,J.W.,Morton,J.T.,Wissemann,W.T.,Lewis,M.R.,Wallen,Z.D.,Peddada,S.D.,Factor,S.A.,Molho,E.等人(2017年)。帕金森病和帕金森病药物有明显的肠道微生物群特征。压敏电阻。不服从。32739-749。
[28] Holmes,I.,Harris,K.和Quince,C.(2012年)。Dirichlet多项式混合物:微生物宏基因组学的生殖模型。公共图书馆一号7 e30126。
[29] Hooks,K.B.和O'Malley,M.A.(2017年)。失调及其不满。mBio 8 e01492-17。
[30] 克莱曼,J.C.(1973年)。有外来变异的比例:单一样本和独立样本。J、 阿默尔。统计学家。协会68 46-54。
[31] Kosmidis,I.(2018年)。brglm2:广义线性模型中的偏差减少。R包版本0.1.8。
[32] Kurtz,Z.D.,Müller,C.L.,Miraldi,E.R.,Littman,D.R.,Blaser,M.J.和Bonneau,R.A.(2015年)。微生物生态网络的稀疏和组合鲁棒推理。公共科学图书馆计算机。生物。11号e1004226。
[33] Law,C.W.,Chen,Y.,Shi,W.和Smyth,G.K.(2014年)。精确权重解锁用于RNA序列读取计数的线性模型分析工具。基因组生物学。15 R29。
[34] La Rosa,P.S.,Brooks,J.P.,Deych,E.,Boone,E.L.,Edwards,D.J.,Wang,Q.,Sodergren,E.,Weinstock,G.和Shannon,W.D.(2012年)。基于人类微生物组分类数据的假设检验和功率计算。公共图书馆一号7 e52078。
[35] Li,Z.,Lee,K.,Karagas,M.R.,Madan,J.C.,Hoen,A.G.,O'Malley,A.J.和Li,H.(2018年)。微生物组相对丰度数据基于多元零膨胀logistic正态模型的条件回归。生物科学统计。10587-608。
[36] Love,M.I.,Huber,W.和Anders,S.(2014年)。用DESeq2对RNA序列数据的折叠变化和离散度进行适度估计。生物基因组。15550。
[37] Mandal,S.,Van Treuren,W.,White,R.A.,Eggesbø,M.,Knight,R.和Peddada,S.D.(2015年)。微生物组分分析:研究微生物组成的新方法。微生物。生态环境。健康Dis。26 27663号。
[38] Martin,B.D.,Witten,D.和Willis,A.D.(2020年)。“用β二项回归建模微生物丰度和失调”补充A。https://doi.org/10.1214/19-AOAS1283SUPPA。
[39] 马丁,B.D.,Witten,D.和Willis,A.D.(2020年)。“用β二项回归建模微生物丰度和失调”补充B。https://doi.org/10.1214/19-AOAS1283SUPPB。
[40] McCullagh,P.和Nelder,J.A.(1989年)。广义线性模型。统计学和应用概率论专著。伦敦CRC出版社。·Zbl 0744.62098
[41] McMurdie,P.J.和Holmes,S.(2013年)。phyloseq:R软件包,用于微生物群落普查数据的可重复交互式分析和图形。公共图书馆一号8号e61217。
[42] McMurdie,P.J.和Holmes,S.(2014年)。不浪费,不匮乏:为什么稀有的微生物群数据是不可接受的。公共科学图书馆计算机。生物。10号e1003531。
[43] Mercer,L.D.,Wakefield,J.,Pantazis,A.,Lutanbi,A.M.,Masanja,H.和Clark,S.(2015年)。复杂调查数据的时空平滑:儿童死亡率的小面积估计。安。申请。Stat.9 1889-1905年。·Zbl 1397.62461号
[44] Morgan,X.C.,Tickle,T.L.,Sokol,H.,Gevers,D.,Devaney,K.L.,Ward,D.V.,Reyes,J.A.,Shah,S.A.,LeLeiko,N.等人(2012年)。炎症性肠病肠道菌群功能紊乱及其治疗。基因组生物学。13号R79。
[45] Morgan,X.C.,Kabakchiev,B.,Waldron,L.,Tyler,A.D.,Tickle,T.L.,Milgrom,R.,Stempak,J.M.,Gevers,D.,Xavier,R.J.等人(2015年)。炎症性肠病患者盆腔袋中宿主基因表达、黏膜微生物组和临床结局的关系。基因组生物学。1667年。
[46] Nocedal,J.和Wright,S.J.(1999年)。数值优化。斯普林格运筹学系列。斯普林格,纽约。
[47] Parker,I.M.,桑德斯,M.,Bontrager,M.,Weitz,A.P.,Hendricks,R.,Magarey,R.,Suiter,K.和Gilbert,G.S.(2015年)。系统发育结构和寄主丰度在群落中驱动疾病压力。自然520 542-544。
[48] 保尔森,J.N.,斯廷,O.C.,布拉沃,H.C.和波普,M.(2013)。微生物标记基因调查的差异丰度分析。纳特。方法101200-1202。
[49] 彭X、李G和刘Z(2016)。零膨胀beta回归用于宏基因组数据差异丰度分析。J、 计算机。生物。23 102-110。
[50] Petersen,C.和Round,J.L.(2014年)。定义失调及其对宿主免疫和疾病的影响。手机。微生物学。161024-1033。
[51] Poussin,C.,Sierro,N.,Boué,S.,Battey,J.,Scotti,E.,Belcastro,V.,M.C.,Ivanov,N.V.和Hoeng,J.(2018年)。质疑微生物组:支持研究再现性的实验和计算考虑。毒品迪斯科。今天是1644-1657年。
[52] 普伦蒂斯,R.L.(1986年)。二元回归使用扩展的β二项分布,并讨论了由协变量测量误差引起的相关性。J、 阿默尔。统计学家。协会81 321-327。·零担0608.62086
[53] Qin,N.,Yang,F.,Li,A.,Prifti,E.,Chen,Y.,Shao,L.,Guo,J.,Le Chatelier,E.,Yao,J.等人(2014年)。肝硬化患者肠道菌群的变化。自然513 59。
[54] R核心团队(2018年)。R: 一种用于统计计算的语言和环境。R统计计算基金会,维也纳,奥地利。
[55] Robinson,医学博士,McCarthy,D.J.和Smyth,G.K.(2010年)。edgeR:用于数字基因表达数据差异表达分析的生物导体包。生物信息学26 139-140。
[56] Robinson,M.D.和Oshlack,A.(2010年)。RNA序列数据差异表达分析的标度归一化方法。基因组生物学。11兰特25。
[57] Ryan,D.M.(1974年)。惩罚和障碍功能。在约束优化的数值方法(Proc。国家物理实验室专题讨论会,特丁顿,1974)175-190。
[58] Sankaran,K.和Holmes,S.P.(2017年)。微生物组潜在变量建模。预印本。可从arXiv:1706.04969获取。
[59] Segata,N.,Izard,J.,Waldron,L.,Gevers,D.,Miropolsky,L.,Garrett,W.S.和Huttenhower,C.(2011年)。宏基因组生物标志物的发现与解释。基因组生物学。12 R60。
[60] Sender,R.,Fuchs,S.和Milo,R.(2016年)。对人体和细菌细胞数量的修正估计。公共科学图书馆生物学。14号e1002533。
[61] Shi,B.,Chang,M.,Martin,J.,Mitreva,M.,Lux,R.,Klokkevold,P.,Sodergren,E.,Weinstock,G.M.,Haake,S.K.等人(2015年)。龈下菌群的动态变化及其对牙周炎诊断和预后的影响。mBio 6 e01926-14。
[62] Skellam,J.G.(1948年)。从二项式分布中得出的一种概率分布,它把成功的概率看作两组试验之间的变量。J、 R.统计Soc。爵士。B、 统计方法。10257-261。·Zbl 0032.41903
[63] Sogin,M.L.,Morrison,H.G.,Huber,J.A.,Welch,D.M.,Huse,S.M.,Neal,P.R.,Arrieta,J.M.和Herndl,G.J.(2006年)。深海微生物多样性和未被充分开发的“稀有生物圈”。自然。阿卡德。科学。美国103 12115-12120。
[64] Sohn,M.B.,Du,R.和An,L.(2015年)。一种在宏基因组样本中识别差异丰富特征的稳健方法。生物信息学31 2269-2275。
[65] Tamboli,C.P.,Neut,C.,Desreumaux,P.和Colombel,J.F.(2004年)。炎症性肠病的生物失调。肠道53 1-4。
[66] Tromas,N.,Taranu,Z.E.,Martin,B.D.,Willis,A.,Fortin,N.,Greer,C.W.和Shapiro,B.J.(2018年)。蓝藻水华形成的生态位间距增大。前面。微生物学。9438年。
[67] Wagner,B.,Riggs,P.和Mikulich Gilbertson,S.(2015年)。物质使用数据建模中分布选择的重要性:负二项分布、β二项分布和零膨胀分布的比较。是。J、 吸毒酗酒41 489-497。
[68] Wahba,G.,Wang,Y.,Gu,C.,Klein,R.和Klein,B.(1995年)。指数家庭的平滑样条方差分析及其在威斯康辛州糖尿病视网膜病变流行病学研究中的应用。安。统计学家。1865-1895年。·Zbl 0854.62042
〔69〕 (Borietty,G.G.,Borietty,G.G.,Borietch,L.G.,Borietch,L.G.,Borietch,L.G.,Borietch,L.G.,Borietch,L.G.,Borietch,L.G.,Borietch,L.G.,Borietch,L.G.,Borietch。微米尺度下人类口腔微生物群的生物地理学。程序。自然。阿卡德。科学。美国113 E791-E800。
[70] White,J.R.,Nagarajan,N.和Pop,M.(2009年)。临床宏基因组样本差异丰富特征检测的统计方法。公共科学图书馆计算机。生物。5 e1000352。
[71] Whitman,T.,Pepe Ranney,C.,Enders,A.,Koechli,C.,Campbell,A.,Buckley,D.H.和Lehmann,J.(2016年)。添加生火和新鲜有机质后土壤微生物群落组成及有机碳矿化动态。ISME J.10 2918-2930。
[72] Wickham,H.(2016年)。ggplot2:用于数据分析的优雅图形。斯普林格,纽约。·Zbl 1397.62006
[73] 威廉姆斯,D.A.(1975年)。394:毒理学实验中有关生殖和致畸性的二元反应分析。生物特征31 949-952。·Zbl 0333.62069
[74] Willis,A.D.和Martin,B.D.(2018年)。DivNet:评估网络社区的多样性。生物XIV 305045。
[75] (2013年,陈国强,冯国华,陈国强)。微生物组分数据分析的logistic正态多项式回归模型。生物特征69 1053-1063。·Zbl 1288.62171
[76] Yee,T.W.(2010年)。用于分类数据分析的VGAM包。J、 统计软件。32 1-34年。
[77] Zhang,X.,Mallick,H.,Tang,Z.,Zhang,L.,Cui,X.,Benson,A.K.和Yi,N.(2017年)。微生物计数数据分析的负二项混合模型。BMC生物信息。18 4。
[78] Zhou,Y.,Shan,G.,Sodergren,E.,Weinstock,G.,Walker,W.A.和Gregory,K.E.(2015年)。坏死性小肠结肠炎前早产儿肠道菌群的纵向分析:一项病例对照研究。公共图书馆一号10号e0118632。
此参考列表基于出版商或数字数学图书馆提供的信息。它的数学和标识符可能包含启发式匹配的数据项。它试图尽可能准确地反映原始论文中列出的参考文献,而不要求匹配的完整性或精确性。