×

用于微生物组数据的高维回归分析的成分敲除滤波器。 (英语) Zbl 1520.62329号

摘要:微生物组数据分析的一项关键任务是探索感兴趣的标量响应与大量微生物分类群之间的关联,这些微生物分类群被总结为不同分类水平的组成数据。受微生物组分精细映射的启发,我们提出了一种两步合成敲除滤波器,以在微生物组分数据的高维线性对数控制回归分析中提供有效的有限样本错误发现率(FDR)控制。在第一步中,我们提出了一种新的成分筛选程序,以删除不重要的微生物类群,同时保留基本的和零约束。在第二步中,我们扩展了敲除过滤器,以识别成分数据稀疏回归模型中的重要微生物类群。因此,从与预先指定的FDR阈值下的响应相关的高维微生物分类群中选择微生物子集。我们研究了所提出的两步过程的理论性质,包括确定筛选和有效的错误发现控制。我们在数值模拟研究中展示了这些特性,以将我们的方法与一些现有方法进行比较,并展示了新方法在控制标称FDR时的功率增益。通过将该方法应用于炎症性肠病数据集以确定影响宿主基因表达的微生物分类群,也说明了该方法的潜在用途。
{©2020国际生物识别学会}

MSC公司:

62页第10页 统计学在生物学和医学中的应用;元分析
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Aitchison,J.(2003)《成分数据的统计分析》。新泽西州考德威尔:布莱克本出版社·Zbl 0688.62004号
[2] Aitchison,J.和Bacon‐shone,J.(1984)混合物实验的对数对比模型。生物特征,71,323-330。
[3] Barber,R.和Candès E.,(2015)通过仿冒品控制虚假发现率。《统计年鉴》,第43期,2055-2085年·Zbl 1327.62082号
[4] Barber,R.和Candès E.,(2019)高维选择性推理的仿冒过滤器。《统计年鉴》,47(5),2504-2537·Zbl 1444.62034号
[5] Bates,S.、CandèS,E.、Janson,L.和Wang,W.(2020)大都市仿制品采样。美国统计协会杂志。https://doi.org/101080/01621459.2020.1729163。 ·2018年10月15日 ·doi:10.1080/01621459.2020.1729163
[6] Beale,E.M.L.、Kendall,M.G.和Mann,D.W.(1967)多元分析中变量的丢弃。Biometrika,54357-366。
[7] Benjamini,Y.和Hochberg,Y.(1995)控制错误发现率:一种实用且强大的多重测试方法。英国皇家统计学会杂志:B辑,57289-300·Zbl 0809.62014号
[8] Bertsimas,D.、King,A.和Mazumder,R.(2016)通过现代优化透镜进行最佳子集选择。《统计年鉴》,44813-852·Zbl 1335.62115号
[9] Candès,E.、Fan,Y.、Janson,L.和Lv,J.(2018)淘金:高维受控变量选择的“X型”仿制品。英国皇家统计学会杂志:B辑,80,551-577·兹比尔1398.62335
[10] Candes,E.和Tao,T.(2007)Dantzig选择器:当p远大于n时的统计估计。《统计年鉴》,35,2313-2351·Zbl 1139.62019号
[11] Cao,Y.、Lin,W.和Li,H.(2017)成分数据高维平均值的两个样本测试。《生物统计学》,第105、115-132页·Zbl 07072397号
[12] Chen,J.和Chen,Z.(2012)针对小规模大型稀疏GLM的扩展BIC。中国统计局,22,555-574·Zbl 1238.62080号
[13] Chen,J.和Li,H.(2013)稀疏Dirichlet多项式回归的变量选择及其在微生物组数据分析中的应用。应用统计年鉴,7418-442·Zbl 1454.62317号
[14] Cho,I.和Blaser,M.J.(2012)《人类微生物组:健康与疾病的界面》。《自然评论遗传学》,第13期,第260-270页。
[15] Fan,J.和Lv,J.(2008)超高维特征空间的确定独立筛选。英国皇家统计学会杂志:B辑,70849-911·Zbl 1411.62187号
[16] Hawinkel,S.、Mattiello,F.、Bijnens,L.和Thas,O.(2017)一个破灭的承诺:微生物群差异丰度方法无法控制错误发现率。生物信息学简报,20,210-221。
[17] Hu,J.、Koh,H.、He,L.、Liu,M.、Blaser,M.J.和Li,H.(2018)一个具有高级FDR控制的两阶段微生物关联绘图框架。微生物组,6131。
[18] Javanmard,A.和Montanari A.,(2017)消除套索:高斯设计的最佳样本大小。《统计年鉴》,46,593-2622·Zbl 1407.62270号
[19] Konno,H.和Yamamoto,R.(2009)使用整数规划在回归分析中选择最佳变量集。《全球优化杂志》,44273-282·Zbl 1178.62069号
[20] Li,H.(2015)微生物组学、宏基因组学和高维成分数据分析。统计及其应用年鉴,273-94。
[21] Li,R.,Zhong,W.和Zhu,L.(2012)通过距离相关学习进行特征筛选。《美国统计协会期刊》,1071129-1139·Zbl 1443.62184号
[22] Lin,W.,Shi,P.,Feng,R.和Li,H.(2014)成分协变量回归中的变量选择。《生物统计学》,101785-797·Zbl 1306.62164号
[23] Lu,J.,Shi,P.和Li,H.(2019)微生物组分数据的线性约束广义线性模型。生物统计学,75,235-244·Zbl 1436.62596号
[24] Meinshausen,N.、Meier,L.和Bühlmann,P.(2009)P‐高维回归值。《美国统计协会期刊》,104(488),1671-1681·Zbl 1205.62089号
[25] Morgan,X.C.,Kabakhiev,B.,Waldron,L.,Tyler,A.D.,Tickle,T.L.,Milgrom,R.,Stempak,J.M.,Gevers,D.,Xavier,R.J.,Silverberg,M.S.和Huttenhower,C.(2015)炎症性肠病患者盆腔袋中宿主基因表达、粘膜微生物组和临床结局之间的关系。基因组生物学,16,67。
[26] Romano,Y.、Sesia,M.和Candès,E.(2019)深度仿冒。美国统计协会杂志。https://doi.org/10.1080/01621459.2019.1660174。 ·Zbl 1452.62710号 ·doi:10.1080/01621459.2019.1660174
[27] Shi,P.,Zhang,A.和Li,H.(2016)微生物组分数据的回归分析。应用统计年鉴,1019-1040·Zbl 1398.62346号
[28] Sohn,M.B.和Li,H.(2019)微生物组分研究的成分中介分析。应用统计年鉴,13661-681·Zbl 1417.62329号
[29] Tang,Z.和Chen,G.(2019)微生物组分数据分析的零膨胀广义Dirichlet多项式回归模型。生物统计学,20(4),698-713。
[30] Tibshirani R.(1996)通过Lasso回归收缩和选择。英国皇家统计学会杂志:B辑,58267-288·Zbl 0850.62538号
[31] van deGeer,S.(2019)关于亏损Lasso的渐近方差。《电子统计杂志》,13(2),2970-3008·Zbl 1429.62311号
[32] Wang,H.(2009)超高维变量筛选的正向回归。《美国统计协会杂志》,104(488),1512-1524·Zbl 1205.62103号
[33] Wang,J.和Jia,H.(2016)全基因组关联研究:精细挖掘微生物组。《自然评论微生物学》,14508。
[34] Wang,F.,Zhou,L.,Tang,L.和Song,P.(2019)线性模型中同时不一致的收缩-扩张方法(MOCE)。https://arxiv.org/abs/1908.01253
[35] Wasserman,L.和Roeder,K.(2009)高维变量选择。《统计年鉴》,3721788-2201·Zbl 1173.62054号
[36] Weiss,S.,Xu,Z.Z.,Peddada,S..,Amir,A.,Bittinger,K.,Gonzalez,A.,Lozupone,C.,Zaneveld,J.R.,Vázquez‐Baeza,Y.,Birmingham,A.,Hyde,E.R.和Knight,R.(2017)归一化和微生物差异丰度策略取决于数据特征。微生物组,5,27。
[37] Xiao,J.、Cao,H.和Chen,J.(2017)结合系统发育树的错误发现率控制提高了微生物组群多重测试的检测能力。生物信息学,332873-2881。
[38] Xu,C.和Chen,J.(2014)超高维特征筛选的稀疏MLE。美国统计协会杂志,1091257-1269·Zbl 1368.62295号
[39] Xue,L.和Zou,H.(2011)。确定独立筛选和压缩随机感测。《生物特征》,98,371-380·Zbl 1215.62063号
[40] Zhan,X.,Plantinga,A.,Zhao,N.和Wu,M.C.(2017)微生物群落级关联分析的快速小样本核独立性测试。生物统计学,731453-1463·Zbl 1405.62221号
[41] Zhang,H.,Chen,J.,Li,Z.和Liu,L.(2019)应用于人类微生物组数据的中介效应测试。生物科学统计。https://doi.org/10.1007/s12561‐019‐09253‐3 ·doi:10.1007/s12561‐019‐09253‐3
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。