阿提拉·塞拉;米歇尔·霍夫。;Aeilko H.兹温德曼。 高维组学数据的多集稀疏冗余分析。 (英语) 兹比尔1419.62329 生物。J。 61,编号2406-423(2019). 摘要:冗余分析(RDA)是描述相关数据集之间的方向关系的一种众所周知的方法。最近,我们提出了稀疏冗余分析(sRDA)用于高维基因组数据分析,以找到解释响应变量方差最大的解释变量。随着越来越多的生物分子数据从不同的生物学水平获得,例如来自不同组学领域的基因型和表型数据,一个自然的研究方向是应用综合分析方法,以探索给定生物体某些表型的潜在生物学机制。我们表明,多集稀疏冗余分析(multiset sparse Redundancy Analysis,multi-RDA)框架是高维组学数据分析的一个重要候选框架,因为它解释了组学集合之间的定向信息传递,并且通过其稀疏解,提高了结果的可解释性。本文还描述了基于偏最小二乘路径建模算法的多RDA的软件实现。我们通过对37例马凡综合征患者的364134个甲基化标记、18424个基因表达标记和47个细胞因子标记的数据集进行模拟和真实组学数据分析来测试我们的方法。 MSC公司: 62页第10页 统计学在生物学和医学中的应用;元分析 62甲12 多元分析中的估计 关键词:高维数据;多元统计;组学数据;冗余度分析 软件:素食主义者;R(右) PDF格式BibTeX公司 XML格式引用 \textit{A.Csala}等人,《生物》。J.61,No.2,406--423(2019;Zbl 1419.62329) 全文: 内政部 参考文献: [1] Buescher,J.M.和Driggers,E.M.(2016)。组学整合:不仅仅是各部分的总和。癌症与代谢, 4( 1), 4. [2] 克里克·F(1970)。分子生物学的中心法则。自然, 227( 5258), 561– 563. [3] Csala,A.、Voorbraak,F.P.J.M.、Zwinderman,A.H.和Hof,M.H.(2017年)。高维遗传和基因组数据的稀疏冗余分析。生物信息学, 33( 20), 3228– 3234. [4] Esposito Vinzi,V.和Russolillo,G.(2013)。偏最小二乘算法和方法。威利跨学科评论:计算统计学, 5( 1), 1– 19. [5] Fornell,C.、Barclay,D.W.和Rhee,B.-D。( 1988). 冗余分析的模型和简单迭代算法。多元行为研究, 23( 3), 349– 360. [6] Groenik,M.,Den Hartog,A.W.,Franken,R.,Radonic,T.,De Waard,V.,Timmermans,J.,…Mulder,B.J.M.(2013)。氯沙坦降低马凡综合征成人主动脉扩张率:一项随机对照试验。欧洲心脏杂志,34(45),3491–3500。 [7] Huang,S.、Chaudhary,K.和Garmire,L.X.(2017)。越多越好:多组学数据集成方法的最新进展。遗传学前沿, 8, 84. [8] Israels,A.Z.(1984)。定性变量的冗余分析。心理测量学, 49( 3), 331– 346. [9] Johansson,J.K.(1981)。Wollenberg冗余分析的扩展。心理测量学, 46( 1), 93– 103. [10] 阿拉巴马州卡拉曼。,Nörskov,N.P.、Yde,C.C.、Hedemann,M.S.、Bach Knudsen,K.E.和Kohler,A.(2015)。整合LC-MS和NMR代谢组学数据时,用于生物标记物发现的稀疏多块PLSR。代谢组学, 11( 2), 367– 379. [11] Kawaguchi,A.和Yamashita,F.(2017年)。监督多块稀疏多变量分析在多模态脑成像遗传学中的应用。生物统计学, 18( 4), 651– 665. [12] Oksanen,J.、Kindt,R.、Legendre,P.、O'Hara,B.、Stevens,M.H.H.、Oksanenn,M.J.和Suggests,M..(2007)。素食套餐。社区生态包, 10, 631– 637. [13] Radonic,T.、de Witte,P.、Groenik,M.、de Waard,V.、Lutter,R.、van Eijk,M.…Zwinderman,A.H.(2012)。炎症加重马凡综合征患者的疾病严重程度。公共科学图书馆, 7( 3), 1– 9. [14] Sanchez,G.(2013)。使用R.Berkeley进行PLS路径建模:Trowchez Editions。 [15] van den Wollenberg,A.L.(1977)。冗余分析是典型相关分析的替代方法。心理测量学, 42( 2), 207– 219. ·Zbl 0354.92050号 [16] Vinzi,V.E.、Trinchera,L.和Amato,S.(2010年)。PLS路径建模:从基础到最新发展,以及模型评估和改进的开放问题。《偏最小二乘手册》(第47-82页)。柏林:斯普林格。 [17] Waaijenborg,S.和Zwinderman,A.H.(2009年)。用于识别、连接和完善基因表达网络的稀疏典型相关分析。BMC生物信息学, 10( 1), 315. [18] Wilms,I.和Croux,C.(2015)。从预测角度进行稀疏典型相关分析。生物医学杂志,57(5),834–851·兹比尔1336.62156 [19] 沃尔德,H.(1975年)。具有潜在变量的路径模型:NIPALS方法。定量社会学(第307-357页)。纽约:爱思唯尔出版社。 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。