×

通过稀疏典型相关分析结合生物信息对转录组和代谢组数据进行综合分析。 (英语) Zbl 1415.62130号

摘要:高维组学数据的综合分析越来越流行。同时,在组学数据分析中纳入已知变量之间的功能关系有助于阐明复杂疾病的潜在机制。在本文中,我们的目标是评估来自预测健康研究所(PHI)的转录组和代谢组数据之间的关联,该研究包括患有心血管疾病的高风险健康成年人。采用数据驱动和基于知识的策略,我们开发了结合已知生物信息的稀疏典型相关分析(CCA)统计方法。我们提出的方法利用基因之间和代谢物之间的先验网络结构信息来指导稀疏CCA中相关基因和代谢品的选择,从而深入了解心血管疾病的分子基础。我们的模拟结果表明,当结构信息具有信息性且对误特异性结构信息具有鲁棒性时,结构化稀疏CCA方法在选择相关基因和代谢物方面优于现有的几种稀疏CCA算法。我们对PHI研究的分析表明,许多基因和代谢途径,包括一些已知与心血管疾病相关的途径,在我们提出的方法选择的一组基因和代谢物中得到了丰富。

MSC公司:

62页第10页 统计学在生物学和医学中的应用;元分析
62H20个 关联度量(相关性、典型相关性等)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Alderman,M.和Aiyer,K.J.(2004)。尿酸:在心血管疾病中的作用和氯沙坦的影响。{当前医学研究意见}20,369-379。
[2] Cai,T.和Liu,W.(2011)。稀疏线性判别分析的直接估计方法。《美国统计协会期刊》1061566-1577·兹比尔1233.62129
[3] Candes,E.和Tao,T.(2007)。Dantzig选择器:当p远大于n时的统计估计。《统计学年鉴》35,2313-2351·Zbl 1139.62019号
[4] Chalise,P.和Fridley,B.L.(2012)。稀疏典型相关分析中惩罚函数的比较。{计算统计与数据分析}56,245-254。
[5] Chen,J.、Bardes,E.E.、Aronow,B.J.和Jegga,A.G.(2009年)。Toppgene套件用于基因列表富集分析和候选基因优先排序。{核酸研究}37,W305-11。
[6] Chen,J.、Bushman,F.D.、Lewis,J.D.、Wu,G.D.和Li,H.(2013)。结构约束稀疏正则相关分析及其在微生物组数据分析中的应用。{生物统计学}14,244-258。
[7] Chen,X.、Liu,H.和Carbonell,J.G.(2012)。结构化稀疏典型相关分析。{\it PMLR(机器学习论文集)}22199-207。
[8] D’Agostino,R.B.S.、Vasan,R.S.、Pencina,M.J.、Wolf,P.A.、Cobain,M.、Massaro,J.M.和Kannel,W.B.(2008)。初级保健中使用的一般心血管风险概况:弗雷明翰心脏研究。{循环}117,743-753。
[9] Friedman,J.、Hastie,T.和Tibshirani,R.(2007)。用图形套索进行稀疏逆协方差估计。{\it生物统计学}0,1-10·Zbl 1143.62076号
[10] Fujikoshi,Y.、Ulyanov,V.V.和Shimizu,R.(2010年)。多元统计:高维和大样本近似。概率与数理统计中的威利级数·Zbl 1304.62016年
[11] Gao,C.、Ma,Z.和Zhou,H.H.(2015)。稀疏cca:自适应估计和计算障碍。http://arxiv.org/pdf/1409.8565.pdf ·Zbl 1421.62073号
[12] Hotelling,H.(1936)。两组变量之间的关系。{\it Biometrika}28,312-377·Zbl 0015.40705号
[13] Kanehisa,M.、Sato,Y.、Kawashima,M.,M,M.F.和Tanabe,M.(2016年)。Kegg作为基因和蛋白质注释的参考资源。{\f5核酸研究}{\f5 44}{\f5,{\f5 D457-D462}{\f5。}。
[14] Li,C.和Li,H.(2008)。用于基因组数据分析的网络约束正则化和变量选择。{生物信息学}24,1175-1182。
[15] Li,S.,Park,Y.,Durasingham,S.、Strobel,H.F.、Khan,N.、Soltow,A.Q.和Jones,P.D.(2013)。从高通量代谢组学预测网络活动。{\it-PLOS计算生物学}9,e1003123
[16] Maiuolo,J.、Oppedisano,F.、Gratteri,S.、Muscoli,C.和Mollace,V.(2015)。尿酸代谢和排泄的调节。{国际心脏病学杂志}213,8-14。
[17] Matthews,B.(1975年)。t4噬菌体溶菌酶二级结构预测值与观察值的比较。{\it Biochimica et Biophysica Acta(BBA)-蛋白质结构}405(2):442-451。
[18] 潘伟(Pan,W.)、谢(Xie,B.)和沈(Shen,X.)(2010)。在惩罚回归中加入预测网络。{生物统计学}66,474-484·Zbl 1192.62235号
[19] Parkhomenko,E.、Tritchler,D.和Beyene,J.(2009年)。稀疏典型相关分析及其在基因组数据整合中的应用。{它在遗传学和分子生物学中的统计应用}8,1-34·Zbl 1276.92071号
[20] Rosca1,M.G.、Vazquez,E.J.、Kerner,J.、Parland,W.、Chandler,M.P.、Stanley,W.等人(2008)。心力衰竭患者的心肌线粒体:呼吸小体减少和氧化磷酸化。{心血管研究}80,30-39。
[21] Safo,S.和Ahn,J.(2014)。高维数据的稀疏分析。乔治亚大学博士论文。
[22] Tibshirani,R.、Saunders,M.、Rosset,S.、Zhu,J.和K.奈特(2005)。通过融合套索实现轻盈流畅。{皇家统计学会杂志:B辑(统计方法)}67,91-108·Zbl 1060.62049号
[23] Vinod,H.D.(1970年)。联合生产的典型岭和计量经济学。{计量经济学杂志}147-166·Zbl 0331.62079号
[24] Witten,D.M.、Tibshirani,R.J.和Hastie,T.(2009年)。惩罚矩阵分解,应用于稀疏主成分和典型相关分析。{生物统计学}10,515-534·Zbl 1437.62658号
[25] Xia,J.、Sinelnikov,I.V.、Han,B.和Wishart,D.S.(2015)。代谢分析学家3。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。