×

纵向高维数据的联合主趋势分析。 (英语) Zbl 1415.62147号

摘要:我们考虑了一个由集成多个信息源以更好地发现不同动态生物过程中的知识而激发的研究场景。给定一组受试者的两个纵向高维数据集,我们希望提取共享的潜在趋势并识别相关特征。为了解决这个问题,我们提出了一种新的统计方法,称为联合主趋势分析(JPTA)。我们通过模拟和应用哺乳动物细胞周期的基因表达数据和流感病毒感染反应的纵向转录谱数据来证明JPTA的实用性。

MSC公司:

62页第10页 统计学在生物学和医学中的应用;元分析
62H25个 因子分析和主成分;对应分析
92D20型 蛋白质序列,DNA序列
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] Alizadeh,A.A.、Aranda,V.、Bardelli,A.、Blanpain,C.、Bock,C.和Borowski,C.等人(2015)。了解和利用肿瘤异质性。《自然医学》21,846-853。
[2] Aschard,H.、Vilhjálmsson,B.J.、Greliche,N.、Morange,P.‐E.、。,特雷古特,D.-A。,和卡夫,P.(2014)。在全基因组关联研究中,最大化相关表型的主成分分析能力。《美国人类遗传学杂志》94662-676。
[3] Balakrishnan,S.、Puniyani,K.和Lafferty,J.(2012)。稀疏加性函数和核cca。在Langford,J.和Pinau,J.(编辑),《第29届国际机器学习会议论文集》(ICML-12),ICML 12,911-918,美国纽约州纽约市:Omnipress。
[4] Bar‐Joseph,Z.、Farkash,S.、Gifford,D.K.、Simon,I.和Rosenfeld,R.(2004)。用互补信息对细胞周期表达数据进行反褶积。生物信息学20,i23-i30。
[5] Bar‐Joseph,Z.、Siegfried,Z.,Brandeis,M.、Brors,B.、Lu,Y.、Eils,R.等人(2008年)。人类细胞周期的全基因组转录分析确定了正常细胞和癌细胞中差异调节的基因。国家科学院学报105,955-960。
[6] Barrett,T.、Troup,D.B.、Wilhite,S.E.、Ledoux,P.、Evangelista,C.、Kim,I.F.等人(2011年)。Ncbi-geo:功能基因组数据集10年档案。核酸研究39,D1005-D1010。
[7] Collins,F.S.和Varmus,H.(2015)。一项关于精确医学的新倡议。《新英格兰医学杂志》372,793-795。
[8] d'Aspremont,A.、El Ghaoui,L.、Jordan,M.I.和Lanckriet,G.R.(2007)。使用半定规划的稀疏主成分分析的直接公式。SIAM评论49,434-448·邮编1128.90050
[9] Desai,K.H.,Tan,C.S.,Leek,J.T.,Maier,R.V.,Tompkins,R.G.,Storey,J.D.等人(2011年)。通过患者内基因表达变化分析危重患者的炎症并发症:一项纵向临床基因组学研究。《公共科学图书馆·医学》81229。
[10] Fritz,J.、Cooper,E.B.、Gaudet,S.、Sorger,P.K.和Manalis,S.R.(2002)。通过其固有分子电荷对dna进行电子检测。《国家科学院学报》99,14142-14146。
[11] Fukumizu,K.、Bach,F.R.和Gretton,A.(2007年)。核正则相关分析的统计一致性。机器学习研究杂志8,361-383·Zbl 1222.62063号
[12] Hardoon,D.R.和Shawe‐Taylor,J.(2011)。稀疏典型相关分析。机器学习83331-353·Zbl 1237.68148号
[13] Hastie,T.、Tibshirani,R.、Friedman,J.和Franklin,J.(2005)。统计学习的要素:数据挖掘、推理和预测。数学智能27,83-85。
[14] Holter,N.S.、Maritan,A.、Cieplak,M.、Fedoroff,N.V.和Banavar,J.R.(2001)。基因表达数据的动态建模。《国家科学院院刊》98,1693-1698。
[15] Hotelling,H.(1936)。两组变量之间的关系。生物特征28,321-377·Zbl 0015.40705号
[16] Huang,D.W.、Sherman,B.T.和Lempicki,R.A.(2008)。利用戴维生物信息学资源对大型基因列表进行系统和综合分析。《自然协议》4,44-57。
[17] Kolda,T.G.和Bader,B.W.(2009年)。张量分解及其应用。SIAM评论51,455-500·Zbl 1173.65029号
[18] Leurgans,S.E.、Moyeed,R.A.和Silverman,B.W.(1993)。数据为曲线时的典型相关分析。英国皇家统计学会杂志,B辑(方法学)725-740·Zbl 0803.62049号
[19] Lu,X.,Zhang,W.,Qin,Z.S.,Kwast,K.E.和Liu,J.S.(2004)。周期性表达基因的统计再同步和贝叶斯检测。核酸研究32,447-455。
[20] Ouyang,Z.、Zhou,Q.和Wong,W.H.(2009)。转录因子的ChIP‐Seq预测胚胎干细胞中的绝对和差异基因表达。国家科学院学报106,21521-21526。
[21] Parkhomenko,E.、Tritchler,D.和Beyene,J.(2009年)。稀疏典型相关分析及其在基因组数据整合中的应用。遗传学和分子生物学中的统计应用8,1-34·Zbl 1276.92071号
[22] Peña‐Diaz,J.、Hegre,S.a.、Anderssen,E.、Aas,P.a.、Mjelle,R.、Gilfillan,G.D.等人(2013年)。细胞周期中的转录谱分析表明,在dna复制过程中,多梳靶向基因的子集上调。核酸研究412846-2856。
[23] Ramsay,J.O.和Silverman,B.W.(2005)。功能数据分析。纽约:Springer‐Verlag·Zbl 1079.62006号
[24] Ravikumar,P.、Lafferty,J.、Liu,H.和Wasserman,L.(2009年)。稀疏加性模型。英国皇家统计学会期刊,B辑(统计方法)71009-1030·Zbl 1411.62107号
[25] Rinnér,M.(2008)。什么是主成分分析?《自然生物技术》26,303-304。
[26] Su,L.和Daniels,M.J.(2015)。使用偏自相关函数对不规则纵向数据的协方差结构进行贝叶斯建模。2004-2018年医学统计34。
[27] Wahba,G.(1990年)。观测数据的样条模型。CBMS‐NSF应用数学区域会议系列,工业和应用数学学会,宾夕法尼亚州费城·Zbl 0813.62001号
[28] Whitfield,M.L.、Sherlock,G.、Saldanha,A.J.、Murray,J.I.、Ball,C.A.、Alexander,K.E.等人(2002年)。鉴定人类细胞周期中周期性表达的基因及其在肿瘤中的表达。细胞分子生物学,1977-2000。
[29] Witten,D.M.、Tibshirani,R.和Hastie,T.(2009年)。惩罚矩阵分解,应用于稀疏主成分和典型相关分析。生物统计10,515-534·Zbl 1437.62658号
[30] Xiong,L.,Chen,X.,Huang,T.‐K。,Schneider,J.和Carbonell,J.G.(2010年)。基于贝叶斯概率张量分解的时间协同过滤。2010年SIAM国际数据挖掘会议记录,211-222。
[31] Zhai,Y.、Franco,L.M.、Atmar,R.L.、Quarles,J.M.和Arden,N.、Bucasas,K.L.等人(2015)。流感和其他急性呼吸道病毒感染的宿主转录反应——一项前瞻性队列研究。公共科学图书馆-病理学11,e1004869。
[32] Zhang,Y.和Davis,R.(2013)。时间进程数据的主要趋势分析及其在基因组医学中的应用。应用统计年鉴7,2205-2228·Zbl 1283.62126号
[33] Zhang,Y.和Ouyang,Z.(2014)。使用纵向基因表达预测患者的定量结果。斯里兰卡应用统计杂志,特刊《科学前沿的现代统计方法》5,117-126。
[34] Zhang,Y.、Tibshirani,R.和Davis,R.(2013)。根据时间进程基因表达对患者进行分类。生物统计14,87-98。
[35] Zhang,Y.、Tibshirani,R.J.和Davis,R.W.(2010)。从纵向基因表达预测患者生存率。遗传学和分子生物学中的统计应用9,41·Zbl 1304.92103号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。