×

兹马思-数学第一资源

联合和个体变异解释(JIVE)用于综合分析多种数据类型。(英语) Zbl公司 1454.62355
摘要:现在在几个领域的研究都需要对数据集进行分析,在这些数据集中,有多种高维类型的数据可用于一组公共对象。特别是,癌症基因组图谱(TCGA)包含了来自多种不同基因组技术的数据,这些数据来自同一个癌症肿瘤样本。本文介绍了联合和个别变异解释(JIVE),这是一种对这类数据集进行综合分析的一般变异分解。分解包括三个项:捕获跨数据类型的联合变化的低秩近似,针对每个数据类型的结构化变化的低秩近似,以及残余噪声。JIVE量化了数据类型之间的联合变化量,降低了数据的维数,为节理和单个结构的可视化探索提供了新的方向。该方法是主成分分析的一个推广,与经典相关分析和偏最小二乘法等常用的两个分块方法相比,具有明显的优势。对胶质母细胞瘤多形性肿瘤样本的基因表达和miRNA数据的JIVE分析揭示了基因miRNA的相关性,并提供了更好的肿瘤类型特征。
数据和软件可在https://genome.unc.edu/jive/.

理学硕士:
第62页 统计学在生物学和医学科学中的应用;荟萃分析
62小时25分 因子分析和主成分分析;对应分析
62小时30分 分类和区分;聚类分析(统计方面)
62-08年 统计问题的计算方法
PDF格式 BibTeX公司 XML 引用
参考文献:
[1] 阿都里安,A.,詹宁斯,E.,巴拉苏布拉曼尼亚,R.,海因斯,W.,达米安,D.,泥灰工T.,克里什,C.,斯特罗班特,P.,麦克伯尼,R.,韦尔海伊,E.,博贝尔迪克,I.,格里夫,J.,林德伯格,J.,肯恩,K.,安德森,U.,赫尔莫尔德,H.,尼尔森,K.,索尔特德,H。还有舒普·科伊斯蒂尼茨,我(2008年)。数据整合和生物标志物选择的相关网络分析。分子生物系统4 249-259。
[2] 贝卡尔特,G.,霍德里克,R。还有张,X(2009年)。国际股票收益率协动。J。财务64 2591-2626。
[3] 布雷德尔,M.,斯科尔顿,D。M、 ,刺耳,G。R、 ,布雷德尔,C.,钱德勒,J。P、 ,伦弗,J。J、 ,亚达夫,A。K、 ,沃格尔,H.,夏克,A。C、 ,蒂比拉尼,R。还有锡基,B。一(2009年)。脑肿瘤中合作遗传景观的网络模型。JAMA 302 261-275。
[4] 卡班斯基,C。R、 ,Qi,Y.,Yin,X.,Bair,E.,Hayward,M。C、 ,范,C.,李,J.,威尔克森,M。D、 ,马里恩,J。S、 ,佩鲁,C。M。还有海耶斯。N(2010年)。瑞士制造:标准化类内平方和评估方法和数据集元素。公共图书馆一号5 e9905。
[5] 癌症基因组图谱研究网络(2008年)。全面的基因组特征定义了人类胶质母细胞瘤基因和核心通路。自然455 1061-1068。
[六] 坎迪斯,E.,李,X.,玛,Y。赖特,J(2009年)。稳健主成分分析?在提供。0912.3599号·Zbl公司 1327.62369·doi:10.1145/1970392.1970395·arxiv.org网站
[7] 迪,C.-Z.,克雷尼塞努,C。M、 咖啡厅,咖啡厅。美国。还有北卡罗来纳州的旁遮普。M(2009年)。多层次函数主成分分析。安。申请。状态3 458-488·Zbl公司 1160.62061·doi:10.1214/08-AOAS206
[8] Dweep,H.,Sticht,C.,潘迪,P。还有格雷茨(2011年)。miRWalk数据库:通过“行走”三个基因组的基因来预测可能的miRNA结合位点。J。生物医药。通知。44839-847。
[9] Fowler,A.,Thompson,D.,Giles,K.,Maleki,S.,Mreich,E.,Wheeler,H.,Leedman,P.,Biggs,M.,Cook,R.,Little,N.,Robinson,B。还有英国的麦当劳(2011年)。miR-124a在胶质母细胞瘤中表达下调,参与迁移和侵袭。欧洲癌症杂志47 953-963。
[10] 加尔贝林,M。科克伦,G(2011年)。2011年核酸研究数据库问题和在线分子生物学数据库收集。核酸研究39 D1-D6。
[11] 吉拉德,Y.,里夫金,S。A。还有普里查德,J。K(2008年)。揭示基因调控的结构:eQTL研究的前景。趋势基因。24 408-415。
[12] 吉兰,L.,马泰,D.,菲什曼,D.,格宾,C.,卡兰,B。还有张先生(2002年)。上皮性卵巢癌分泌的骨膜蛋白是α(V)β(3)和α(V)β(5)整合素的配体,促进细胞运动。癌症研究62 5358-5364。
[13] 霍特林,H(1936年)。两组变量之间的关系。生物计量学28 321-377·Zbl公司 15.40705·doi:10.1093/biomet/28.3-4.321
[14] ê Cao,K.-A.,Rossouw,D.,罗伯特·格拉尼é, C。还有贝丝,P(2008年)。基于稀疏PLS的omics数据集成变量选择方法。统计应用。吉奈特。分子生物学。7艺术。35岁,31岁·Zbl公司 1276.62061·doi:10.2202/1544-6115.1390
[15] 李,M.,沈,H.,黄,J。Z。玛伦,J。美国(2010年)。稀疏奇异值分解的双聚类。生物识别66 1087-1095·Zbl公司 1233.62182·doi:10.1111/j.1541-0420.2010.01392.x
[16] 洛克,E.,霍德利,K.,马里恩,J。诺贝尔,A(2012年)。对“多数据类型综合分析的联合和个别差异解释(JIVE)”的补充·Zbl公司 1454.62355·dx.doi.org网站
[17] Parkhomenko,E.,特里奇勒,D。还有贝恩,J(2009年)。稀疏典型相关分析及其在基因组数据集成中的应用。统计应用。吉奈特。分子生物学。8艺术。1,36·Zbl公司 1276.92071·内政部:10.2202/1544-6115.1406
[18] Parkinson,H.,Kapushesky,M.,Kolesnikov,N.,Rustici,G.,Shojatalab,M.,Abeygunawardena,N.,Berube,H.,Dylag,M.,Emam,I.,Farne,A.,Holloway,E.,Luck,M.,Malone,J.,Mani,R.,Pilicheva,E.,Rayner,T.,Rezwan,F.,Sharma,A.,Williams,E.,布拉德利,X.,Adamusiak,T.,Brandizi,M.,Burdett,T.,Coulson,R.,Krestianinova,M.,Kurnosov,萨尔基,萨尔尼,萨尔基。布拉斯马,A(2009年)。ArrayExpress从功能基因组学实验档案更新到基因表达图谱。核酸研究37 868-872。
[19] 彼得,M。E(2010年)。用多个miRNAs靶向mRNAs:下一步。癌基因29 2161-2164。
[20] Rhead,B.,Karolchik,D.,Kuhn,R.,Hinrichs,A.,Zweig,A.,Fujita,P.,Diekhans,M.,Smith,K.,Rosenbloom,K.,Raney,B.,Pohl,A.,雉鸡,M.,Meyer,L.,Learned,K.,Hsu,F.,Hillman Jackson,J.,Harte,R.,Giardine,B.,Dreszer,T.,克劳森,H.,Barber,G.,Hausler,D。肯特,W(2010年)。UCSC基因组浏览器数据库:更新2010。核酸研究38 613-619。
[21] 施瓦兹,G(1978年)。估计模型的维数。安。统计学家。6461-464年·Zbl公司 379.62005·doi:10.1214/aos/117634136
[22] 沈,H。还有黄,J。Z(2008年)。基于正则低秩矩阵逼近的稀疏主成分分析。J。多变量肛门。99 1015-1034·Zbl公司 1141.62049·doi:10.1016/j.jmva.2007.06.007
[23] 沈,R.,奥尔森,A。B。还有拉丹伊,M(2009年)。联合潜在变量模型在多基因数据类型综合聚类中的应用及其在乳腺癌和肺癌亚型分析中的应用。生物信息学25 2906-2912·Zbl公司 1254.92006·doi:10.1007/978-3-540-74891-5
[24] 斯波恩斯,O.,托诺尼,G。还有Kö特尔,R(2005年)。人类连接体:人脑的结构描述。公共科学图书馆计算机。生物。1 e42。
[25] 蒂比拉尼,R(1996年)。回归收缩和选择通过套索。J。罗伊。统计学家。Soc。爵士。乙58 267-288·Zbl公司 850.62538
[26] 特瑞格,J。沃尔德,S(2003年)。O2-PLS,带积分OSC滤波器的两块(X-Y)潜变量回归(LVR)方法。化学计量学杂志17 53-64。
[27] 维哈克,R。G。W、 ,霍德利,K。A、 ,Purdom,E.,Wang,V.,Qi,Y.,Wilkerson,M。D、 ,米勒,C。R、 ,丁,L.,戈鲁布,T.,梅西罗夫,J。P、 ,Alexe,G.,劳伦斯,M.,O'Kelly,M.,Tamayo,P.,Weir,B。A、 ,Gabriel,S.,温克勒,W.,Gupta,S.,Jakkula,L.,Feiler,H。S、 ,霍奇森,J。G、 ,詹姆斯,C。D、 ,萨卡里亚,J。N、 ,布伦南,C.,卡恩,A.,斯佩尔曼,P。T、 ,威尔逊,R。K、 ,速度,T。P、 ,格雷,J。W、 ,梅耶森,M.,盖兹,G.,佩鲁,C。M、 ,海耶斯,D。N。癌症基因组图谱研究网络(2010)。综合基因组分析确定了以PDGFRA、IDH1、EGFR和NF1异常为特征的胶质母细胞瘤临床相关亚型。癌细胞17 98-110。
[28] 库尔特,胡特,J。麦格雷戈,J(1998年)。多块分层PCA和PLS模型分析。化学计量学杂志12 301-321。
[29] 维顿,D。M。还有提比拉尼。J(2009年)。稀疏典型相关分析的扩展及其在基因组数据中的应用。统计应用。吉奈特。分子生物学。8艺术。28号,29号·Zbl公司 1276.62099·doi:10.2202/1544-6115.1470
[30] 沃尔德,H(1985年)。偏最小二乘法。在统计科学百科全书(第6卷)(S。科茨和N。约翰逊编辑)581-591。威利,纽约。
[31] 北卡罗来纳州凯塔尼市沃尔德市。还有杰森,K(1996年)。分层多块PLS和PC模型,便于模型解释和变量选择。化学计量学杂志10 463-482。
[32] Zinn,P.,Majadan,B.,Sathyan,P.,Singh,K.,Majumder,S.,Jolesz,F。科伦,R(2011年)。多形性胶质母细胞瘤水肿/细胞侵袭MRI表型的放射遗传学定位。公共图书馆一号6 e25451。
此参考列表基于出版商或数字数学图书馆提供的信息。它的项被试探性地匹配到zbMATH标识符,并且可能包含数据转换错误。它试图尽可能准确地反映原始论文中列出的参考文献,而不要求匹配的完整性或精确性。