×

快速正则化正则相关分析。 (英文) Zbl 1471.62048号

摘要:典型相关分析是研究两组变量之间相关性的常用统计方法。寻找这些数据集之间的典型相关性需要对其对应的样本相关矩阵进行反演。当变量的数量与实验单元的数量相比很大时,不可能直接计算这些矩阵的逆,因此有必要将单位矩阵的倍数加到它们上。这一程序称为正规化。在本文中,我们提出了一种替代现有正则化算法的方法。该方法基于相关矩阵的估计,使均方误差风险函数最小化。这个优化问题的解可以解析地找到,并且由一组计算成本低廉的小方程组成。我们还提供了一些材料,表明所提出的方法比标准正则化正则相关方法更稳定,并提供了更准确的结果。最后,将我们的原始方法应用于NCI-60 microRNA癌症数据证明,它可以在涉及数百个变量的研究案例中提供有用的见解。

MSC公司:

62-08 统计问题的计算方法
62H20个 关联度量(相关性、典型相关性等)
62页第10页 统计学在生物学和医学中的应用;元分析
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Akaho,S.,2001年。典型相关分析的核方法。摘自:国际心理测量学会会议记录,IMPS2001·Zbl 1001.68659号
[2] 艾伦,S.L。;Lundberg,A.S.,《阿莫那菲:治疗急性髓细胞白血病的潜在作用》,专家Opin。投资。药物,20,7,995-1003,(2011)
[3] 艾姆斯,M.M。;Loprinzi,C.L。;柯林斯,J.M。;van Haelst-Pisani,C。;Richardson,R.L。;鲁宾,J。;Moertel,C.G.,《盐酸吡咯唑酮(恶唑)的第一阶段和临床药理评价》,《癌症研究》,50,13,3905-3909,(1990)
[4] Baer,M.R。;乔治·S·L。;桑福德,B.L。;Mro'zek,K。;Kolitz,J.E.(科利兹,J.E.)。;J.O.摩尔。;斯通,R.M。;鲍威尔,B.L。;Caligiuri,医学硕士。;哥伦比亚特区布隆菲尔德。;Larson,R.A.,60岁及以上急性髓性白血病患者柔红霉素的增加和ADE方案中足叶乙甙的添加:癌症和白血病B组研究9720,白血病,25,800-8077,(2011)
[5] 比克斯,J。;R.本杰明。;Wilson,H。;艾尔,H。;休利特,J。;McCredie,K.,Rubidazone在既往接受过急性白血病和慢性粒细胞白血病母细胞期治疗的成年人中的应用:西南肿瘤学小组的一项研究,癌症治疗。众议员,65,5-6,427-430,(1981)
[6] Bishop,J.F。;Lowenthal,R.M。;约书亚·D·。;马修斯,J.P。;托德,D。;科克罗夫特,R。;怀特塞德,M.G。;Kronenberg,H。;马·D。;Dodds,A.,急性非淋巴细胞白血病中的足叶乙甙,澳大利亚白血病研究组血液,75,1,27-32,(1990)
[7] Bishop,C.M.,噪声训练等效于Tikhonov正则化,神经计算。,7, 1, 108-116, (1995)
[8] Cartwright,M.S。;Jeffery,D.R。;刘易斯,Z.T。;Koty,P.P。;Stewart,W.T。;Molna’r,I.,米托蒽醌治疗导致急性淋巴细胞白血病的多发性硬化,神经病学,68,19,1630-1631,(2007)
[9] Clark,D.,理解典型相关分析,(Geo Abstracts,(1975)),ISBN:0 902246 49 6,ISSN:0306-6142
[10] De’ath,G.,Walsh,C.J.,2001年。“The pcurve Package”主曲线分析。R文档:统计计算的语言和环境。奥地利维也纳统计计算基金会。URLhttp://www.R-project.org。
[11] DTP 2009。DTP人肿瘤细胞株筛选。标准机制。可从以下位置获得:http://dtp.nci.nih.gov/。
[12] Dutcher,J.P。;里格斯,C.E。;斯特劳曼,J.J。;链接,B。;Wiernik,P.H.,《4'-脱氧氧柔比星(食管柔比星)治疗难治性或复发性急性白血病的Ⅰ-Ⅱ期临床试验》。药理学。疗法。,45, 4, 424-428, (1989)
[13] 加拉尼斯,E。;巴克纳,J.C。;毛雷尔,M.J。;里德·J·M。;库菲尔,M.J。;艾姆斯,M.M。;谢索尔,B.W。;哈马克,J.E。;Pipoly,G。;Kuross,S.A.,《吡唑洛克里丁和卡铂治疗复发性胶质瘤患者的I/II期试验:一项中北部癌症治疗组试验》,Invest。新药,23,5,495-503,(2005)
[14] Glann,H.R.,典型相关及其与判别分析和多元回归的关系,J.Atmos。科学,25,1,23-31,(1968)
[15] Gittins,R.,经典分析——生态学应用综述,生物数学,12,(1985)·Zbl 0576.62069号
[16] 冈萨雷斯,I。;Dejean,S。;Martin,PGP,CCA:扩展典型相关分析的R包,J.Statist。软件,23,12,(2008)
[17] 冈萨雷斯,I。;Dejean,S。;马丁,PGP;贡卡尔维斯,OO;Besse,P。;Baccini,A.,《通过基于正则正则相关的图形显示突出异质生物数据之间的关系》,J.Biol。系统,17,2,173-199,(2009)·2014年9月13日
[18] Hansen,P.C。;O'Leary,D.P.,《L曲线在离散不适定问题正则化中的应用》,SIAM J.Sci。计算。,14, 6, 1487-1503, (1993) ·Zbl 0789.65030号
[19] Hair,J.R。;布莱克,W.C;Babin,B.J。;Anderson,R.E.,多元数据分析,(2009),普伦蒂斯·霍尔
[20] Hotelling,H.,两组变体之间的关系,《生物特征》,28,321-377,(1936)·Zbl 0015.40705号
[21] Ledoit,O。;Wolf,M.,《股票收益协方差矩阵的改进估计及其在投资组合选择中的应用》,J.Empir。《金融》,第10期,第603-621页,(2003年)
[22] Leurgans,S.E。;Moyeed,R.A。;Silverman,B.W.,数据为曲线时的典型相关性分析,J.R.Stat.Soc.Seri。B统计方法。,55, 3, 725-740, (1993) ·Zbl 0803.62049号
[23] 莱维特·R。;巴克纳,C。;卡西诺,T.L。;伯奇,P.A。;莫顿,R.E。;韦斯特伯格,M.W。;Goldberg,R.M。;加拉赫,J.G。;O’Fallon,J.R。;Scheithauer,B.W.,复发性胶质瘤患者阿莫非的II期研究,《神经病学杂志》,23,87-93,(1995)
[24] Liechty,J.C。;Liechty,M.W。;Muller,P.,贝叶斯相关估计,生物统计学,91,1,1-14,(2004)·Zbl 1132.62314号
[25] 利普舒尔茨,S.E。;科兰,S.D。;Gelber,R.D。;Perez-Atayde,A.R。;Sallan,S.E。;Sanders,S.P.,阿霉素治疗儿童急性淋巴细胞白血病的晚期心脏效应,英国北部。《医学杂志》,324808-815,(1993)
[26] 刘,H。;D’Andrade,P。;Fulmer-Smentek,S。;Lorenzi,P。;科恩,K.W。;韦恩斯坦,J.N。;Pommier,Y。;Reinhold,W.C.,NCI-60的Mrna和microrna表达谱,与药物活性相结合,《分子癌症治疗学》,9,5,1080-1091,(2010)
[27] Lu,M。;张,Q。;邓,M。;苗,J。;郭毅。;高,W。;Cui,Q.,《人类微小rna与疾病关联的分析》,《公共科学图书馆·综合》,3,10,e3420,(2008)
[28] Mazurek,C。;Dutcher,J.P。;施瓦茨,E.L。;加尔,S。;Benson,L。;Wiernik,P.H.,《先前治疗过的急性白血病患者中menogaril的I期临床和药代动力学研究》,Invest。新药。,1131-322(1993年)
[29] Menzel,U.,2011年。CPP:典型相关分析(CCA)的显著性检验。R软件包版本4.27。可在http://cran.r-project.org/web/packages/CCP/index.html。
[30] Meredith,W.,《与易出错数据的典型相关性》,《心理测量学》,29,1,55-65,(1964)·Zbl 0114.35705号
[31] 穆萨亚,E。;王凯。;乔布,J.H。;Moera,K。;Piersona,S。;Paggetia,J。;Nazarovc,P.V。;巴利索塔,V。;Hoodb,L.E。;Berchema,G。;Galas,D.J.,Microrna作为B细胞慢性淋巴细胞白血病的生物标记物和调节器,PNAS,108,16,(1964)
[32] 奥斯本,C.K。;冯·霍夫,D.D。;Cowan,J.D。;Sandbach,J.,Bisantrene,一种治疗晚期乳腺癌的活性药物,《癌症治疗代表》,68,2,357-360,(1984)
[33] 里维拉,G.K。;Evans,W.E.,替尼泊甙(VM-26)治疗儿童急性淋巴细胞白血病的临床试验,Semin Oncol。,19,2(补充6),51-58,(1992)
[34] SAS onlinedoc 9.2,(2002-2005),SAS Institute Inc公司
[35] Schäfer,J。;Strimmer,K.,《大规模协方差矩阵估计的收缩方法及其对功能基因组学的影响》,Stat.Appl。遗传学。分子生物学。,4、14、(2005),第32条
[36] Showalter,H.D。;约翰逊,J.L。;霍夫蒂泽,J.M。;特纳,W.R。;Werbel,L.M。;利奥波德,W.R。;Shillis,J.L。;杰克逊,R.C。;Elslager,E.F.,蒽吡唑抗癌药。抗小鼠白血病的合成和构效关系,J.Med.Chem。,30, 1, 12-131, (1987)
[37] Takane,Y。;Hwang,H.等人。;Abdi,H.,正则化多集规范相关分析,心理测量学,73,4,(2008)·Zbl 1284.62750号
[38] Taylor,S.A。;兰金,C。;汤森,J.J。;克雷格·J·B。;Vance,R.B。;Solank,D.L。;布朗,T.D。;Jaeckle,K.,阿莫非治疗中枢神经系统肿瘤的II期试验:西南肿瘤学小组研究,Invest。新药,20,1,113-115,(2002)
[39] Tenenhaus,A。;Tenenhaus,M.,正则化广义典型相关分析,《心理测量学》,76,2,(2011)·Zbl 1284.62753号
[40] Tikhonov,A.N.,《不适定问题的解决方案》(1977),John Wiley and Sons·Zbl 0354.65028号
[41] Tong,G.L。;Wu,H.Y。;史密斯·T·H。;Henry,D.W.,阿霉素类似物。3.N-烷基化蒽环类化合物的合成,具有增强疗效和降低心脏毒性,J.Med.Chem。,30, 1, 12-131, (1979)
[42] Vinod,H.D.,联合生产的典型岭和计量经济学,《计量经济学杂志》,4,2,147-166,(1976)·Zbl 0331.62079号
[43] 韦斯,R.B。;查尔斯·L·M。;Macdonald,J.S.,AMSA:国家癌症研究所药物开发项目癌症诊所中令人兴奋的新药。试验,3,3,203-209,(1980)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。