×

将生物信息纳入线性模型:选择路径和基因的贝叶斯方法。 (英文) Zbl 1228.62150号

总结:多年来积累的大量生物学知识使研究人员能够识别各种生物化学相互作用并定义不同的途径家族。人们对识别特定生物过程中涉及的途径和途径元素越来越感兴趣。例如,药物发现工作的重点是识别生物标记物以及与疾病相关的途径。我们提出了一个贝叶斯模型,该模型通过在DNA微阵列数据分析中纳入有关通路和基因网络的信息来解决这个问题。这些信息用于定义路径摘要,指定先前的分布,并构建MCMC移动以适应模型。我们用截尾生存结果的基因表达数据来说明该方法。除了识别在其他情况下会被忽略的标记和提高预测准确性之外,将现有生物学知识整合到分析中还可以更好地了解潜在的分子过程。

MSC公司:

62页第10页 统计学在生物学和医学科学中的应用;元分析
92C40型 生物化学、分子生物学
2015年1月62日 贝叶斯推断
65立方厘米 马尔可夫链的数值分析或方法
62N01号 审查数据模型
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Albert,J.H.和Chib,S.(1993年)。二进制和多光子响应数据的贝叶斯分析。J.Amer。统计师。协会88 669-679·Zbl 0774.62031号 ·doi:10.2307/2290350
[2] Ashburner,M.、Ball,C.A.、Blake,J.A.、Botstein,D.、Butler,H.、Cherry,J.M.、Davis,A.P.、Dolinski,K.、Dwight,S.S.、Eppig,J.T.、Harris,M.A.、Hill,D.P.、Issel-Tarver,L.、Kasarskis,A.、Lewis,S.、Matese,J.C.、Richardson,J.E.、Ringwald,M.,Rubin,G.和Sherlock,G.(2000)。基因本体:生物学统一的工具。基因本体联盟。自然遗传学。25 25-29.
[3] Bair,E.、Hastie,T.、Paul,D.和Tibshirani,R.(2006)。监督主成分预测。J.Amer。统计师。协会101 119-137·Zbl 1118.62326号 ·doi:10.1198/0162145050000000628
[4] Besag,J.(1974年)。空间相互作用和晶格系统的统计分析。J.罗伊。统计师。Soc.序列号。B 36 192-236·Zbl 0327.60067号
[5] Bild,A.H.,Yao,G.,Chang,J.T.,Wang,Q.,Potti,A.,Chasse,D.,Joshi,M.-B.,Harpole,D.,Lancaster,J.M.,Berchuck,A.,Olson,J.A.Jr.,Marks,J.R.,Dressman,H.K.,West,M.和Nevins,J.R.(2006)。人类癌症中的致癌途径特征作为靶向治疗的指南。自然439 353-357。
[6] Boulesteix,A.-L.和Strimmer,K.(2007年)。偏最小二乘法:分析高维基因组数据的通用工具。简介。生物信息学8 32-44。
[7] Brown,P.J.、Vannucci,M.和Fearn,T.(1998)。多元贝叶斯变量选择和预测。J.R.统计社会服务。B统计方法。60 627-641. ·Zbl 0909.62022号 ·doi:10.111/1467-9868.00144
[8] Chipman,H.、George,E.I.和McCulloch,R.E.(2001)。贝叶斯模型选择的实际实现。在模型选择中。数理统计研究所讲义专著系列38 65-134。俄亥俄州比奇伍德IMS。 ·doi:10.1214/lnms/1215540964
[9] Dahlquist,K.D.、Salomonis,N.、Vranizan,K.、Lawlor,S.C.和Conklin,B.R.(2002)。GenMAPP是一种查看和分析生物途径微阵列数据的新工具。自然遗传学。31 19-20.
[10] Denkert,C.、Winzer,K.-J.和Hauptmann,S.(2004)。环氧合酶-2对乳腺癌预后的影响。临床。乳腺癌4 428-433。
[11] Doniger,S.、Salomonis,N.、Dahlquist,K.、Vranizan,K.,Lawlor,S.和Conklin,B.(2003)。MAPPFinder:使用基因本体和GenMAPP为微阵列数据创建全局基因表达谱。基因组生物学41 R7。
[12] Downward,J.(2006)。癌症生物学:特征指导药物选择。自然439 274-275。
[13] Frankel,L.B.、Lykkesfeldt,A.E.、Hansen,J.B.和Stenwang,J.(2007年)。蛋白激酶Cα是抗雌激素抵抗的标志物,参与三苯氧胺耐药人类乳腺癌细胞的生长。乳腺癌研究治疗。104 165-179.
[14] Friedman,J.、Hastie,T.和Tibshirani,R.(2010)。关于组套索和稀疏组套索的注释。斯坦福大学统计系技术报告。
[15] George,E.I.和McCulloch,R.E.(1997)。贝叶斯变量选择方法。统计师。Sinica中国7 339-373·Zbl 0884.62031号
[16] Golub,T.R.、Slonim,D.K.、Tamayo,P.、Huard,C.、Gaasenbeek,M.、Mesirov,J.P.、Coller,H.、Loh,M.L.、Downing,J.R.,Caligiuri,M.A.、Bloomfield,C.D.和Lander,E.(1999)。《癌症的分子分类:通过基因表达监测进行分类发现和分类预测》,《科学》286 531-537·Zbl 1047.65504号
[17] Guan,Y.和Stephens,M.(2011)。用于全基因组关联研究和其他大规模问题的贝叶斯变量选择回归。附录申请。统计·Zbl 1229.62145号 ·doi:10.1214/11-AOAS455
[18] Guo,W.、Pylayeva,Y.、Pepe,A.、Yoshioka,T.、Muller,W.J.、Inghirami,G.和Giancotti,F.G.(2006年)。β4整合素放大ErbB2信号,促进乳腺肿瘤发生。手机126 489-502。
[19] Gupta,G.P.、Nguyen,D.X.、Chiang,A.C.、Bos,P.D.、Kim,J.Y.、Nadal,C.、Gomis,R.R.、Manova-Todorova,K.和Massague,J.(2007)。血管重塑介体与肺转移的序贯步骤相关。自然446 765-770。
[20] Joshi Tope,G.、Gillespie,M.、Vastrik,I.、D’Eustachio,P.、Schmidt,E.、de Bono,B.、Jassal,B.、Gopinath,G.R.、Wu,G.R.、Matthews,L.、Lewis,S.、Birney,E.和Stein,L.(2005年)。反应组:生物途径的知识库。核酸研究33 D428-D432。
[21] Kanehisa,M.和Goto,S.(2000年)。京都基因和基因组百科全书。核酸研究28 27-30。
[22] Krieger,C.、Zhang,P.、Mueller,L.、Wang,A.、Paley,S.、Arnaud,M.、Pick,J.、Rhee,S.和Karp,P.(2004)。MetaCyc:代谢途径和酶的多生物数据库。核酸研究32 D438-442。
[23] Kwon,D.、Tadesse,M.G.、Sha,N.、Pfeiffer,R.M.和Vannucci,M.(2007)。从质谱数据中识别生物标记物并确定结果。癌症信息。3 19-28.
[24] Kyung,M.、Gill,J.、Ghosh,M.和Casella,G.(2010年)。惩罚回归、标准误差和贝叶斯套索。贝叶斯分析。5 369-412·Zbl 1330.62289号 ·doi:10.1214/10-BA607
[25] Landemaine,T.、Jackson,A.、Bellahcène,A.、Rucci,N.、Sin,S.、Abad,B.M.、Sierra,A.、Boudinet,A.、Guinebretire,J.-M.、Ricevuto,E.、NoguèS,C.、Briffod,M.、Bièche,I.、Cherel,P.、Garcia,T.,Castronovo,V.、Teti,A.、Lidereau,R.和Driouch,K.(2008)。预测乳腺癌肺转移的六基因特征。癌症研究68 6092-6099。
[26] Lee,S.、Jeong,Y.、Im,H.G.、Kim,C.、Chang,Y.和Lee,I.(2007)。水飞蓟宾通过MAPK信号通路阻断AP-1在MCF-7人乳腺癌细胞中的激活,从而抑制PMA诱导的MMP-9表达。生物化学和生物物理研究通讯354 65-171。
[27] Li,C.和Li,H.(2008)。用于基因组数据分析的网络约束正则化和变量选择。生物信息学24 1175-1182·Zbl 1022.68519号
[28] Li,F.和Zhang,N.(2010年)。结构化高维协变量空间中的贝叶斯变量选择及其在基因组学中的应用。J.Amer。统计师。协会105 1202-1214·Zbl 1390.62027号 ·doi:10.1198/jasa.2010.tm08177
[29] Lindgren,F.、Geladi,P.和Wold,S.(1993年)。PLS的核心算法。化学计量学杂志7 45-59。
[30] Lönne,G.K.、Cornmark,L.、Zahirovic,I.O.、Landberg,G.、Jirström,K.和Larsson,C.(2010)。PKCalpha表达是乳腺癌侵袭性的标志。摩尔癌症9 76。
[31] Lucas,J.、Carvalho,C.、Wang,Q.、Bild,A.Nevins,J.和West,M.(2006)。基因表达基因组学中的稀疏统计建模。在基因表达和蛋白质组学的贝叶斯推断(K.Do,P.Mueller和M.Vannucci编辑)155-176。剑桥大学出版社,剑桥。
[32] Möller,J.、Pettitt,A.N.、Reeves,R.和Berthelsen,K.K.(2006)。一种求解具有难以处理的归一化常数分布的高效马尔可夫链蒙特卡罗方法。生物特征93 451-458·Zbl 1158.62020号 ·doi:10.1093/biomet/93.2.451
[33] Nakao,M.、Bono,H.、Kawashima,S.、Kamiya,T.、Sato,K.、Goto,S.和Kanehisa,M.(1999)。KEGG基因表达分析和通路重建。基因组信息学系列:基因组信息学研讨会10 94-103。
[34] 潘伟、谢B和沈X(2010)。将预测网络纳入惩罚回归,并应用于微阵列数据。生物统计学66 474-484·Zbl 1192.62235号 ·文件编号:10.1111/j.1541-0420.2009.01296.x
[35] Park,M.Y.、Hastie,T.和Tibshirani,R.(2007)。用于回归的平均基因表达。生物统计学8 212-227·Zbl 1144.62357号 ·doi:10.1093/biostatistics/kxl002
[36] Pittman,J.、Huang,E.、Dressman,H.、Hong,C.、Cheng,S.、Tsou,M.、Chen,C.、Bild,A.、Iversen,E.、Huange,A.、Nevins,J.和West,M.(2004)。临床和基因表达信息的集成建模,用于个性化预测疾病结果。程序。国家。阿卡德。科学。美国101 8431-8436。
[37] Propp,J.G.和Wilson,D.B.(1996年)。耦合马尔可夫链的精确抽样及其在统计力学中的应用。《第七届随机结构与算法国际会议论文集》(佐治亚州亚特兰大,1995)9 223-252·Zbl 0859.60067号 ·doi:10.1002/(SICI)1098-2418(199608/09)9:1/2<223::AID-RSA14>3.0.CO;2-O型
[38] Sha,N.、Tadesse,M.G.和Vannucci,M.(2006)。具有审查结果的微阵列数据分析的贝叶斯变量选择。生物信息学22 2262-2268。
[39] Sha,N.、Vannucci,M.、Tadesse,M.G.、Brown,P.J.、Dragoni,I.、Davies,N.,Roberts,T.C.、Contestabile,A.、Salmon,M、Buckley,C.和Falciani,F.(2004)。多项概率模型中的贝叶斯变量选择用于识别疾病阶段的分子特征。生物统计学60 812-828·Zbl 1274.62428号 ·文件编号:10.1111/j.0006-341X.2004.00233.x
[40] Shipp,M.A.、Ross,K.N.、Tamayo,P.、Weng,A.P.、Kutok,J.L.、Aguiar,R.C.T.、Gaasenbeek,M.、Angelo,M.,Reich,M.;Pinkus,G.S.、Ray,T.S.,Koval,M.A.、Last,K.W.、Norton,A.、Lister,T.A.、Mesirov,J.、Neuberg,D.S.、Lander,E.S.、Aster,J.C.和Golub,T.R.(2002)。通过基因表达谱和监督机器学习预测弥漫性大B细胞淋巴瘤预后。自然医学8 68-74。
[41] Stingo,F.和Vannucci,M.(2011年)。btitle用于微阵列数据分析的马尔可夫随机场先验判别分析的变量选择。生物信息学27 495-501。
[42] Stingo,F.、Chen,Y.、Tadesse,M.和Vannucci,M.(2011年)。补充:“将生物信息纳入线性模型:选择路径和基因的贝叶斯方法”·Zbl 1228.62150号
[43] Subramanian,A.、Tamayo,P.、Mootha,V.K.、Mukherjee,S.、Ebert,B.L.、Gillette,M.A.、Paulovich,A.、Pomeroy,S.L.、Golub,T.R.、Lander,E.S.和Mesirov,J.P.(2005)。基因集富集分析:解释全基因组表达谱的基于知识的方法。程序。国家。阿卡德。科学。美国102 15545-15550。
[44] Telesca,D.、Muller,P.、Parmigiani,G.和Freedman,R.(2008年)。依赖性基因表达建模。德克萨斯大学医学博士安德森癌症中心生物统计学系技术报告·Zbl 1243.62038号
[45] Tibshirani,R.(1996)。通过套索进行回归收缩和选择。J.罗伊。统计师。Soc.序列号。乙58 267-288·Zbl 0850.62538号
[46] Troyanskaya,O.、Cantor,M.、Sherlock,G.、Brown,P.、Hastie,T.、Tibshirani,R.、Botstein,D.和Altman,R.B.(2001)。DNA微阵列缺失值估计方法。生物信息学17 520-525。
[47] van t Veer,L.、Dai,H.、van de Vijver,M.、He,Y.、Hart,A.、Mao,M.,Peters,H.,van der Kooy,K.、Marton,M.和Witteveen,A.、Schreiber,G.、Kerkhoven,R.、Roberts,C.、Linsley,P.、Bernards,R.和Friend,S.(2002年)。基因表达谱预测乳腺癌的临床结果。自然415 530-536。
[48] Wei,L.J.(1992)。加速失效时间模型:生存分析中Cox回归模型的有用替代方法。Stat.Med.11 1871-1879年。
[49] Wei,Z.和Li,H.(2007)。用于基于网络的基因组数据分析的马尔可夫随机场模型。生物信息学23 1537-1544。
[50] Wei,Z.和Li,H.(2008)。用于基于网络的时间进程基因表达数据分析的隐藏时空马尔可夫随机场模型。附录申请。统计数字2 408-429·Zbl 1137.62081号 ·doi:10.1214/07-AOAS145支持
[51] Wold,H.(1966年)。通过迭代最小二乘法估计主成分和相关模型。《多元分析》(Proc.Internat.Sympos.,Dayton,Ohio,1965)(P.Krishnaiaah,ed.)391-420。纽约学术出版社·Zbl 0214.46103号
[52] Yuan,M.和Lin,Y.(2006)。分组变量回归中的模型选择和估计。J.R.统计社会服务。B统计方法。68 49-67. ·兹比尔1141.62030 ·doi:10.1111/j.1467-9868.2005302.x
[53] Zhang,J.D.和Wiemann,S.(2009)。KEGGgraph:R和生物导体中KEGG PATHWAY的图形方法。生物信息学25 1470-1471。
[54] Zou,H.和Hastie,T.(2005年)。通过弹性网进行规则化和变量选择。J.R.统计社会服务。B统计方法。67 301-320. ·兹比尔1069.62054 ·数字对象标识代码:10.1111/j.1467-9868.2005.0050.x
[55] Zou,H.、Hastie,T.和Tibshirani,R.(2006)。稀疏主成分分析。J.计算。图表。统计师。15 265-286. ·doi:10.1198/106186006X113430
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。