×

药物敏感基因选择的贝叶斯神经网络。 (英语) Zbl 1402.62277号

摘要:高通量生物技术的最新进展为生物标记物的发现提供了前所未有的机会,从统计学的角度来看,这可以看作是一个变量选择问题。由于组学数据的高维和非线性性质,该问题具有挑战性,通常面临三个困难:(i)非线性系统的未知函数形式,(ii)变量选择一致性,以及(iii)高要求计算。为了避免第一个困难,我们利用前馈神经网络的通用逼近能力来逼近未知非线性函数。为了避免第二个困难,我们对神经网络进行结构选择,通过选择适当的先验分布来实现变量选择的一致性,从而进行变量选择。为了避免第三个困难,我们实现了人口随机近似蒙特卡罗算法,这是一种并行自适应马尔可夫算法链式蒙特卡罗算法,在OpenMP平台上,为计算机内核数的模拟提供线性加速。数值结果表明,该方法能够很好地识别高维非线性系统的相关变量。基于癌症细胞系百科全书研究中收集的数据,该方法成功应用于鉴定与抗癌药物敏感性相关的基因。

MSC公司:

62页第10页 统计学在生物学和医学中的应用;元分析
62M45型 神经网络及从随机过程推断的相关方法
62H25个 因子分析和主成分;对应分析
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Akaike,H.,自回归模型拟合最小AIC过程的贝叶斯推广,生物特征,66237-242,(1979年)·Zbl 0407.62064号
[2] 安德斯,C。;风扇,C。;Parker,J。;凯里·L。;英国布莱克威尔。;Klauber-DeMore,N。;Perou,C.,年轻时发生的乳腺癌:独特的生物学特性还是侵袭性内在亚型的替代品?,临床肿瘤学杂志, 29, (2011)
[3] Barbieri,M。;Berger,J.,最优预测模型选择,统计年刊, 32, 870-897, (2004) ·兹比尔1092.62033
[4] 巴雷蒂纳,J。;Caponigro,G。;斯特兰斯基,N。;肯塔基州文凯特桑。;Margolin,A.A。;Kim,S。;Wilson,C.J。;Lehár,J。;Kryukov,G.V。;Sonkin,D。;A.Reddy。;刘,M。;Murray,L。;伯杰,M.F。;莫纳汉,J.E。;Morais,P。;梅尔泽,J。;Korejwa,A。;Jané-Valbuena,J。;马帕,F.A。;Thibault,J。;Bric-Furlong,E。;拉曼,P。;Shipway,A。;恩格斯,I.H。;程,J。;Yu,G.K。;Yu,J。;Aspesi,P.Jr;德席尔瓦,M。;Jagtap,K。;医学博士琼斯。;Wang,L。;哈特顿,C。;Palescandolo,E。;古普塔,S。;马汉,S。;Sougnez,C。;奥诺弗里奥,R.C。;利菲尔德,T。;MacConaill,L。;温克勒,W。;Reich,M。;李,N。;梅西洛夫,J.P。;加布里埃尔,S.B。;盖茨,G。;Ardlie,K。;Chan,V。;Myer,V.E。;韦伯,B.L。;波特,J。;Warmuth,M。;菲南,P。;哈里斯,J.L。;Meyerson,M。;Golub,T.R.(戈卢布,T.R.)。;莫里西,M.P。;Sellers,W.R。;施莱格尔,R。;Garraway,L.A.,癌症细胞系百科全书支持抗癌药物敏感性的预测建模,自然, 483, 603-607, (2012)
[5] Barron,A.,人工神经网络的近似和估计界,机器学习, 14, 115-133, (1994) ·Zbl 0818.68127号
[6] Bhattacharya,A。;帕蒂,D。;新南威尔士州皮莱。;Dunson,D.B.,Dirichlet–拉普拉斯优先考虑最佳收缩,美国统计协会杂志, 110, 1479-1490, (2015) ·兹比尔1373.62368
[7] 布莱奇,J。;Kapelner,A。;乔治·E。;Jensen,S.,BART的变量选择:基因调控的应用,应用统计学年鉴,8,1750-1781,(2014)·Zbl 1304.62132号
[8] Breiman,L.,兰登森林,机器学习, 45, 5-32, (2001) ·Zbl 1007.68152号
[9] Buzdar,A.,生物治疗和化疗在激素受体和HER2阳性乳腺癌中的作用,肿瘤年鉴, 20, 993-999, (2009)
[10] 卡林,B。;T·路易斯。,数据分析的贝叶斯和经验贝叶斯方法,(1996),查普曼和霍尔,纽约·Zbl 0871.62012号
[11] 卡瓦略,C。;Polson,N。;Scott,J.,稀疏信号的马蹄形估计器,生物特征, 97, 465-480, (2010) ·Zbl 1406.62021号
[12] 卡斯蒂略,I。;施密特·希伯(Schmidt-Hieber),J。;van der Vaart,A.,具有稀疏先验的贝叶斯线性回归,统计年刊, 43, 1986-2018, (2015) ·Zbl 1486.62197号
[13] 陈,J。;Chen,Z.,大模型空间模型选择的扩展贝叶斯信息准则,生物特征, 95, 759-771, (2008) ·Zbl 1437.62415号
[14] Chipman,H。;乔治·E。;McCulloch,R.,BART:贝叶斯加性回归树,应用统计学年鉴, 4, 266-298, (2010) ·Zbl 1189.62066号
[15] Chouldechova,A。;Hastie,T.,广义加性模型选择,(2015)
[16] 崔,H。;李,R。;Zhong,W.,超高维判别分析的无模型特征筛选,美国统计协会杂志, 110, 630-641, (2015) ·Zbl 1373.62305号
[17] 柯蒂斯,C。;沙阿·S·P。;秦,S.-F。;图拉什维利,G。;O.M.鲁埃达。;邓宁,M.J。;速度,D。;林奇,A.G。;萨马拉吉瓦,S。;袁,Y。;格拉夫,S。;Ha,G。;哈法里,G。;Bashashati,A。;罗素(Russell,R.)。;麦金尼,S。;兰格罗德,A。;格林,A。;普罗旺扎诺,E。;Wishart,G。;Pinder,S。;沃森,P。;Markowetz,F。;Murphy,L。;艾利斯,I。;Purushotham,A。;Börresen-Dale,A.-L。;J.D.布伦顿。;塔瓦雷,S。;Caldas,C。;Aparicio,S.,2000例乳腺肿瘤的基因组和转录组结构揭示了新的亚群,自然, 486, 346-352, (2012)
[18] Cybenko,G.,通过S形函数的叠加进行逼近,控制、信号和系统数学, 2, 303-314, (1989) ·Zbl 0679.94019号
[19] 多尔曼,S。;巴拉诺瓦,K。;Knoll,J。;Urquhart,B。;Mariani,G。;卡尔坎纽,M。;Rogan,P.,通过机器学习获得的乳腺癌紫杉醇和吉西他滨耐药的基因组特征,分子肿瘤学, 10, 85-100, (2016)
[20] 范,J。;Li,R.,通过非冲突惩罚似然选择变量及其预言属性,美国统计协会杂志, 96, 1348-1360, (2001) ·Zbl 1073.62547号
[21] 范,J。;Lv,J.,超高维特征空间的确定独立性筛选,英国皇家统计学会杂志, 70, 849-911, (2008) ·Zbl 1411.62187号
[22] 超高维特征空间的确定独立筛选”(与讨论),英国皇家统计学会杂志, 70, 849-911, (2008) ·Zbl 1411.62187号
[23] 范,J。;萨姆沃思,R。;Wu,Y.,超高维特征选择:超越线性模型,机器学习研究杂志, 10, 1829-1853, (2009)
[24] Funahashi,K.,关于用神经网络近似实现连续映射,神经网络, 2, 183-192, (1989)
[25] Geman,S。;Geman,D.,随机松弛、吉布斯分布和图像的贝叶斯恢复,IEEE模式分析和机器智能汇刊,6721-741,(1984)·兹比尔0573.62030
[26] Gianola,D。;Okut,H。;Weigel,K。;Rosa,G.,用贝叶斯神经网络预测复杂数量性状:以泽西奶牛和小麦为例的研究,英国医学委员会遗传学, 12, 87, (2011)
[27] Gramacy,R。;塔迪,M。;Wild,S.,使用动态树进行变量选择和敏感性分析,并应用于计算机代码性能调整,应用统计年鉴, 7, 51-80, (2013) ·Zbl 1454.62239号
[28] Green,P.,可逆跳跃马尔可夫链蒙特卡罗计算和贝叶斯模型确定,生物特征, 82, 711-732, (1995) ·Zbl 0861.62023号
[29] 格伦瓦尔德,V。;Hidalgo,M.,开发用于癌症治疗的表皮生长因子受体抑制剂,国家癌症研究所杂志, 95, 851-867, (2003)
[30] 哈德利,K。;Hendricks,D.,使用NQO1状态作为对17-AAG更敏感的食管鳞癌的选择性生物标记物,BMC癌症, 14, 1-8, (2014)
[31] Hastings,W.,使用马尔可夫链的蒙特卡罗采样方法及其应用,生物特征, 57, 97-109, (1970) ·Zbl 0219.65008号
[32] 何,X。;Wang,L。;Hong,H.,高维异质数据的分位数自适应无模型变量筛选,统计年刊, 41, 342-369, (2013) ·Zbl 1295.62053号
[33] Henze,N。;Zirkler,B.,多元正态的一类不变一致性检验,统计学中的传播——理论与方法, 10, 3595-3617, (1990) ·Zbl 0738.62068号
[34] 霍尔特,S。;Logie,A。;戴维斯,B。;阿尔弗雷兹,D。;Runswick,S。;芬顿,S。;克里斯塔,C。;顾毅。;张杰。;Wu,Y。;威尔金森,R。;Guichard,S。;Smith,P.,MEK(selumetinib)和mtor激酶抑制剂(AZD8055)联合诱导的增强凋亡和肿瘤生长抑制,癌症研究, 72, 1804-1813, (2012)
[35] 霍尼克,K。;Stinchcombe,M。;White,H.,多层前馈网络是通用逼近器,神经网络, 2, 359-366, (1989) ·Zbl 1383.92015年
[36] 姜伟,高维广义线性模型的贝叶斯变量选择:拟合密度的收敛速度,统计年刊, 35, 1487-1511, (2007) ·Zbl 1123.62026号
[37] 约翰逊,V。;Rossel,D.,高维环境中的贝叶斯模型选择,美国统计协会杂志, 107, 649-660, (2012) ·Zbl 1261.62024号
[38] Jönsson,G。;斯塔夫·J。;Vallon-Christersson,J。;林讷,M。;霍尔姆,K。;Hegardt,C。;Gunnarsson,H。;Fagerholm,R。;绞线,C。;Agnarsson,B.A。;俄亥俄州基尔皮瓦拉。;卢茨,L。;海基拉,P。;Aittomäki,K。;Blomqvist,C。;北卡罗来纳州洛曼。;马尔姆斯特罗姆,P。;奥尔森,H。;O.T.约翰森。;Arason,A。;Nevanlinna,H。;Barkardottir,R.B。;Borg,A.,通过阵列比较基因组杂交鉴定的乳腺癌基因组亚型显示出不同的分子和临床特征,乳腺癌研究、12、R42(2010)
[39] 卡佩塔尼奥斯,G。;拉巴德,V。;Price,S.,使用预测似然模型平均进行预测,经济学快报,91,373-379,(2006年)·Zbl 1254.91668号
[40] Kass,R。;Raftery,A.,贝叶斯因子,美国统计协会杂志, 90, 773-795, (1995) ·Zbl 0846.62028号
[41] 劳伦斯,R。;Salgia,R.,MET肺癌的分子机制和治疗,细胞粘附和迁移, 4, 146-152, (2010)
[42] A.李。;Yau,C。;贾尔斯,M。;Doucet,A。;Holmes,C.,关于图形卡在高级蒙特卡罗方法大规模并行模拟中的应用,计算与图形统计学杂志, 19, 769-789, (2010)
[43] Lee,H。;Hanibuchi,M。;Lim,S.-J。;余,H。;Kim,M。;He,J。;兰利,R。;Lehembre,F。;美国雷根纳斯。;Fidler,I.,用内皮素受体双重拮抗剂macitetan与紫杉醇联合治疗小鼠实验性人类乳腺癌和肺癌脑转移,神经肿瘤学, 18, 486-496, (2016)
[44] 李,R。;钟伟。;朱丽萍,通过距离相关学习进行特征筛选,美国统计协会杂志, 107, 1129-1139, (2012) ·Zbl 1443.62184号
[45] Liang,F.,非线性时间序列预测的贝叶斯神经网络,统计与计算, 15, 13-29, (2005)
[46] 梁,F。;宋,Q。;Yu,K.,高维广义线性模型的贝叶斯子集建模,美国统计协会杂志, 108, 589-606, (2013) ·Zbl 06195963号
[47] 梁,F。;Zhang,J.,使用随机近似估计一般依赖下的FDR,生物特征, 95, 961-977, (2008) ·Zbl 1437.62525号
[48] Lin,Y。;Zhang,H.,多元非参数回归中的成分选择与平滑,统计年刊, 34, 2272-2297, (2006) ·Zbl 1106.62041号
[49] 刘,G。;黄Y.J。;Xiao,R。;王,D。;阿克顿,T.B。;Montelione1,G.T.,人类富含AT-的相互作用域蛋白3A的ARID结构域的溶液核磁共振结构:人类癌症蛋白相互作用网络靶点,蛋白质, 78, 2170-2175, (2010)
[50] 刘,H。;Lafferty,J。;Wasserman,L.,高维无向图的半参数估计,,机器学习研究杂志, 10, (2009) ·Zbl 1235.62035号
[51] 卢,Y。;Bien,J。;卡鲁阿纳,R。;Gehrke,J.,稀疏部分线性可加模型,计算与图形统计学杂志, 25, 1126-1140, (2016)
[52] 北卡罗来纳州大都会。;罗森布鲁斯,A。;罗森布鲁斯,M。;特勒,A。;Teller,E.,《快速计算机器的状态方程计算》,化学物理杂志, 21, 1087-1091, (1953) ·Zbl 1431.65006号
[53] Mosteller,F。;Bush,R.,《选定的定量技术》,(1954年)
[54] Nencioni,A。;Cea,M。;A.加鲁蒂。;帕萨拉夸,M。;拉斐格略,L。;Soncini,D。;莫兰,E。;Zoppoli,G。;皮斯托亚,V。;Patrone,F。;Ballesterero,A.,Grb7上调是对HER2信号抑制的一种分子适应,这是由于消除akt介导的基因抑制,公共科学图书馆一号,5,e9024,(2010)
[55] Okut,H。;Gianola,D。;罗莎,G。;Weigel,K.,使用致密分子标记和正规神经网络预测小鼠体重指数,,剑桥遗传学研究, 93, (2011)
[56] 帕克,T。;卡塞拉,G.,贝叶斯套索,美国统计协会杂志, 103, 681-686, (2008) ·Zbl 1330.62292号
[57] 普拉特,A。;Parker,J。;O.卡吉诺娃。;风扇,C。;利瓦西,C。;赫斯科维茨,J。;何,X。;Perou,C.,乳腺癌克劳丁低固有亚型的表型和分子特征,乳腺癌研究,12,R68,(2010)
[58] 拉古,M。;普尔,B。;克莱恩伯格,J。;神经节,S。;Sohl-Dickstein,J.,《深度神经网络的表达能力》,第34届国际机器学习会议记录,702854,(2017)
[59] 拉维库马尔,P。;Lafferty,J。;刘,H。;Wasserman,L.,稀疏加性模型,英国皇家统计学会杂志, 71, 1009-1030, (2009) ·Zbl 1411.62107号
[60] 罗德里格斯,P。;Gianola,D.,包“brnn”:前馈神经网络的贝叶斯正则化。,(2016)
[61] Schapire,R.,《弱可学习性的力量》,机器学习,197-227年5月,(1990年)
[62] 斯科特·J。;Berger,J.,变量选择问题中的Bayes和经验主义Bayes多重性调整,统计年刊, 38, 2587-2691, (2010) ·Zbl 1200.62020年
[63] 宋,Q。;Liang,F.,具有倒数L1正则化的高维变量选择,,美国统计协会杂志, 110, 1607-1620, (2015) ·Zbl 1373.62358号
[64] 超高维回归的分裂合并贝叶斯变量选择方法,,英国皇家统计学会杂志, 77, 947-972, (2015) ·Zbl 1414.62322号
[65] 宋,Q。;吴,M。;Liang,F.,种群与单链随机逼近MCMC算法的弱收敛速度,应用概率研究进展, 46, 1059-1083, (2014) ·Zbl 1305.60065号
[66] Spiegelhalter,D。;贝斯特,N。;卡林,B。;van der Linde,A.,《模型复杂性和拟合的贝叶斯度量》(含讨论),英国皇家统计学会杂志, 64, 583-639, (2002) ·Zbl 1067.62010年
[67] Storey,J.,《错误发现率的直接方法》,英国皇家统计学会杂志, 64, 479-498, (2002) ·Zbl 1090.62073号
[68] 斯托弗,S。;苏赫曼,E。;德文尼,L。;Star,S。;小威廉姆斯,《美国士兵》第一卷:军队生活中的调整,(1949),普林斯顿大学出版社,普林斯顿
[69] Sue,J。;Liang,F.,超高维数据的稳健无模型特征筛选方法,,计算与图形统计学杂志, 26, 803-813, (2017)
[70] Sun,S。;Chen,W。;Wang,L。;刘,X。;刘天勇,《深度神经网络的深度:理论综述》,,第三十届AAAI人工智能大会论文集,2066-2072,(2016)
[71] 塔迪,M。;Gramacy,R。;Polson,N.,学习和设计的动态树,,美国统计协会杂志, 106, (2011) ·Zbl 1396.62158号
[72] Tibshirani,R.,通过LASSO进行回归收缩和选择,英国皇家统计学会杂志,58267-288,(1996年)·Zbl 0850.62538号
[73] Wang,H.,超高维变量筛选的正向回归,美国统计协会杂志, 104, 1512-1524, (2009) ·Zbl 1205.62103号
[74] 白色,G。;Porter,M.,GPU加速MCMC模拟恐怖活动,计算统计与数据分析,71643-651,(2014)·Zbl 1471.62215号
[75] Yang,Y。;Tokdar,S.,高维Minimax-最优非参数回归,统计年刊, 43, 652-674, (2015) ·Zbl 1312.62052号
[76] 张,Z。;Yu,Y。;徐,F。;A.Berchuck。;van Haaften-Day,C。;哈夫里尔斯基,L。;de Bruijn,H。;范德泽,A。;伍拉斯,R。;雅各布斯,I。;Skates,S。;Chan,D。;Bast,R.J.,结合多种血清肿瘤标记物可提高对I期上皮性卵巢癌的检测,妇科肿瘤学, 107, 526-531, (2007)
[77] 朱丽萍。;李,L。;李,R。;Zhu,L.-X.,超高维数据的无模型特征筛选,美国统计协会杂志, 106, 1464-1475, (2011) ·Zbl 1233.62195号
[78] Zoppoli,G。;Regairaz,M。;Leo,E。;Reinhold,W。;瓦尔马,S。;巴列斯特罗,A。;多罗肖,J。;Pommier,Y.,推定DNA/RNA解旋酶schlafenl1(SLFN11)使癌细胞对DNA损伤剂敏感,美国国家科学院院刊, 109, 15030-15035, (2012)
[79] 邹,H。;Hastie,T.,通过弹性网进行正则化和变量选择,英国皇家统计学会杂志,6701-320,(2005年)·Zbl 1069.62054号
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。