×

用于分析基因表达数据的基于混合整数规划的全局优化框架。 (英语) Zbl 1381.90061号

小结:高通量基因表达患者/对照实验的分析基于根据标准统计测试确定差异表达基因。解决这一问题的典型生物信息学方法由两个单独的步骤组成:首先,确定表达水平改变的基因子集;然后选择由这些基因在统计学上丰富的通路,假设它们对研究中的生物条件起到相关作用。通常,所选路径集包含与条件无关的元素。这是因为统计显著性不足以证明生物相关性。为了克服这些问题,我们提出了一种基于大型混合整数程序的方法,该方法实现了一种新的特征选择模型,以同时识别那些过度表达和表达不足的基因,这些基因结合在一起,可以区分不同的癌症亚型,以及这些基因丰富的途径基因。该模型的创新之处在于,解决方案是为了丰富路径。这可能确实会在搜索中引入偏见;通过对解空间的广泛探索,在可行域内改变相关参数,然后使用全局优化方法,可以抵消这种偏差。通过本次探索获得的解决方案池的联合分析确实应该提供一组稳健的最终基因和路径,克服仅依赖统计显著性的潜在缺陷。本文介绍了癌症基因组图谱中不同类型癌症转录组的实验结果。该方法能够确定所考虑的癌症亚型和少数选定途径之间的明确关系,最终通过生物学分析进行验证。

MSC公司:

90立方厘米 混合整数编程
90C26型 非凸规划,全局优化
92D10型 遗传学和表观遗传学
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Huang,D.W.,et al.:使用DAVID生物信息学资源对大型基因列表进行系统和综合分析。《国家协议》。4, 44-57 (2009) ·doi:10.1038/nprot.2008.211
[2] Zhang,B.,Shi,Z.,Duncan,D.T.,Prodduturi,N.,Marnett,L.J.,Liebler,D.C.:将蛋白质加合与基因表达变化联系起来:一种系统方法。分子生物系统。7(7), 2118-27 (2011) ·doi:10.1039/cmb05014a
[3] Chen,T.W.,Gan,R.C.R.,Wu,T.H.,Huang,P.J.,Lee,C.Y.,Chen,Y.Y.M.,Chen。BMC基因组。13(7),S9(2012)
[4] Tripathi,K.P.,Evangelista,D.,Zuccaro,A.,Guarracino,M.R.:转录器:一种自动计算管道,用于注释组装读取并识别非编码rna。《公共科学图书馆·综合》10(11),e0140268(2015)·doi:10.1371/journal.pone.0140268
[5] Guarracino,M.R.,Cuciniello,S.,Pardalos,P.M.:具有广义特征值的基因表达数据的分类和表征。J.优化。理论应用。141(3), 533-545 (2009) ·Zbl 1182.92034号 ·doi:10.1007/s10957-008-9496-x
[6] Fay,D.S.,Gerow,K.A.:生物学家统计思维和分析指南。摘自:WormBook(ed.)The C.elegans Research Community,WormBook.(2013)。doi:10.1895/蠕虫1.159.1
[7] Martnez-Abran,A.:统计意义和生物相关性:呼吁对生态学结果进行更谨慎的解释。《海洋学报》。doi:10.1016/j.actao.2008.02.004
[8] Lovell,D.P.:生物学重要性和统计学意义。《农业杂志》。食品化学。61(35), 8340-8348 (2013). doi:10.1021/jf401124y·doi:10.1021/jf401124y
[9] 欧洲食品安全局:统计意义和生物相关性。EFSA J.9(9),2372(2011)。doi:10.2903/j.efsa.2011.2372
[10] Huang,D.W.,Sherman,B.T.,Lempicki,R.A.:生物信息学富集工具:大型基因列表综合功能分析的途径。《核酸研究》37(1),1-13(2009)。doi:10.1093/nar/gkn923·doi:10.1093/nar/gkn923
[11] Subramanian,A.,Tamayoa,P.,Moothaa,V.K.,Mukherjee,S.,Eberta,B.L.,Gillettea,M.A.,Paulovichg,A.,Pomeroyh,S.L.,Goluba,T.R.,Landera,E.S.,Mesirova,J.P.:基因集富集分析:解释全基因组表达谱的基于知识的方法。PNAS 102(43),15545-15550(2005)·doi:10.1073/pnas.0506580102
[12] Holland,P.W.:统计学和因果推断。《美国统计协会期刊》81(396),945-960(1986)。doi:10.1080/01621459.1986.10478354·Zbl 0607.62001 ·doi:10.1080/016214519986.10478354
[13] Guyon,I.:变量和特征选择简介。J.马赫。学习。Res.Arch.公司。3, 1157-1182 (2003) ·兹比尔1102.68556
[14] Pearl,J.:因果关系:模型、推理和推论。经济学。理论19,675-685(2003)·兹比尔1441.62833 ·网址:10.1017/S0266466603004110
[15] Sun,M.,Xiong,M.:基因选择和组织分类的数学规划方法。生物信息学19(10),1243-1251(2003)·doi:10.1093/bioinformatics/btg145
[16] 网址:http://cancergenes.nih.gov/ ·Zbl 0996.68067号
[17] Ritchie,M.E.,Phipson,B.,Wu,D.,Hu,Y.,Law,C.W.,Shi,W.,Smyth,G.K.:Limma为RNA测序和微阵列研究提供差异表达分析。核酸研究(2015)。doi:10.1093/nar/gkv007
[18] IBM ILOG CPLEX-高性能数学编程引擎。http://www.ibm.com/software/integration/optimization/cplex
[19] Maldonado,S.、Perez,J.、Weber,R.、Labb,M.:通过混合整数线性规划进行支持向量机的特征选择。信息科学。279, 163-175 (2014) ·Zbl 1354.68226号 ·doi:10.1016/j.ins.2014.03.110
[20] Liu,H.,Motoda,H.:知识发现和数据挖掘的特征选择。Kluwer学术出版社,多德雷赫特(2000)·Zbl 0908.68127号
[21] Guyon,I.,Elisseeff,A.:变量和特征选择简介。J.马赫。学习。第1157-1182号决议(2003年)·Zbl 1102.68556号
[22] 费利西,G。;安吉利斯,V。;Mancinelli,G。;Felici,G.(编辑);Trintaphyllou,E.(编辑),数据挖掘的特征选择(2006),柏林
[23] Mosca,Ettore,Milanesi,Luciano:基于网络的多目标优化经济学分析。分子生物系统。9(12), 2971-2980 (2013) ·doi:10.1039/c3mb70327d
[24] Felici,G.,Bertolazzi,P.,Guarracino,M.,Chinchuloun,A.,Pardalos,P.:基于逻辑公式的知识发现及其在生物数据分类中的应用。在:Mondaini,R.P.(编辑)BIOMAT 20082009。《世界科学》,新加坡,第265-279页。国际标准图书编号:978-981-4271-81-3
[25] Bertolazzi,P.,Felici,G.,Weitschek,E.:学习用条形码对物种进行分类。BMC生物信息。10, 1-12 (2009) ·doi:10.186/1471-2105-10-S14-S7
[26] Bertolazzi,P.、Felici,G.、Festa,P.,Fiscon,G.,Weitschek,E.:特征选择的整数规划模型:新扩展和随机解算法。欧洲药典。第250号决议,第389-399号决议(2016年)·Zbl 1346.90605号 ·doi:10.1016/j.ejor.2015.09.051
[27] Garey,M.R.,Johnson,D.S.:《计算机与难治性:NP-完备性理论指南》。弗里曼·W·H,纽约(1979)·Zbl 0411.68039号
[28] Bertolazzi,P。;费利西,G。;Lancia,G。;Chen,JK(编辑);Lonardi,S.(编辑),《生物数据挖掘》,257-294(2010),伦敦
[29] Boros,E.,Ibaraki,T.,Makino,K.:缺失位二进制数据的逻辑分析。Artif公司。智力。107, 219-263 (1999) ·Zbl 0996.68067号 ·doi:10.1016/S0004-3702(98)00110-6
[30] Fiscon,G.、Weitschek,E.、Cella,E.、Lo Presti,A.、Giovanetti,M.、Babakir-Mina,M.,Ciotti,M..、Ciccozzi,M.和Pierangeli,A.、Bertolazzi,P.、Felici,G.:MISSEL:一种鉴定大量小种特定基因组子序列的方法及其在病毒分类中的应用。BioData Min.(2016)(即将发布)
[31] Berretta,R.,Mendes,A.,Moscato,P.:微阵列数据中癌症分子分类的整数规划模型和算法。收录于:ACSC’05第二十八届澳大利亚计算机科学会议论文集,第38卷,第361-370页(2005)·Zbl 1354.68226号
[32] Drukker,C.A.等人:RASTER观察研究中乳腺癌预后特征的前瞻性评估。《国际癌症杂志》133(4),929-36(2013)·doi:10.1002/ijc.28082
[33] Li,D.,Xia,H.,Li,Z.,Hua,L.,Li,L.:通过整合DNA拷贝数畸变的基因组学分析和miRNA-mRNA双表达谱分析,识别新的乳腺癌亚型特异性生物标记物。生物医药研究国际2015(2015)。doi:10.1155/2015/746970
[34] Goldman,M.、Craft,B.、Swatloski,T.、Ellrott,K.、Cline,M.和Diekhans,M.,Ma,S.、Wilks,C.、Stuart,J.、Haussler,D.、Zhu,J.:UCSC癌症基因组浏览器:2013年更新。《核酸研究》第41号(数据库问题),949-954(2012年)。数字对象标识代码:10.1093/nar/gks1008·数字对象标识代码:10.1093/nar/gks1008
[35] Tian,F.,Wang,Y.,Seiler,M.,Hu,Z.:使用通路特征描述乳腺癌的功能。BMC医学基因组学。7(1), 45 (2014). doi:10.1186/1755-8794-7-45
[36] Gautier,L.,Cope,L.,Bolstad,B.M.,Irizarry,R.A.:探针水平上Affymetrix基因芯片数据的Affy分析。生物信息学20(3),1367-4803(2004)。doi:10.1093/bioinformatics/btg405·doi:10.1093/生物信息学/btg405
[37] 学生:平均值的可能误差。《生物特征》,6(1),1-25(1908)。doi:10.1093/biomet/6.1.1·Zbl 1469.62201号
[38] 江,P.,杜,W.,Wu,M.:癌症中戊糖磷酸途径的调节。蛋白质细胞5(8),592-602(2014)·doi:10.1007/s13238-014-0082-8
[39] Hoppertona,K.E.,Duncana,R.E.,Bazineta,R.P.,Archera,M.C.:脂肪酸合成酶在癌症代谢中发挥作用,不仅仅是为磷脂合成提供脂肪酸或维持糖酵解活性的升高。实验细胞研究320(2),302-310(2014)·doi:10.1016/j.yexcr.2013.10.16
[40] Argiles,J.,Costelli,P.,Carbo,N.,LopezSoriano,F.:支链氨基酸分解代谢与癌症恶病质(综述)。昂科尔。代表(1996)。doi:10.3892/或.3.4.687·doi:10.3892/或.3.4.687
[41] Birk,J.U.,Lone,S.,Susanne,T.,Britta,H.,Anja,N.,Inge,B.,Mef,N.:遗传性非息肉病性结直肠癌综合征中的不匹配修复缺陷乳腺癌。乳腺癌研究治疗。120(3), 777-782 (2010) ·doi:10.1007/s10549-009-0449-3
[42] Abdel-Fatah,Tarek M.A.,Perry,C.,Arora,A.,Thompson,N.,Doherty,R.,Moseley,P.M.,Green,A.R.,Chan,S.Y.T.,Ellis,I.O.,Madhusudan,S.:基底切除修复在雌激素/雌激素受体驱动的乳腺癌中有作用吗。抗氧化剂。氧化还原信号。21(16), 2262-2268 (2014). doi:10.1089/ars.2014.6077·doi:10.1089/ars.2014.6077
[43] 因此,E.Y.,Ouchi,T.:Toll样受体在癌症治疗中的应用。国际生物学杂志。科学。6(7), 675-681 (2010). doi:10.7150/ijbs.6.675·doi:10.7150/ijbs.6.675
[44] Patt,D.A.、Duan,Z.、Fang,S.、Hortobagyi,G.N.、Giordano,S.H.:辅助性乳腺癌后的急性髓细胞白血病。临床杂志。昂科尔。25, 3871-3876 (2007) ·doi:10.1200/JCO.2007.12.0832
[45] Nielsen,T.O.,Parker,J.S.,Leung,S.等人:三苯氧胺治疗的雌激素受体阳性乳腺癌中PAM50固有亚型与免疫组织化学和临床预后因素的比较。临床。癌症研究16(21),5222-5232(2010)·doi:10.1158/1078-0432.CCR-10-1282
[46] Uchida,N.、Suda,T.、Ishiguro,K.:化疗对腔性乳腺癌的影响。Yonago Acta Med.56(2),51-56(2013)
[47] Prat,A.等人:基底样和非基底样三阴性乳腺癌的分子特征。肿瘤学家18(2),123-133(2013)·doi:10.1634/theoncolist.2012-0397
[48] Ossovskaya,V.等人:探索三阴性乳腺癌的分子途径。基因癌症2(9),870-879(2011)·doi:10.1177/1947601911432496
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。