×

基于贪婪策略的大基因网络结构优化。 (英语) Zbl 1411.92095号

摘要:在过去几年里,基因网络已经成为模拟生物过程的最重要工具之一。在其他实用程序中,这些网络直观地显示了基因之间的生物关系。然而,由于当前生成的大量遗传数据,它们的规模已经增长到无法管理的地步。为了解决这个问题,可以使用计算方法,例如基于启发式的方法,通过修剪无关关系来分析和优化基因网络的结构。本文提出了一种新的优化大基因网络结构的方法,称为GeSOp。该方法能够对构成输入网络的不相关关系进行大量剪枝。为此,该方法基于贪婪启发式,以获得最相关的子网络。通过从不同生物体获得的基因网络上的两个实验,测试了该方法的性能。第一个实验表明,GeSOp不仅能够显著缩小网络规模,而且能够保持生物信息比率。在第二个实验中,检查了改善网络生物指标的能力。因此,本文的结果表明,GeSOp是优化和改进大基因网络结构的可靠方法。

MSC公司:

92C40型 生物化学、分子生物学
第92页第42页 系统生物学、网络
92-04 生物相关问题的软件、源代码等
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] Wang,Y.X.R。;Huang,H.,《利用表达数据重建基因网络的统计方法综述》,《理论生物学杂志》,362,53-61(2014)·Zbl 1307.92099号 ·doi:10.1016/j.jtbi.2014.03.040
[2] 海克,M。;兰贝克,S。;托普费尔,S。;van Someren,E。;Guthke,R.,《基因调控网络推断:动态模型中的数据集成——综述》,《生物系统》,96,1,86-103(2009)·doi:10.1016/j.biosystems.2008.12.004
[3] Gómez-Vela,F。;巴兰科,C.D。;Díaz-Díaz,N.,结合生物学知识构建基因关联的模糊网络,应用软计算,42144-155(2016)·doi:10.1016/j.asoc.2016.01.014
[4] 马尔巴赫,D。;普里尔·R·J。;沙夫特,T。;马蒂乌西,C。;Floreano,D。;Stolovitzky,G.,揭示基因网络推断方法的优缺点,美国国家科学院学报,107,14,6286-6291(2010)·doi:10.1073/pnas.0913357107
[5] 拉赫曼,A。;乔治·F·M。;洛佩兹,G。;Califano,A.,ARACNe AP:通过相互信息的自适应划分推理进行基因网络逆向工程,生物信息学,32,1422233-2235(2016)·doi:10.1093/bioinformatics/btw216
[6] Omranian,N。;Eloundou-Mbebi,J.M.O。;米勒-罗贝尔,B。;Nikoloski,Z.,在多个数据集上使用融合LASSO进行基因调控网络推断,科学报告,6(2016)·doi:10.1038/srep20533
[7] Petralia,F。;王,P。;Yang,J.等人。;Tu,Z.,基因调控网络推断的综合随机森林,生物信息学,31,12,i197-i205(2015)·doi:10.1093/bioinformatics/btv268
[8] Yu,H。;焦,B。;卢,L。;王,P。;陈,S。;Liang,C。;刘伟。;Zheng,Y.,NetMiner,使用大规模RNA-seq样本构建全基因组和高质量基因共表达网络的集成管道,PLoS ONE,13,2,e0192613(2018)·doi:10.1371/journal.pone.0192613
[9] Poehlman,W.L。;Rynge,M。;Balamurugan,D。;Mills,N。;Feltus,F.A.,OSG-KINC:利用开放科学网格构建高通量基因共表达网络,2017年IEEE生物信息学和生物医学国际会议论文集·doi:10.1109/BIBM.2017.8217938
[10] 夏,J。;吉尔,E.E。;Hancock,R.E.W.,基因表达数据的统计、可视化和基于网络的元分析网络分析师,《自然协议》,10,6,823-844(2015)·doi:10.1038/nprot.2015.052
[11] Barabási,A。;Oltvai,Z.N.,《网络生物学:理解细胞的功能组织》,《自然评论遗传学》,5,2,101-113(2004)·doi:10.1038/nrg1272
[12] 瓦拉巴乔舒拉(Vallabhajosyula),R.R。;查克拉瓦蒂,D。;卢特菲利,S。;雷,A。;Raval,A.,《识别蛋白质相互作用网络中的枢纽》,《公共科学图书馆·综合》,2009年第4期,第4页·doi:10.1371/journal.pone.0005344
[13] Wang,Y。;张,X。;Chen,L.,《优化与系统生物学》,BMC系统生物学,4,Supply 2,S1(2010)·doi:10.1186/1752-0509-4-S2-S1
[14] 托马斯,S.A。;Jin,Y.,《重建生物基因调控网络:优化在哪里遇到大数据》,《进化智能》,2014年第7期,第1期,第29-47页·doi:10.1007/s12065-013-0098-7
[15] Mendoza,M.R。;Bazzan,A.L.,进化随机布尔网络和遗传算法用于监管网络重建,第13届年会论文集·doi:10.1145/2001576.2001617
[16] 刘杰。;Chi,Y。;朱,C.,基于模糊认知图的基因调控网络重构的动态多智能体遗传算法,IEEE模糊系统汇刊,24,2,419-431(2016)·doi:10.1109/TFUZZ.2015.2459756
[17] 熊,J。;Zhou,T.,利用回归和相关分析从多因素扰动数据推断基因调控网络,PLoS ONE,7,9(2012)·doi:10.1371/journal.pone.0043819
[18] 李,J。;Zhang,X.-S.,利用已知生物信息重建基因调控网络的优化模型,第一届优化与系统生物学国际研讨会论文集
[19] Studham,M.E。;蒂亚恩贝里,A。;Nordling,T.E.M。;Nelander,S。;Sonnhammer,E.L.L.,功能关联网络作为基因调控网络推断的先验,生物信息学,30,12,I130-I138(2014)·doi:10.1093/bioinformatics/btu285
[20] Lopes,F.M。;马丁斯特区。;巴雷拉,J。;Cesar,R.M.,《从已知拓扑特性推断图形的特征选择技术:揭示无标度基因调控网络》,《信息科学》,272,1-15(2014)·doi:10.1016/j.ins.2014.02.096
[21] 杨,B。;徐,J。;刘,B。;Wu,Z.,基于无标度属性的信息优先推理基因调控网络,第八届国际生物医药工程与信息学会议论文集(BMEI’15)·doi:10.1109/BMEI.2015.7401564
[22] West,D.B.,《图论导论》(2000),印度新德里:印度普伦蒂斯·霍尔私人有限公司
[23] 斯佩尔曼,P.T。;Sherlock,G。;张敏秋。;V.R.Iyer。;Anders,K。;艾森,M.B。;布朗,P.O。;博茨坦,D。;Futcher,B.,通过微阵列杂交综合鉴定酿酒酵母的细胞周期调节基因,细胞分子生物学(MBoC),9,12,3273-3297(1998)·doi:10.1091/mbc.9.12.3273
[24] Y.Hodo。;本田,M。;田中,A。;野村,Y。;Arai,K。;Yamashita,T。;酒井,Y。;Yamashita,T。;瑞科西,E。;Sakai,A。;佐佐木,M。;Y.Nakanuma。;森山,M。;Kaneko,S.,白细胞介素-28B基因型与慢性丙型肝炎患者肝细胞癌复发的关系,临床癌症研究,19,7,1827-1837(2013)·doi:10.1158/1078-0432.CCR-12-1641
[25] Jaskowiak,P.A。;坎佩罗,R.J.G.B。;Costa,I.G.,《关于为基因表达数据聚类选择适当距离》,BMC生物信息学,15,文章编号S2(2014)·doi:10.1186/1471-2105-15-S2-S2
[26] 宋,L。;Langfelder等人。;Horvath,S.,共同表达度量的比较:相互信息、相关性和基于模型的指数,BMC生物信息学,13,1,第328条(2012年)·doi:10.1186/1471-2105-13-328
[27] 刘,H。;刘,L。;Zhang,H.,用于癌症分类的集成基因选择,模式识别,43,8,2763-2772(2010)·doi:10.1016/j.patcog.2010.02.008
[28] Farley,D.W。;唐纳森,S.L。;来了,O。;Zuberi,K。;巴德拉维,R。;Chao,P。;弗兰兹,M。;Grouios,C。;卡齐,F。;Lopes,C.T。;美国梅特兰。;穆斯塔法维,S。;蒙托乔,J。;邵,Q。;赖特,G。;巴德,G.D。;Morris,Q.,《GeneMANIA预测服务器:基因优先排序和预测基因功能的生物网络集成》,核酸研究,38,2,W214-W220(2010)·doi:10.1093/nar/gkq537
[29] Kim,H。;Shin,J。;Kim,E。;Kim,H。;黄,S。;Shim,J.E。;Lee,I.,YeastNet v3:酿酒酵母专用数据和集成功能基因网络公共数据库,核酸研究,42,1,D731-D736(2014)·doi:10.1093/nar/gkt981
[30] Cherry,J.M。;Hong,E.L。;Amundsen,C.,《酵母基因组数据库:芽殖酵母的基因组学资源》,核酸研究,D700-D705(2012)·doi:10.1093/nar/gkr1029
[31] 李,I。;布隆,U.M。;Wang,P.I。;Shim,J.E。;Marcotte,E.M.,《通过基于网络的全基因组关联数据提升对候选疾病基因进行优先排序》,《基因组研究》,21,7,1109-1121(2011)·doi:10.1101/gr.118992.110
[32] Dougherty,E.R.,基因调控网络推理程序的验证,《当代基因组学》,8,6,351-359(2007)·doi:10.2174/138920207783406505
[33] Powers,D.M.,《评估:从精确性、召回和f-measure到roc、信息性、标记性和相关性》,《国际机器学习技术杂志》,2011年第2期,第137-63页
[34] 新墨西哥州顿切瓦。;阿塞诺夫,Y。;多明格斯,F.S。;Albrecht,M.,生物网络和蛋白质结构的拓扑分析和交互式可视化,《自然协议》,7,4,670-685(2012)·doi:10.1038/nprot.2012.004
[35] Pavlopoulos,G.A。;Secrier,M。;Moschopoulos,C.N。;Soldatos,T.G。;科斯达,S。;Aerts,J。;施耐德,R。;Bagos,P.G.,《使用图论分析生物网络》,《生物数据挖掘》,第4、1期,第10条(2011年)·doi:10.1186/1756-0381-4-10
[36] 温特巴赫,W。;Mieghem,P.V。;Reinders,M。;Wang,H。;Ridder,D.D.,分子相互作用网络拓扑,BMC系统生物学,7,第90条(2013)·doi:10.1186/1752-0509-7-90
[37] 阿塞诺夫,Y。;拉米雷斯,F。;谢尔霍恩,S.-E。;Lengauer,T。;Albrecht,M.,计算生物网络的拓扑参数,生物信息学,24,2,282-284(2008)·doi:10.1093/bioinformatics/btm554
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。