×

基于图嵌入的基因网络重构因果关系挖掘。 (英语) Zbl 1497.68435号

摘要:基因网络重建是一项生物信息学任务,旨在对基因之间可能发生的复杂调控活动进行建模。这项任务通常通过分析基因表达数据的链接预测方法来解决。然而,重构后的网络往往存在大量假阳性边缘,这实际上是间接调控活动的结果,因为存在共同原因和共同效果现象,或者换句话说,因为所采用的归纳方法没有考虑可能的因果关系现象。基因表达数据中固有的高噪声更加剧了这个问题。用于识别网络的传递性约简或去除(可能)冗余边的现有方法在网络结构或间接调节的性质/长度方面受到限制,并且通常需要额外的预处理步骤来处理网络的特定特性(例如,周期)此外,他们无法考虑网络中可能的社区结构和基因可能的类似作用(例如中心节点),这可能会改变网络中节点高度连接(以及与哪些节点连接)的趋势。本文提出INLOCANDA方法,它学习了一个用于基因网络重建的归纳预测模型,并克服了所有上述限制。特别是,INLOCANDA能够(i)识别和利用任意长度的间接关系,以消除因共同原因和共同效果现象而产生的边缘;(ii)通过图嵌入的方式考虑可能的社区结构和可能的类似角色。在两种生物体的基准真实网络上进行的多维度分析实验(大肠杆菌酿酒酵母)与竞争对手相比,显示出更高的准确性,以及对数据中存在的噪声具有更高的鲁棒性,并且在删除大量(可能为假阳性)交互时也是如此。可利用性:网址:http://www.di.uniba.it/~gianvitopio/systems/inlocanda/

MSC公司:

68T05型 人工智能中的学习和自适应系统
62页第10页 统计学在生物学和医学科学中的应用;元分析
92立方厘米 系统生物学、网络
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 啊哈,DW;Kibler,D。;Albert,MK,基于实例的学习算法,机器学习,6,1,37-66(1991)
[2] 阿霍,AV;马里兰州加里;Ullman,JD,有向图的传递约简,SIAM计算杂志,1,2,131-137(1972)·Zbl 0247.05128号 ·数字对象标识代码:10.1137/021008
[3] Atias,N。;Sharan,R.,《蛋白质网络的比较分析:难题,实际解决方案》,《ACM通讯》,第55、5、88-97页(2012年)·数字对象标识代码:10.1145/2160718.2160738
[4] 巴布,MM;卢斯科姆,新墨西哥州;Aravind,L。;Gerstein,M。;Teichmann,SA,转录调控网络的结构和进化,结构生物学的当前观点,14,3,283-291(2004)·doi:10.1016/j.sbi.2004.05.004
[5] 贝尔金,M。;Niyogi,P。;饮食疗法,TG;贝克尔,S。;Ghahramani,Z.,嵌入和聚类的拉普拉斯特征映射和光谱技术,神经信息处理系统的进展14,585-591(2002),剑桥:麻省理工学院出版社,剑桥
[6] 伯杰,MF;Bulyk,ML,用于转录因子DNA结合特异性综合表征的通用蛋白质结合微阵列,自然协议,4,393-411(2009)·doi:10.1038/nprot.2008.195
[7] Blockeel,H。;雷德,LD;Ramon,J。;Shavlik,JW,聚类树的自上而下诱导,ICML 1998,55-63(1998),伯灵顿:Morgan Kaufmann,Burlington
[8] M·Böck。;Ogishima,S。;Tanaka,H。;克莱默,S。;Kaderali,L.,利用自动相关性测定重建以Hub为中心的基因网络,PLOS ONE,7,5,1-17(2012)·doi:10.1371/journal.pone.0035077
[9] 博什纳奇奇,D。;奥登布雷特,MR;Wijs,A。;Ligtenberg,W。;Hilbers,P.,《通过通用图形处理器上的传递约简高效重建生物网络》,BMC生物信息学,13,1,281(2012)·Zbl 1337.05097号 ·doi:10.1186/1471-2105-13-281
[10] Bulyk,ML,《发现细菌的DNA调控元件》,《自然生物技术》,23,8,942-944(2005)·doi:10.1038/nbt0805-942
[11] 塞西,M。;Pio,G。;库兹马诺夫斯基,V。;D类eroski,S.,基因网络重建的半监督多视角学习,PLOS ONE,10,12,1-27(2015)·doi:10.1371/journal.pone.0144031
[12] Cohen,W.W.(1995)。快速有效的规则归纳。机器学习国际会议第十二届国际会议记录,ICML'95(第115-123页)。加利福尼亚州旧金山:Morgan Kaufmann Publishers Inc。
[13] de Jong,H.,《遗传调控系统的建模与模拟:文献综述》,《计算生物学杂志》,9,1,67-103(2002)·doi:10.1089/10665270252833208
[14] Demšar,J.,多数据集上分类器的统计比较,机器学习研究杂志,7,1-30(2006)·Zbl 1222.68184号
[15] Emmert-Streib,F。;Glazko,G。;De Matos Simoes,R.,《来自观察表达数据的基因调控网络的统计推断和逆向工程》,生物信息学和计算生物学,3,8(2012)
[16] 加拉赫,B。;Eliassi-Rad,T。;贾尔斯,L。;史密斯,M。;Yen,J。;Zhang,H.,《利用标签相关特征对稀疏标记网络进行分类:一项实证研究》,《社交网络挖掘与分析进展》,1-19(2010),柏林:斯普林格出版社,柏林
[17] Geistlinger,L.、Csaba,G.、Dirmeier,S.、Küffner,R.和Zimmer,R.(2013)。酿酒酵母双歧化转变的综合基因调控网络。核酸研究,41(18),8452-8463。doi:10.1093/nar/gkt631。
[18] Grover,A.和Leskovec,J.(2016)。Node2vec:网络的可扩展特性学习。第22届ACM SIGKDD知识发现和数据挖掘国际会议论文集,KDD’16(第855-864页)。纽约州纽约市:ACM。
[19] Hase,T。;Ghosh,S。;Yamanaka,R。;Kitano,H.,《利用多样性重建大规模基因调控网络》,公共科学图书馆计算生物学,9,11,e1003361(2013)·doi:10.1371/journal.pcbi.1003361
[20] 海克,M。;兰贝克,S。;托普费尔,S。;Van Someren,E。;Guthke,R.,《基因调控网络推断:动态模型中的数据集成——综述》,生物系统,96,1,86-103(2009)·doi:10.1016/j.biosystems.2008.12.004
[21] 亨佩尔,S。;Koseska,A。;尼古洛斯基,Z。;Kurths,J.,从时间分辨基因表达数据中解开基因调控网络——测量值比较研究,BMC生物信息学,12,1,292(2011)·doi:10.1186/1471-2105-12-292
[22] Henderson,K.、Gallagher,B.、Li,L.、Akoglu,L.,Eliassi-Rad,T.、Tong,H.和Faloutsos,C.(2011年)。这就是你认识的人:使用递归结构特征进行图形挖掘。第17届ACM SIGKDD知识发现和数据挖掘国际会议论文集,KDD’11(第663-671页)。纽约:ACM。
[23] Hsu,HT,找到有向图的最小等价图的算法,美国计算机学会杂志,22,1,11-16(1975)·Zbl 0316.05114号 ·doi:10.1145/321864.321866
[24] 伊巴古伦,I。;Lasarguren,A。;佩雷斯,JM;穆盖尔扎,J。;古鲁特哈加,I。;阿伯莱茨,O.,Bfpart:信息科学最佳第一部分,367-368927-952(2016)·doi:10.1016/j.ins.2016.07.023
[25] Itani,S.、Ohannessian,M.、Sachs,K.、Nolan,G.P.和Dahleh,M.A.(2008年)。因果循环网络中的结构学习。在因果关系国际会议记录:目标和评估。6,COA’08(第165-176页)JMLR.org。
[26] 科尔布,KB;Nicholson,AE,Bayesian Artificial Intelligence(2010),佛罗里达州博卡拉顿:CRC Press Inc,佛罗里达州波卡拉顿·Zbl 1080.68100号 ·doi:10.1201/b10391
[27] 李,J。;Xie,D.,Rack1,癌症多功能中心,癌基因,34,15,1890-1898(2015)·doi:10.1038/onc.2014.127
[28] Lo,L。;Wong先生。;Lee,K。;Leung,K.,具有隐藏共同原因的延时因果基因调控网络推断,PLOS ONE,10,9,1-47(2015)·doi:10.1371/journal.pone.0138596
[29] 吕,L。;Zhou,T.,《复杂网络中的链接预测:一项调查》,《物理学A:统计力学及其应用》,390,6,1150-1170(2011)·doi:10.1016/j.physa.2010.11.027
[30] 马尔巴赫,D。;科斯特洛,JC;Küffner,R。;新墨西哥州织女星;普里尔,RJ;卡马乔,DM;阿利森,KR;凯利斯,M。;柯林斯,JJ;Stolovitzky,G.,《稳健基因网络推理的群体智慧》,《自然方法》,第9796-804页(2012年)·doi:10.1038/nmeth.2016
[31] Margolin,A。;内曼,I。;Basso,K。;威金斯,C。;斯托洛维茨基,G。;Favera,R。;Califano,A.,Aracne:哺乳动物细胞环境中基因调控网络重建的算法,BMC生物信息学,7,Suppl 1,S7(2006)·doi:10.1186/1471-2105-7-S1-S7
[32] 马尔科维茨,F。;Spang,R.,《推断细胞网络——综述》,BMC生物信息学,8,Suppl 6,S5(2007)·doi:10.1186/1471-2105-8-S6-S5
[33] Mikolov,T.、Chen,K.、Corrado,G.S.和Dean,J.(2013)。向量空间中单词表示的有效估计。CoRR arXiv公司:1301.3781
[34] Omranian,N。;Eloundou-Mbebi,JMO;米勒-罗贝尔,B。;Nikoloski,Z.,《在多个数据集上使用融合套索进行基因调控网络推断》,《科学报告》,620533(2016)·doi:10.1038/srep20533
[35] Park,PJ,ChIP-seq:成熟技术的优势和挑战,《自然评论遗传学》,10,10,669-680(2009)·doi:10.1038/nrg2641
[36] Pearl,J.,《因果关系:模型、推理和推断》(2000),纽约:剑桥大学出版社,纽约·Zbl 0959.68116号
[37] 加利福尼亚州Penfold;Wild,DL,如何从表达谱推断基因网络,重访,界面焦点,1,6,857-870(2011)·doi:10.1098/rsfs.2011.0053
[38] Perozzi,B.、Al Rfou,R.和Skiena,S.(2014)。Deepwalk:社交表征的在线学习。《第20届ACM SIGKDD知识发现和数据挖掘国际会议论文集》,KDD’14(第701-710页)。纽约州纽约市:ACM。
[39] Pinna,A。;Soranzo,N。;de la Fuente,A.,《从淘汰赛到网络:通过图表分析建立直接因果关系》,《公共科学图书馆·综合》,10,5,e12912(2010)·doi:10.1371/journal.pone.0012912
[40] Pio,G。;塞西,M。;Malerba,D。;D'Elia,D.,ComiRNet:基于网络的miRNA-gene调控网络分析系统,BMC生物信息学,16,9,S7(2015)·doi:10.1186/1471-2105-16-S9-S7
[41] Pio,G。;塞西,M。;Prisciandaro,F。;Malerba,D。;山本,A。;Kida,T。;Uno,T。;Kuboyama,T.,LOCANDA:《在基因调控网络重建中探索因果关系》,《发现科学2017》,计算机科学讲稿,283-297(2017),柏林:斯普林格,柏林
[42] Roweis,ST;Saul,LK,通过局部线性嵌入降低非线性维数,《科学》,29055002326(2000)·doi:10.1126/science.290.5500.2323
[43] Selvanathan,SP;Graham,GT;Erkizan,高压;德克森,美国。;TG Natarajan;达契克,A。;Yu,S。;刘,X。;保尔森,MT;永曼,ME;吴,CH;劳勒,ER;尤仁,A。;Toretsky,JA,癌基因融合蛋白ews-fli1是一个调节选择性剪接的网络中枢,《美国国家科学院院刊》,112,11,E1307-E1316(2015)·doi:10.1073/pnas.1500536112
[44] 唐J.、曲M.、王M.、张M.、严J.和梅Q.(2015)。线路:大规模信息网络嵌入。《第24届万维网国际会议论文集》,WWW’15(第1067-1077页)。瑞士日内瓦共和国和州国际万维网会议指导委员会。
[45] Tenenbaum,JB;弗吉尼亚州席尔瓦;Langford,JC,《非线性降维的全球几何框架》,《科学》,29055002319-2323(2000)·doi:10.1126/science.290.5500.2319
[46] Thattai,M。;van Oudenaarden,A.,基因调控网络中的固有噪声,《国家科学院学报》,98,15,8614-8619(2001)·doi:10.1073/美国国家统计局.151588598
[47] Van den Bulcke,T。;Van Leemput,K。;Naudts,B。;范雷摩尔,P。;马,H。;Verschoren,A。;De Moor,B。;Marchal,K.,SynTReN:用于结构学习算法设计和分析的合成基因表达数据生成器,BMC生物信息学,7,43(2006)·doi:10.1186/1471-2105-7-43
[48] 维拉尔塔,R。;Drissi,Y.,《元学习的视角和调查》,《人工智能评论》,18,2,77-95(2002)·doi:10.1023/A:1019956318069
[49] Yu,D。;Lim,J。;王,X。;梁,F。;Xiao,G.,使用中枢基因信息增强基因调控网络的构建,BMC生物信息学,18,1,186(2017)·doi:10.1186/s12859-017-1576-1
[50] Zitnik,M。;Zupan,B.,通过网络引导矩阵完成上位MAP中的数据插补,计算生物学杂志,22,6,595-608(2015)·doi:10.1089/cmb.2014.0158
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。