×

通过蛋白质网络中的路径结构和社区结构预测疾病相关基因。 (英语) 兹比尔1456.92087

摘要:基于网络的计算方法在预测与疾病相关的基因方面对于揭示人类疾病的分子基础具有重要意义。在这里,我们提出了一种新的疾病基因预测方法,将基于路径的结构与人类蛋白质-蛋白质网络中的群落结构特征相结合。首次提出了一种新的相似性度量方法,该方法基于网络的路径和社区结构,并利用社区结构进行疾病基因预测。然后,对疾病基因和非疾病基因识别方法的区分能力进行统计评估,以分析其预测疾病基因的能力。最后,将新方法应用于多个数据集的疾病基因预测,并分析了这些措施在疾病基因预测中的性能,重点评估了群落结构对预测性能的影响。结果表明,新方法能够预测多个网络和多个疾病类别中的疾病基因。此外,本文报告的结果证实,社区结构的结合确实可以提高疾病基因预测方法的性能。

MSC公司:

92D10型 遗传学和表观遗传学
92立方厘米 系统生物学、网络
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 莫罗,Y。;Tranchevent,L-C,《优先选择候选基因的计算工具:促进疾病基因发现》,《自然评论遗传学》。,13, 523-536, (2012) ·doi:10.1038/nrg3253
[2] Barabasi,A-L;北卡罗来纳州古尔巴切。;Loscalzo,J.,《网络医学:基于网络的人类疾病治疗方法》,《自然遗传学评论》。,12, 56-68, (2011) ·doi:10.1038/nrg2918
[3] 博茨坦,D。;Risch,N.,《发现人类表型的基因型:孟德尔病的过去成功,复杂疾病的未来方法》,《自然遗传学》。,33, 228-237, (2003) ·doi:10.1038/ng1090
[4] 约翰逊,A.D。;O'Donnell,C.J.,《全基因组关联结果的开放存取数据库》,BMC医学遗传学。,10, 1-17, (2009) ·doi:10.1186/1471-2350-10-6
[5] M.I.麦卡锡。;Abecasis,G.R。;Cardon,L.R。;Goldstein,D.B。;Little,J。;Ioanidis,J.P A。;Hirschorn,J.N.,《复杂性状的全基因组关联研究:共识、不确定性和挑战》,《国家遗传学评论》。,9, 356-369, (2008) ·doi:10.1038/nrg2344
[6] 蒂芬,N。;Andrade-Navarro,医学硕士。;Perez Iratxeta,C.,将基因与疾病联系起来:这都在数据中,基因组医学,1,1-7,(2009)·数字对象标识码:10.1186/gm1
[7] van Driel,医学硕士。;Brunner,H.G.,用于鉴定候选疾病基因的生物信息学方法,Hum.Genom。,2, 1-4, (2006) ·doi:10.1186/1479-7364-2-6-429
[8] Kann,M.G.,《翻译生物信息学进展:寻找疾病基因的计算方法》,简介。生物信息。,11, 96-110, (2009) ·doi:10.1093/bib/bbp048
[9] 皮罗·R·M。;美国阿拉。;Molineris,I。;Grassi,大肠杆菌。;Bracco,C。;佩雷戈,G.P。;普罗维罗,P。;Di Cunto,F.,《用于功能注释和疾病基因预测的组织特异性保守共表达图谱》,《欧洲遗传学杂志》。,19, 1173-1180, (2011) ·doi:10.1038/ejhg.2011.96
[10] 刘,B。;金,M。;Zeng,P.,通过结合拓扑相似性和语义相似性对候选疾病基因进行优先排序,J.Biomed。通知。,57, 1-5, (2015) ·doi:10.1016/j.jbi.2015.07.005
[11] 罗,J。;Liang,S.,《通过蛋白质-蛋白质相互作用网络和表型数据的拓扑相似性对潜在候选疾病基因进行优先排序》,J.Biomed。通知。,53, 229-236, (2015) ·doi:10.1016/j.jbi.2014.11.004
[12] 陈,B。;Wang,J。;李,M。;Wu,F-X,通过整合多个数据源识别疾病基因,BMC医学基因组。,7、S2(2014)·doi:10.1186/1755-8794-7-2
[13] 菲尔兹,S。;Song,O-K,检测蛋白质相互作用的新型遗传系统,《自然》,340,245-246,(1989)·数字对象标识代码:10.1038/340245a0
[14] 纳瓦拉卡,S。;Kingsford,C.,蛋白质相互作用网络在基因与疾病关联中的作用,生物信息学,261057-1063,(2010)·doi:10.1093/bioinformatics/btq076
[15] 吴,S-Y;邵,F-J;太阳,R-C;隋,Y。;Wang,Y。;Wang,J-L,利用蛋白质-蛋白质相互作用网络检测疾病基因的人类基因分析,Physica A,398217-228,(2014)·doi:10.1016/j.physa.2013.12.046
[16] 李,M。;张杰。;刘,Q。;Wang,J。;Wu,F-X,利用DNA甲基化基于加权组织特异性网络预测疾病相关基因,BMC医学基因组。,2014年4月7日·doi:10.1186/1755-8794-7-4
[17] Sun,P.G。;高,L。;Han,S.,通过聚类分析预测人类疾病相关基因簇,国际生物学杂志。科学。,7, 61-73, (2011) ·doi:10.7150/ijbs.7.61
[18] 吴,S。;邵,F。;张,Q。;季军(Ji,J.)。;徐,S。;Sun,R。;Sun,G。;杜,X。;Sui,Y.,基因优先化加权蛋白质相互作用网络中的拓扑关联分析,Physia A,461,262-269,(2016)·Zbl 1400.92355号 ·doi:10.1016/j.physa.2016.05.043
[19] Wang,X-D;黄,J-L;Yang,L.等人。;魏,D-Q;齐,Y-X;Jiang,Z-L,使用graphelet交互从交互组网络中识别人类疾病基因,PLoS One,9,(2014)·doi:10.1371/journal.pone.0086142
[20] Goh,K-I;库西克,M。;瓦莱,D。;Childs,B。;维达尔,M。;Barabási,A-L,人类疾病网络,Proc。美国国家科学院。科学。,104, 8685-8690, (2007) ·doi:10.1073/pnas.0701361104
[21] 奥蒂,M。;Brunner,H.G.,《遗传病的模块化本质》,临床。遗传学。,71, 1-11, (2007) ·doi:10.1111/j.1399-0004.2006.00708.x
[22] 刘伟。;孙,Z。;Xie,H.,《相互作用网络中人类遗传病和组织特异性蛋白质的分析》,J.Biomed。通知。,61, 10-18, (2016) ·doi:10.1016/j.jbi.2016.03.012
[23] Nitsch,D。;Gonçalves,J.P。;Ojeda,F。;de Moor,B。;Moreau,Y.,通过使用机器学习方法对差异表达进行网络分析的候选基因优先排序,BMC Bioninform。,11, 1-16, (2010) ·doi:10.1186/1471-2105-11-1
[24] 艾亚尔,R.S。;Gagneur,J。;Steinmetz,L.M.,通过多个数据集的综合分析鉴定线粒体疾病基因,方法,46248-255,(2008)·doi:10.1016/j.meth.2008.10.02
[25] 李,Z-C;赖,Y-H;L-L,Chen;谢毅。;戴,Z。;Zou,X-Y,基于网络拓扑特征识别和优先排序疾病相关基因,Biochim。生物物理学。《学报》,1844年,第2214-2221页,(2014年)·doi:10.1016/j.bbapap.2014.08.009
[26] 斯利瓦斯塔瓦,I。;Gahlot,L.K。;库拉纳,P。;Hasija,Y.,dbAARD&AGP:预测与年龄相关疾病相关基因的计算管道,J.Biomed。通知。,60, 153-161, (2016) ·doi:10.1016/j.jbi.2016.01.004
[27] Yousef,A。;Charkari,N.M.,一种基于氨基酸物理化学性质和一类分类算法的疾病基因识别新方法,J.Biomed。通知。,56, 300-306, (2015) ·doi:10.1016/j.jbi.2015.06.018
[28] 徐,J。;Li,Y.,通过人类蛋白质-蛋白质相互作用网络的拓扑特征发现疾病基因,生物信息学,222800-2805,(2006)·doi:10.1093/bioinformatics/btl467
[29] 奥蒂,M。;斯内尔,B。;Huynen,医学硕士。;Brunner,H.G.,《利用蛋白质-蛋白质相互作用预测疾病基因》,《医学遗传学杂志》。,43, 691-698, (2006) ·doi:10.1136/jmg.2006.041376
[30] Hsu,C-L;黄,Y-H;Hsu,C-T;Yang,U-C,通过基于基因互联性的方法确定疾病候选基因的优先级,BMC基因组。,12, 1-12, (2011) ·doi:10.1186/1471-2164-12-1
[31] 朱,C。;库什瓦哈,A。;伯曼,K。;Jegga,A.G.,一个基于顶点相似性的框架,用于发现和排列孤儿疾病相关基因,BMC系统。生物,6,1-9,(2012)·doi:10.1186/1752-0509-6-1
[32] Gagneur,J。;克劳斯,R。;布梅斯特,T。;Casari,G.,蛋白质-蛋白质相互作用网络的模块分解,基因组生物学。,第5卷,第57页,(2004年)·doi:10.1186/gb-2004-5-8-r57
[33] Goh,K-I;Choi,I-G,《探索人类疾病:人类疾病网络》,简介。功能。基因组。,11, 533-542, (2012) ·doi:10.1093/bfgp/els032
[34] Fortunato,S.,《图形中的社区检测》,Phys。众议员,486,75-174,(2010)·doi:10.1016/j.physrep.2009.11.002
[35] 刘易斯,A。;琼斯,N。;波特,M。;Deane,C.,《多尺度蛋白质相互作用网络中群落的功能》,BMC系统。生物学,4100(2010)·doi:10.1186/1752-0509-4-100
[36] Keshava Prasad,T.S.,《2009年人类蛋白质参考数据库更新》,核酸研究,37,D767-D772,(2009)·数字对象标识代码:10.1093/nar/gkn892
[37] 斯塔克,C。;Breitkreutz,B.J。;Reguly,T。;Boucher,L。;Breitkreutz,A。;Tyers,M.,BioGRID:交互数据集的通用存储库,核酸研究,34,D535-D539,(2006)·doi:10.1093/nar/gkj109
[38] Wu,C.,BioGPS:用于查询和组织基因注释资源的可扩展和可定制门户,Genome Biol。,10,R130,(2009)·doi:10.1186/gb-2009-10-11-r130
[39] Su,A.I.,小鼠和人类蛋白编码转录体的基因图谱,Proc。美国国家科学院。科学。美国,1016062-6067,(2004)·doi:10.1073/pnas.0400782101
[40] 基因型组织表达(GTEx)初步分析:人类的多问题基因调控,Science,348648-660,(2015)·doi:10.1126/science.1262110
[41] 苏,W-H;Chao,C-C;是的,S-H;陈,D-S;陈,P-J;Jou,Y-S,OncoDB。HCC:肝癌的综合肿瘤基因组数据库揭示了异常的癌靶基因和位点,核酸研究,35,D727-D731,(2007)·电话:10.1093/nar/gkm080
[42] 博卡莱蒂,S。;拉托拉,V。;莫雷诺,Y。;查韦斯,M。;Hwang,D-U,《复杂网络:结构和动力学》,《物理学》。众议员,424175-308,(2006)·Zbl 1371.82002号 ·doi:10.1016/j.physrep.2005.10.009
[43] Xiang,J。;胡,K。;Zhang,Y。;胡,T。;Li,J-M,复杂网络中度相关性的分析和扰动,Europhys。莱特。,111, 48003, (2015) ·doi:10.1209/0295-5075/111/48003
[44] McKusick,V.A.,《人类孟德尔遗传及其在线版本》,OMIM,Am.J.Hum.Genet。,80, 588-604, (2007) ·doi:10.1086/514346
[45] Xiang,J。;胡克。;Zhang,Y。;Bao,M-H;Tang,L。;唐,Y-N;高,Y-Y;李,J-M;陈,B。;胡,J-B,利用当地结构信息加强社区检测,J.Stat.Mech。,(2016) ·Zbl 1457.91314号 ·doi:10.1088/1742-5468/2016/03/033405
[46] 吕,L-Y;Zhou,T.,《复杂网络中的链接预测:一项调查》,Physica a,3901150-1170,(2011)·doi:10.1016/j.physa.2010.11.027
[47] 雷,C。;Ruan,J.,一种通过拓扑相似性重建蛋白质-蛋白质相互作用网络的新型链接预测算法,生物信息学,29,355-364,(2013)·doi:10.1093/bioinformatics/bts688
[48] 西蒙,D。;玛丽亚·T·J。;克劳迪奥,D。;Vittorio,C.C.,《二部网络拓扑链接预测的共同邻居和本地社区范式》,《新物理学杂志》。,17, (2015) ·doi:10.1088/1367-2630/17/11/113037
[49] Katz,L.,《社会计量分析得出的新地位指数》,《心理测量学》,第18期,第39-43页,(1953年)·Zbl 0053.27606号 ·doi:10.1007/BF02289026
[50] 阿里纳斯,A。;达农,L。;Díaz-Guilera,A。;格雷瑟,P.M。;Guimerá,R.,《社交网络中的社区分析》,《欧洲物理学》。J.B,38,373-380,(2004)·doi:10.1140/epjb/e2004-00130-1
[51] 梁,A。;巴德,G.D。;Reimand,J.,HyperModules:识别具有临床和表型意义的疾病突变网络模块,用于生物标记物发现,生物信息学,30,2230-2232,(2014)·doi:10.1093/bioinformatics/btu172
[52] 陈,J。;张,L。;刘伟。;Yan,Z.,基于离散时间模型的有符号网络中的社区检测,中国。物理。B、 2017年1月26日·doi:10.1088/1674-1056/26/1/018901
[53] 程,J-J;李立杰;冷,M-W;卢,W-G;姚,Y-K;陈,X-Y,一种用于网络社区检测的分裂谱方法,J.Stat.Mech。,(2016) ·Zbl 1456.68142号 ·doi:10.1088/1742-5468/2016/03/033403
[54] 冷,M。;黄,L。;李,L。;周,H。;Cheng,J。;Chen,X.,基于非对称相似性测度的主动半监督社区检测,国际期刊Mod。物理。B、 291550078(2015)·Zbl 1316.05113号 ·doi:10.1142/S0217979215500782
[55] 布隆德尔,V.D。;纪尧姆,J-L;兰比奥特,R。;Lefebvre,E.,《大型网络中社区的快速发展》,J.Stat.Mech。,(2008) ·Zbl 1459.91130号 ·doi:10.1088/1742-5468/2008/10/P10008
[56] Vihinen,M.,如何评估预测方法的性能?变异效应分析中的度量及其解释,BMC基因组。,13, 1-10, (2012) ·doi:10.1186/1471-2164-13-S4-S2
[57] 科勒,S。;鲍尔,S。;霍恩,D。;罗宾逊,P.N.,《行走交互组以确定候选疾病基因的优先顺序》,《美国遗传学杂志》。,82,949-958,(2008年)·doi:10.1016/j.ajhg.2008.02.013
[58] 吉亚西安,S.D。;Menche,J。;Barabási,A-L,DIseAse MOdule Detection(DIAMOnD)算法,源自对人类相互作用体中疾病蛋白质连接模式的系统分析,PLoS Compute。生物学,11,e1004120,(2015)·doi:10.1371/journal.pcbi.1004120
[59] 吕,L-Y;金,C-H;Zhou,T.,用于复杂网络链路预测的基于局部路径的相似性指数,Phys。版本E,80,(2009)·doi:10.1103/PhysRevE.80.046122
[60] 张,L。;胡克。;唐毅,利用人类蛋白质相互作用网络中的拓扑相似性预测疾病相关基因,开放物理学。,8, 672-682, (2010) ·doi:10.2478/s11534-009-0114-9
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。