菲利普·特德(Philip M.R.Tedder)。;詹姆斯·布拉德福德。;克里斯·李约瑟(Chris J.Needham)。;Glenn A.Mcconkey。;安德鲁·J·布尔皮特。;大卫·R·韦斯特黑德。 用于预测疟疾基因功能的贝叶斯数据集成和富集分析。 (英语) Zbl 1269.92053号 Ambos-Spies,Klaus(编辑)等人,《数学理论与计算实践》。2009年7月19日至24日,德国海德堡,第五届欧洲可计算性会议,CiE 2009。诉讼程序。柏林:施普林格出版社(ISBN 978-3-642-03072-7/pbk)。计算机科学讲座笔记5635457-466(2009)。 摘要:疟疾是世界上最致命的疾病之一,由恶性疟原虫引起。恶性疟原虫60%的基因没有已知功能,因此需要新的基因功能预测方法。为了解决这个问题,我们在多个数据源上训练了一个朴素的Bayes分类器,然后应用改进版本的基因集富集分析算法来预测恶性疟原虫的基因功能。为了定义基因功能,我们利用基因本体的层次结构,特别是使用生物过程类别。我们通过对无法使用简单的基于序列相似性的方法注释的基因进行准确预测,证明了集成多个数据源的价值。关于整个系列,请参见[Zbl 1192.68004号]. MSC公司: 92C60型 医学流行病学 92-08 生物问题的计算方法 68T05型 人工智能中的学习和自适应系统 92D10型 遗传学和表观遗传学 关键词:恶性疟原虫;贝叶斯分类器;异构数据源;机器学习 软件:PlasmoDraft公司;爆炸;完整的;BNT公司;InterProScan公司 PDF格式BibTeX公司 XML格式引用 \textit{P.M.R.Tedder}等人,Lect。注释计算。科学。5635、457--466(2009年;Zbl 1269.92053) 全文: 内政部 参考文献: [1] Liolios,K.等人:2007年的基因组在线数据库(GOLD):基因组和宏基因组项目及其相关元数据的状态。核酸研究36,D475–D479(2008)·兹伯利05438486 ·doi:10.1093/nar/gkm884 [2] Altschul,S.F.等人:缺口BLAST和PSI-BLAST:新一代蛋白质数据库搜索程序。核酸研究25,3389–3402(1997)·doi:10.1093/nar/25.17.3389 [3] Pena-Castillo,L.等人:利用综合基因组证据对小家鼠基因功能预测进行关键评估。基因组生物学。9(补充1),S2(2008)·doi:10.1186/gb-2008-9-s1-s2 [4] Ashburner,M.等人:基因本体论:生物学统一的工具。基因本体联盟。自然遗传学。 25, 25–29 (2000) [5] Gardner,M.J.等人:人类疟疾寄生虫恶性疟原虫的基因组序列。《自然》419,498–511(2002)·doi:10.1038/nature01097 [6] Brehelin,L.等人:PlasmoDraft:基于后基因组数据的恶性疟原虫基因功能预测数据库。BMC生物信息学9440(2008)·doi:10.186/1471-2105-9-440 [7] Resnik,P.:分类学中的语义相似性:一种基于信息的度量方法及其在自然语言歧义问题中的应用。《人工智能研究杂志》11,95–130(1999)·Zbl 0924.68155号 [8] Lord,P.W.等人:研究基因本体中的语义相似性度量:序列和注释之间的关系。生物信息学19,1275–1283(2003)·doi:10.1093/bioinformatics/btg153 [9] Wang,J.Z.,et al.:一种度量GO术语语义相似度的新方法。生物信息学23,1274–1281(2007)·Zbl 1123.65058号 ·doi:10.1093/bioinformatics/btm087 [10] dfmax.c中,ftp://dimacs.rutgers.edu/pub/challenge/graph/solvers公司 [11] Mulder,N.J.等人:InterPro数据库的新发展。核酸研究35,D224–D228(2007)·Zbl 05438268号 ·数字对象标识代码:10.1093/nar/gkl841 [12] Quevillon,E.等人:InterProScan:蛋白质结构域标识符。核酸研究33,W116–W120(2005)·Zbl 05437732号 ·doi:10.1093/nar/gki442 [13] Stoeckert Jr.,C.J.等人:PlasmoDB v5:新外观,新基因组。趋势寄生虫22,543–546(2006)·doi:10.1016/j.pt.2006.09.005 [14] Chen,F.等人:OrthoMCL-DB:查询正交群的综合多物种集合。核酸研究34,D363–D368(2006)·Zbl 05437916号 ·doi:10.1093/nar/gkj123 [15] Date,S.V.,Stoeckert Jr.,C.J.:恶性疟原虫相互作用组的计算建模揭示了全基因组范围内的蛋白质功能。基因组研究16,542–549(2006)·数字对象标识代码:10.1101/gr.4573206 [16] Llinas,M.等人:三种恶性疟原虫株的比较全基因组转录组分析。核酸研究34,1166–1173(2006)·doi:10.1093/nar/gkj517 [17] Young,J.A.等人:恶性疟原虫性发育转录组:使用基于个体学的模式识别的微阵列分析。分子生物化学。寄生虫143、67–79(2005)·doi:10.1016/j.molbiopara.2005.005.07 [18] Le Roch,K.G.等人:通过疟原虫生命周期的表达谱发现基因功能。《科学》3011503–1508(2003)·数字对象标识代码:10.1126/science.1087025 [19] Florens,L.等人:恶性疟原虫生命周期的蛋白质组学观点。《自然》419,520–526(2002)·doi:10.1038/nature01107 [20] Lasonder,E.等人:用高精度质谱法分析恶性疟原虫蛋白质组。《自然》419,537–542(2002)·doi:10.1038/nature01111 [21] Khan,S.M.等人:对分离的雄性和雌性配子细胞进行蛋白质组分析,揭示了新的性别特异性疟原虫生物学。细胞121、675–687(2005)·doi:10.1016/j.cell.2005.03.027 [22] Le Roch,K.G.等人:恶性疟原虫生命周期中转录物和蛋白质水平的全球分析。基因组研究14,2308–2318(2004)·doi:10.1101/gr.2523904 [23] Hermjakob,H.等人:IntAct:开源分子相互作用数据库。核酸研究32,D452–D455(2004)·Zbl 05435779号 ·doi:10.1093/nar/gkh052 [24] LaCount,D.J.等人:疟疾寄生虫恶性疟原虫的蛋白质相互作用网络。《自然》438103–107(2005)·doi:10.1038/nature04104 [25] Murphy,K.P.:Matlab的贝叶斯网络工具箱。计算科学与统计33(2001) [26] Subramanian,A.等人:基因集富集分析:解释全基因组表达谱的基于知识的方法。程序。国家。阿卡德。科学。《美国判例汇编》第102卷第15545页至第15550页(2005年)·doi:10.1073/pnas.0506580102 [27] Wuchty,S.、Ipsaro,J.J.:恶性疟原虫蛋白质相互作用草案。《蛋白质组研究杂志》,第6期,1461–1470页(2007年)·doi:10.1021/pr0605769 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。