{“状态”:“确定”,“消息类型”:“工作”,“信息版本”:“1.0.0”,“邮件”:{“索引”:{“日期-部分”:[[2024,6,6]],“日期-时间”:“2024-06-06T22:34:24Z”,“时间戳”:1717713264499},“引用-计数”:0,“发布者”:“牛津大学出版社(OUP)”,“问题”:“7”,“内容-域”:{-“域”:[],“交叉标记限制”:false},”short集装箱舱位“:[],“已出版印刷品”:{“日期部分”:[[2004,5,1]]},“摘要”:“摘要<\/jats:title>\n动机:生物信息学中的一个核心问题是为有序开放阅读框架(ORF)分配功能。最常见的方法是基于推断同源性,使用基于统计的序列相似性(SIM)方法,例如PSI-BLAST。基于非SIM的替代生物信息学方法正在流行。其中一种方法是数据挖掘预测(DMP)。这是基于氨基酸属性、预测结构和系统发育模式的综合证据;并使用归纳逻辑编程数据挖掘和决策树的组合来生成函数类的预测规则。DMP预测比使用同源性更为普遍。2000年1月,DMP被用于公开预测1309株大肠杆菌ORF的功能。从那时起,生物知识的进步使我们能够检验我们的预测<\/jats:p>\n结果:我们检查了更新的(20.02.02)Riley组基因组注释,并检查了ORF功能直接实验衍生的科学文献。两次测试都证实了DMP的预测。不同规则之间的准确度不同,预测的细节也不同,但它们通常明显优于随机预测。投票规则的准确度为75\u2013100%。这些DMP预测中有21个已经被直接实验证实。DMP规则也有有趣的生物学解释。据我们所知,DMP是第一种直接在新数据上测试的非SIM预测方法<\/jats:p>\n可用性:我们为蛋白质功能预测设计了\u2018Geneffectives\u2019数据库。这是一个开放的存储库,用于存储任何生物体的预测结果,可以在http://www.geneffectives.org<\/jats:p>“,”DOI“:”10.1093\/both047“,”type“:”journal-article“,”created“:{”date-parts“:[[2004,3,2],”date-time“:”2004-03-02T21:41:06Z“,”timestamp“:”1078263666000}“page”:“1110-1118”,“source”:”Crossref“,”is-referenced-by-count“:12,”title“:[“基于数据挖掘的蛋白质功能预测的确认”],”prefix“:”10.1093“,”volume“:”20“,”author“:[{”given“:“Ross D.”,”family“:”King“,”sequence“:”first“,”affiliation“:[}”name“:”Computer Science,University of Wales,Aberystwyth,Wales,SY23 3DB,UK“}]},{”given“”:“Paul H.”,“family”:“”Wise“,”sequence“:”additional“,”affiliation“:[{”name“:”威尔士大学计算机科学系,威尔士阿伯里斯特维思,SY23 3DB,UK“}]},{”given“:”Amanda“,”family“:”Clare“,”sequence“:”additionable“,”atfiliationpublished-online“:{“date-parts”:[[2004,2,5]]},“container-title”:[“生物信息学”],“original-title“:[],“language”:“en”,“link”:[{“URL”:“https:\/\/cademicial.oup.com/bioninformations\/article-pdf\/20\/7\/48905311\/Bioinformatics_20_7_1110.pdf”,“content-type”:“application\/pdf”、“content-version”:“vor”,“intended”d-application“:”联合“},{“URL”:“https:\/\/cademicial.oup.com/bioinformatics\/article-pdf\/20\/7\/1110\/48905311\/bioinformatics_20_7_1110.pdf“,”content-type“:”unspecified“,”content-version“:”vor“,”intended-application“:”similarity-checking“}”,“deposed”:{“date-parts”:[2023,1,25]],“date-time”:“2023-01-25T17:28:16Z”,“timestamp”:1674667696000},“score”:1,“资源”:{“主资源”:}URL“:”https:\/\/cademicial.oup.com/bioinformations\/article\/20\/7\/1110\/245620“}},“subtitle”:[],“shorttitle”:[],“issued”:{“date-parts”:[[2004,2,5]]},”references-count“:0,”journal-issue“:org \/10.1093 \/生物信息学\/bth047“,”关系“:{},”ISSN“:[”1367-4811“,”1367-4803“],“issn-type”:[{“value”:“1367-4811”,“type”:“electronic”},{“value”:“367-4803”,“type”:“print”}],“subject”:[],“published-other”:{“date-parts”:[[2004,5,1]]},“publish”:{-“date-ports”:[2004,2,5]]}}}}