跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

Https公司

该站点是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
.2010年10月25日:11:530。
doi:10.1186/1471-2105-11-530。

形式化基于分类的约束以检测注释和本体开发中的不一致性

附属公司

基于分类单元的约束的形式化,以检测注释和本体开发中的不一致

詹妮弗·迪根·奈·克拉克等。 BMC生物信息学. .

摘要

背景:基因本体项目支持根据基因产品的作用位置、它们所执行的分子功能以及它们所涉及的过程对其进行分类。尽管本体是有意开发为分类单元中立的,并涵盖所有物种,在某些分支中存在固有的分类单元特异性。例如,“泌乳”过程是哺乳动物特有的,“线粒体”位置是真核生物特有的。这些约束缺乏明确的形式化可能导致自动和手动注释中的错误和不一致。

结果:我们已经形式化了一些GO类中隐含的分类约束,并在本体中的不同级别上指定了这些约束。我们还开发了一个推理系统,可以用来检查注释中是否违反了这些约束。将约束与推理系统结合使用,我们检测并删除了注释中的错误,并改进了本体的结构。

结论:检测分类单元特异性的不一致性可以逐步改进本体、注释和形式化约束。这正在逐步提高我们数据的质量。完整的系统可供下载,新的约束或对约束的建议更改可以在线提交,网址为https://sourceforge.net/tracker/?atid=605890&group_id=36855。

PubMed免责声明

数字

图1
图1
哺乳期GO类“泌乳”仅限于用于分类学分组哺乳动物的基因产品。该类继承了超类“乳腺发育”的这一限制。在这个图中,GO类以蓝色显示,分类类以黄色显示。关系类型在图表中进行了标记。
图2
图2
C4光合作用。GO类“C4光合作用”仅限于用于分类群Viridiplanate物种的基因产物。这是一个比GO超类“光合作用”限制的分类群更窄的分类群。GO类的“光合作用”仅限于与任何亚类的维氏植物、真核生物、古生菌或细菌的基因产物一起使用只有_在里面_分类单元从“光合作用”到联合术语“Viridiplanate或Euglenozoa或Archaea或细菌”,以及该联合术语与四个单独分类群之间的关系。后一种关系如下所示联盟_属于关系(标记为“un”)。在该图中,GO类以蓝色显示,分类类以黄色显示。关系类型在图表中进行了标记。

类似文章

  • GOChase-II:纠正基于基因本体的基因产品注释的语义不一致。
    Park YR、Kim J、Lee HW、Yoon YJ、Kim JH。 Park YR等人。 BMC生物信息学。2011年2月15日;12补充1(补充1):S40。doi:10.1186/1471-2105-12-S1-S1-S40。 BMC生物信息学。2011 PMID:21342572 免费PMC文章。
  • 挖掘GO注释以提高注释一致性。
    Faria D、Schlicker A、Pesquita C、Bastos H、Ferreira AE、Albrecht M、Falcão AO。 Faria D等人。 公共科学图书馆一号。2012;7(7):e40519。doi:10.1371/journal.pone.0040519。Epub 2012年7月25日。 公共科学图书馆一号。2012 PMID:22848383 免费PMC文章。
  • 用于基因本体注释的基于关系的语义相似性度量。
    Sheehan B、Quigley A、Gaudin B、Dobson S。 Sheehan B等人。 BMC生物信息学。2008年11月4日;9:468. doi:10.1186/1471-2105-9-468。 BMC生物信息学。2008 PMID:18983678 免费PMC文章。
  • 基因本体注释和资源。
    基因本体联盟;Blake JA、Dolan M、Drabkin H、Hill DP、Li N、Sitnikov D、Bridges S、Burgess S、Buza T、McCarthy F、Peddenti D、Pillai L、Carbon S、Dietze H、Ireland A、Lewis SE、Mungall CJ、Gaudet P、Chrisholm RL、Fey P、Kibbe WA、Basu S、Siegele DA、McIntosh BK、Renfro DP、Zweifel AE、Hu JC、Brown NH、Tweedie S、Alam-Faruque Y、Apweiler R、Auchinchloss A、,Axelsen K、Bely B、Blatter M-、Bonilla C、Bouguerleret L、Boutet E、Breuza L、Bridge A、Chan WM、Chavali G、Coudert E、Dimmer E、Estreicher A、Famiglietti L、Feuermann M、Gos A、Gruaz-Gumowski N、Hieta R、Hinz C、Hulo C、Hutley R、James J、Jungo F、Keller G、Laiho K、Legge D、Lemercier P、Lieberherr D、Magrane M、Martin MJ、Masson P、,Mutowo-Muellenet P、O'Donovan C、Pedruzzi I、Pichler K、Poggioli D、Porras Milán P、Poux S、Rivoire C、Roechart B、Sawford T、Schneider M、Stutz A、Sundaram S、Tognolli M、Xenarios I、Foulgar R、Lomax J、Roncaglia P、Khodiyar VK、Lovering RC、Talmud PJ、Chibucos M、Giglio MG、Chang H-、Hunter S、McAnulla C、Mitchell A、Sangrador A、Stephan R、,Harris MA、Oliver SG、Rutherford K、Wood V、Bahler J、Lock A、Kersey PJ、McDowall DM、Staines DM、Dwinell M、Shimoyama M、Laulederkind S、Hayman T,… 完整作者列表参见摘要 基因本体联盟等。 《核酸研究》,2013年1月;41(数据库问题):D530-5。doi:10.1093/nar/gks1050。Epub 2012年11月17日。 2013年核酸研究。 PMID:23161678 免费PMC文章。
  • 稻瘟病菌的基因本体注释。
    Meng S、Brown DE、Ebbole DJ、Torto-Alalibo T、Oh YY、Deng J、Mitchell TK、Dean RA。 孟S等。 BMC微生物。2009年2月19日;9补充件1(补充件1):S8。doi:10.1186/1471-2180-9-S1-S8。 BMC微生物。2009 PMID:19278556 免费PMC文章。 审查。

引用人

  • 集成背景知识以自动检测基因本体标注中的不一致性。
    Chen J、Goudey B、Geard N、Verspoor K。 陈杰等。 生物信息学。2024年6月28日;40(补充1):i390-i400。doi:10.1093/bioinformatics/btae246。 生物信息学。2024 PMID:38940182 免费PMC文章。
  • 预测人类蛋白质-表型关联的计算方法:综述。
    刘磊、朱S。 刘磊等。 现象学。2021年8月6日;1(4):171-185. doi:10.1007/s43657-021-00019-w.电子收集2021年8月。 现象学。2021 PMID:36939789 免费PMC文章。 审查。
  • 蛋白质家族功能注释的路线图:社区视角。
    de Crécy-Lagard V、Amorin de Hegedus R、Arighi C、Babor J、Bateman A、Blaby I、Blaby Haas C、Bridge AJ、Burley SK、Cleveland S、Colwell LJ、Conesa A、Dallago C、Danchin A、de Waard A、Deutschbauer A、Dias R、Ding Y、Fang G、Friedberg I、Gerlt J、Goldford J、Gorelik M、Gyori BM、Henry C、Hutinet G、Jaroch M、Karp PD、Kondratova L、Lu Z、,Marchler-Bauer A、Martin MJ、McWhite C、Moghe GD、Monaghan P、Morgat A、Mungall CJ、Natale DA、Nelson WC、O'Donoghue S、Orengo C、O'Toole KH、Radivojac P、Reed C、Roberts RJ、Rodionov D、Rodioniova IA、Rudolf JD、Saleh L、Sheynkman G、Thibaud-Nissen F、Thomas PD、Uetz P、Vallenet D、Carter EW、Weigele PR、Wood V、Wood-Charlson EM、Xu J。 de Crécy Lagard V等人。 数据库(牛津)。2022年8月12日;2022:baac062。doi:10.1093/database/baac062。 数据库(牛津)。2022 PMID:35961013 免费PMC文章。
  • JaponicusDB:快速部署新兴模型物种的模型生物数据库。
    Rutherford KM、Harris MA、Olifenko S、Wood V。 卢瑟福KM等人。 遗传学。2022年4月4日;220(4):iab223。doi:10.1093/genetics/iyab223。 遗传学。2022 PMID:35380656 免费PMC文章。
  • PANTHER:让所有人都可以使用基因组规模的系统发育学。
    Thomas PD、Ebert D、Muruganujan A、Mushayahama T、Albou LP、Mi H。 Thomas PD等人。 蛋白质科学。2022年1月;31(1):8-22. doi:10.1002/pro.4218。Epub 2021年11月25日。 蛋白质科学。2022 PMID:34717010 免费PMC文章。 审查。

工具书类

    1. 基因本体联盟。基因本体:生物学统一的工具。自然遗传学。2000;25:25–9. doi:10.1038/75556。-内政部-项目管理咨询公司-公共医学
    1. Clark JI、Brooksbank C、Lomax J.这都是植物科学家的任务。植物生理学。2005;138(3):1268–79. doi:10.1104/pp.104.058529。-内政部-项目管理咨询公司-公共医学
    1. 哈伯德·TJP、阿肯·BL、比尔·K、芭蕾斯特·B、卡卡莫·M、陈·Y、克拉克·L、科茨·G、坎宁安·F、卡特斯·T、唐·T、戴尔·SC、菲茨杰拉德·S、费尔南德斯·巴内特·J、格拉芙·S、海德尔·S、哈蒙德·M、埃雷罗·J、霍兰德·R、豪·K、豪·K、约翰逊·N、卡哈里·A、基夫·D、科科科辛斯基·F、库莱沙·E、劳森·D、隆登一世、梅尔索普·C、梅吉·K、梅德尔·P、奥弗杜因·B、帕克·A,Prlic A、Rice S、Rios D、Schuster M、Sealy I、Severin J、Slater G、Smedley D、Spudich G、Trevanion S、Villela A、Vogel J、White S、Wood M、Cox T、Curwen V、Durbin R、Fernandez-Suarez XM、Flicek P、Kasprzyk A、Proctor G、Searle S、Smith J、Ureta-Vida A、Birney E.Ensembl。核酸研究2007;35:D610–D617。doi:10.1093/nar/gkl996。-内政部-项目管理咨询公司-公共医学
    1. 基因本体论联盟的参考基因组组。基因本体论的参考基因组项目:跨物种功能注释的统一框架。公共科学图书馆计算生物学。2009;5(7):e1000431。doi:10.1371/journal.pcbi.1000431。-内政部-项目管理咨询公司-公共医学
    1. Hunter S、Apweiler R、Attwood TK、Bairoch A、Bateman A、Binns D、Bork P、Das U、Daughty L、Duquenne L、Finn RD、Gough J、Haft D、Hulo N、Kahn D、Kelly E、Laugraud A、Letunic I、Lonsdale D、Lopez R、Madera M、Maslen J、McAnulla C、McDowall J、Mistry J、Mitchell A、Mulder N、Natale D、Orengo C、Quinn AF、Selengut JD、Sigrist CJA、Thimma M、,Thomas PD、Valentin F、Wilson D、Wu CH、Yeats C.InterPro。生物信息学。2009;37:D211–D215。-项目管理咨询公司-公共医学

出版物类型

LinkOut-更多资源