跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

Https系统

该站点是安全的。
这个https://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
.2021年1月8日;49(D1):D1020-D1028。
doi:10.1093/nar/gkaa1105。

RefSeq:通过蛋白质家族模型管理扩大原核基因组注释管道范围

附属公司

RefSeq:通过蛋白质家族模型管理扩大原核基因组注释管道范围

李文军等。 核酸研究. .

摘要

国家生物技术信息中心(NCBI)的参考序列(RefSeq)项目包含近20万个细菌和古生物基因组以及1.5亿个具有最新注释的蛋白质。自2018年以来,原核基因组注释管道(PGAP)的变化导致虚假注释大幅减少。PGAP使用的蛋白质家族模型(PFM)的层次集合作为结构和功能注释的证据,扩展到超过35000个蛋白质剖面隐马尔可夫模型(HMM)、12300个BlastRules和36000个策划的CDD架构。因此,现在有超过1.22亿个或79%的RefSeq蛋白是基于与策划的PFM的匹配而命名的。40%以上的PFM上都有基因符号、酶委员会编号或支持性出版物属性,并由其命名的蛋白质和特征遗传,有助于多基因组分析和与文献的联系。遵循公平原则(可查找、可访问、可互操作、可重用),任何用户都可以在蛋白质家族模型Entrez数据库中获得PFM。最后,参考和代表性基因组集是RefSeq原核基因组的一个分类多样的子集,现在可以定期重新计算,并可以使用BLAST进行下载和同源性搜索。RefSeq位于https://www.ncbi.nlm.nih.gov/refseq/。

PubMed免责声明

数字

图1。
图1。
TCDB衍生证据(NBR011040、NBR0110.41、NBR011042和NF038175)改进了三种蛋白质(分别为WP_003900124.1、WP_042507723.1、WP_003401747.1和WP_003401737.1)的注释iniBAC公司操纵子进入结核分枝杆菌CDC1551基因组(NC_002755.2:408694–414298)。新的证据是根据TCDB构建的,并用于命名RefSeq蛋白。
图2。
图2。
HMM NF033727.1的示例记录。(A类)模型定义的家族中包含的蛋白质的功能描述。(B)模型的属性和特征,包括传播到基于模型的PGAP命名的蛋白质产品的名称。(C类)配置文件和种子蛋白质的下载选项(D类)支持模型定义及其功能分配的出版物。(E类)被模型击中的RefSeq蛋白。(F类)一个选项卡列出了NF033727.1是最高优先级证据的点击(如图所示),另一个选项卡则列出了被模型点击但以更高优先级证据命名的蛋白质(未显示)。(G公司)左侧所选蛋白质的可能操作菜单。
图3。
图3。
以蛋白质家族模型命名的RefSeq非冗余蛋白质随时间增加:堆叠条(左轴上的值)表示HMM(橙色)、CDD架构(灰色)、BlastRules(黄色)或Blast hits命名的蛋白质与簇代表蛋白质(蓝色)的比例。蓝线(右轴上的值)表示原核RefSeq蛋白总数的增长
图4。
图4。
以HMM NF033727.1命名的非冗余RefSeq蛋白上的注释块示例。

类似文章

  • RefSeq和宏基因组时代的原核基因组注释管道。
    Haft DH、Badretdin A、Coulouris G、DiCuccio M、Durkin AS、Jovenitti E、Li W、Mersha M、O'Neill KR、Virothaisakun J、Thibaud-Nissen F。 Haft DH等人。 《核酸研究》2024年1月5日;52(D1):D762-D769。doi:10.1093/nar/gkad988。 核酸研究2024。 PMID:37962425 免费PMC文章。
  • 参考序列:原核生物基因组注释和管理的更新。
    Haft DH、DiCuccio M、Badretdin A、Brover V、Chetvernin V、O'Neill K、Li W、Chitsaz F、Derbyshire MK、Gonzales NR、Gwadz M、Lu F、Marchler GH、Song JS、Thanki N、Yamashita RA、Zheng C、Thibaud Nissen F、Geer LY、Marchler Bauer A、Pruitt KD。 Haft DH等人。 核酸研究2018年1月4日;46(D1):D851-D860。doi:10.1093/nar/gkx1068。 2018年核酸研究。 PMID:29112715 免费PMC文章。
  • NCBI的参考序列(RefSeq)数据库:当前状态、分类扩展和功能注释。
    O'Leary NA、Wright MW、Brister JR、Ciufo S、Haddad D、McVeigh R、Rajput B、Robbertse B、Smith-White B、Ako-Adjei D、Astashyn A、Badretdin A、Bao Y、Blinkova O、Brover V、Chetvernin V、Choi J、Cox E、Ermolaeva O、Farrell CM、Goldfarb T、Gupta T、Haft D、Hatcher E、Hlavina W、Joardar VS、Kodali VK、Li W、Maglott D、Masterson P、McGarvey KM、,Murphy MR、O'Neill K、Pujar S、Rangwala SH、Rausch D、Riddick LD、Schoch C、Shkeda A、Storz SS、Sun H、Thibaud-Nissen F、Tolstoy I、Tully RE、Vatsan AR、Wallin C、Webb D、Wu W、Landrum MJ、Kimchi A、Tatusova T、DiCuccio M、Kits P、Murphy-TD、Pruitt KD。 O'Leary NA等人。 核酸研究2016年1月4日;44(D1):D733-45。doi:10.1093/nar/gkv1189。Epub 2015年11月8日。 2016年核酸研究。 PMID:26553804 免费PMC文章。
  • 细菌和古生物基因组注释:提高准确性和一致性。
    Overbeek R、Bartels D、Vonstein V、Meyer F。 Overbeek R等人。 《化学评论》,2007年8月;107(8):3431-47. doi:10.1021/cr068308h。Epub 2007年7月21日。 《化学评论》,2007年。 PMID:17658903 审查。 没有可用的摘要。
  • 基因组注释的实验方法:本报告基于2004年7月19日至20日在华盛顿特区举行的由美国微生物学会主办的研讨会。
    [未列出作者] [未列出作者] 华盛顿(DC):美国微生物学会;2004 华盛顿(DC):美国微生物学会;2004 PMID:33001599 免费书籍和文件。 审查。

引用人

工具书类

    1. Tatusova T.、DiCuccio M.、Badretdin A.、Chetvernin V.、Nawrocki E.P.、Zaslavsky L.、Lomsadze A.、Pruitt K.D.、Borodovsky M.、Ostell J.NCBI原核基因组注释管道。2016年《核酸研究》;44:6614–6624.-项目管理咨询公司-公共医学
    1. Haft D.H.、DiCuccio M.、Badretdin A.、Brover V.、Chetvernin V.、O'Neill K.、Li W.、Chitsaz F.、Derbyshire M.K.、Gonzales N.R.等人。。参考序列:原核生物基因组注释和管理的更新。2018年核酸研究报告;46:D851–D860。-项目管理咨询公司-公共医学
    1. Saier M.H.Jr.、Reddy V.S.、Tsu B.V.、Ahmed M.S.、Li C.、Moreno-Hagelsieb G.《运输者分类数据库(TCDB):最新进展》。2016年《核酸研究》;44:D372–D379。-项目管理咨询公司-公共医学
    1. 刘斌、郑德、金秋、陈磊、杨杰。VFDB 2019:一个具有交互式web界面的比较病理学平台。2019年《核酸研究》;47:D687–D692。-项目管理咨询公司-公共医学
    1. Ciufo S.、Kannan S.、Sharma S.、Badretdin A.、Clark K.、Turner S.、Brover S.、Schoch C.L.、Kimchi A.、DiCuccio M.。使用平均核苷酸同一性改进NCBI原核生物基因组的分类分配。国际期刊系统。进化。微生物。2018; 68:2386–2392.-项目管理咨询公司-公共医学

出版物类型